株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250707

2025年07月07日

MP3ファイルをダウンロード

内容紹介

Genspark、ノーコードAIエージェント「Super Agent」にGPT-4.1とOpenAI Realtime APIを搭載、Agentic coding革命が "成った" 世界で……、12 Factor Agents まとめ

出演者

春日部つむぎ
春日部つむぎ

関連リンク

  • Genspark、ノーコードAIエージェント「Super Agent」にGPT-4.1とOpenAI Realtime APIを搭載

    AI技術は日々進化しており、私たちエンジニアの仕事のやり方も大きく変わりつつあります。今回ご紹介するのは、AIスタートアップのGensparkが開発した画期的なAIエージェント「Super Agent」です。この「Super Agent」は、OpenAIの最新AIモデル「GPT-4.1」と、リアルタイムなやり取りを可能にする「OpenAI Realtime API」という、OpenAIの最先端技術を搭載して公開されました。

    「Super Agent」の最大の特徴は、その名の通り「ノーコード」、つまりプログラミングの知識がなくても誰でも簡単にAIを使いこなせる点です。文章で指示を出すだけで、AIが自律的に動いて、これまで人が手間をかけていた様々なタスクを自動で処理してくれます。例えば、情報収集、データの整理、レポート作成、さらには電話をかけるといった、一連の複雑な業務プロセス全体を、AIが連携して実行してくれるのです。これは、まるであなたの仕事をサポートしてくれる、非常に賢い「AIの代理人」を手に入れるようなものです。

    このAIエージェントの賢さの秘密は、裏側で9種類もの大規模言語モデル(LLM)と80種類以上のツールを組み合わせて利用していることにあります。AIは、指示されたタスクの内容に応じて、最適な大規模言語モデルやツールを自動的に選び出し、それらを連携させて処理を進めます。これにより、複雑な問題も効率的に解決できるよう設計されています。特に、中核を担う「GPT-4.1」は、非常に長い指示や膨大な量の情報を一度に理解し、記憶しながら作業を進めることができるため、多岐にわたるリサーチや、構造化された精度の高いアウトプットが期待できます。また、OpenAIの画像生成モデル「GPT-image-1」も利用されており、必要に応じて画像を生成する能力も持っています。

    具体的な活用例として紹介されているのが「Call For Me」機能です。これは、ユーザーに代わってAIが自動で電話をかけ、まるで人間が話すように会話を進めてくれるというものです。このように、「Super Agent」は単に情報を生成するだけでなく、現実世界での具体的な行動までAIが行う未来を見せてくれます。

    GensparkはOpenAIと密接に連携しており、OpenAIの専門家からベストプラクティス(一番良いやり方)やワークフローの調整、AIモデルの性能を最大限に引き出すためのアドバイスを受けてきたとのことです。この協力関係が、「Super Agent」の素早い開発とリリースに大きく貢献しています。

    このようなAIエージェントの進化は、私たちエンジニアが日常業務から解放され、より創造的で戦略的な仕事に集中できるようになる可能性を秘めています。新人エンジニアの皆さんにとっても、AI技術がどのように進化し、どのような新しいサービスを生み出しているのかを知る良い機会になるでしょう。’

引用元: https://codezine.jp/article/detail/21843

  • Agentic coding革命が “成った” 世界で……

    AI技術の進化により、ソフトウェア開発に大きな変化が訪れています。この記事では、「Agentic coding(エージェンティック・コーディング)」、特に「vibe coding(バイブ・コーディング)」と呼ばれる新しい開発スタイルについて解説しています。vibe codingとは、自然言語でAIの「コーディングエージェント」に指示を出し、それを使ってソフトウェアを開発していく方法のことです。

    筆者によると、この変化はすでに「革命」として実現しており、過去1ヶ月間では仕事で作成するコードの約8割がAIエージェントによるものだそうです。この割合は今後さらに増え、1年以内には9割を超えるだろうと予測されています。AIエージェントの活用によって、コードを「生産」するスピードがこれまでの数倍になり、これまで時間やコストの制約で「やらない」と判断されていたようなことも「やる」という選択肢が生まれるようになりました。これは、開発の「量」が「質」に転化するような大きな変化です。

    この革命により、ソフトウェアエンジニアに求められるスキルも大きく変わってきています。例えば、AIエージェントは大量のコードを書くのが得意なため、人間が読むための工夫(短いコードやマクロなど)よりも、すべてを明確に記述した「冗長でも明示的なコード」が「良いコード」と評価されるようになるでしょう。また、間違いを防ぎやすい「静的型付け言語」がより好まれ、最終的な動作確認(E2Eテスト)がしやすい設計も重要になります。

    最も重要な変化は、「設計」の役割が増すことです。これまではコードを書きながら全体の設計を考えることもありましたが、今後はAIエージェントに分かりやすく指示するための「設計書」を作成する能力が、エンジニアにとって非常に大切なスキルになります。また、AIエージェントの「マネジメント能力」も求められます。具体的には、AIへのタスクの割り振り、指示出し、そして生成された成果物の確認といった作業に、多くの時間が費やされるようになります。

    一方で、コーディング能力そのものが全く不要になるわけではない、と筆者は考えています。現状ではAIエージェントが書くコードの品質は人間より劣ることも多く、また、設計や指示に不足があった場合には、AIが生成したコードの内部を理解し、修正する能力が必要になります。少なくとも今後数年間は、こうしたスキルが求められ続けるだろうとのことです。

    筆者は、40代になって自分の仕事領域でこれほど劇的な変化が起きるとは予想していなかったと述べ、2023年にChatGPTのGPT-4が登場した時点ですら、わずか2年でここまでの革命が起きるとは思わなかったと、その変化の速さに驚きを示しています。ソフトウェアエンジニアの仕事は、これからも進化し続けるでしょう。’

引用元: https://gfx.hatenablog.com/entry/2025/07/06/182751

\n新人エンジニアの皆さん、こんにちは!AIエージェント開発に興味がある人も多いと思いますが、デモは動かせても、いざ本格的に使おうとすると「品質が安定しない」「デバッグが大変」といった壁にぶつかることがあります。この記事は、Herokuの「12
\ Factor App」というクラウドアプリ開発のベストプラクティスをAIエージェントに応用した「12 Factor Agents」という考え方を紹介しています。これは、信頼性の高いAIエージェントを開発するための12の設計原則で、特定のフレームワークに縛られず、既存のコードにも取り入れやすいのが特徴です。\n
\nなぜこの原則が必要なのでしょうか?それは、多くのAIエージェントフレームワークが「プロンプトを与えてツールをループさせる」というシンプルなモデルを推奨するものの、実際の開発現場では「エラー処理が難しい」「LLMに渡せる情報量(コンテキストウィンドウ)がすぐ足りなくなる」「人間の承認が必要なときに止められない」といった問題が起きるからです。現実のプロダクトでは、AIは「決定的なコード」の要所要所で賢く使われることが多いのです。\n
\nでは、「12 Factor Agents」の主要な原則をいくつか見ていきましょう。\n\n1. プロンプトを管理する (Own Your Prompts):\n
\ プロンプトはAIの指示書であり、コードと同じくらい重要です。フレームワークに隠されたプロンプトに頼らず、自分で管理し、バージョン管理して、しっかりテストしましょう。\n
\n2. コンテキストウィンドウを管理する (Own Your Context Window):\n LLMに渡せる情報量には限りがあります。会話履歴を全部渡すのではなく、本当に必要な情報だけを選び、XMLやJSONのような整理された形式で渡すことで、AIが正確に判断できるようになります。\n
\n3. ツールは単なる構造化出力 (Tools Are Just Structured Outputs):\n AIが「何をするか」は決めますが、その実行は「確実に動くコード」に任せます。AIには「こういう処理をしてほしい」という指示をJSON形式のような構造化されたデータで出力してもらい、それを受けてコードが実行する、という形が安定します。\n
\n4. 制御フローを管理する (Own Your Control Flow):\n AIに全てを自動実行させると、意図しない危険な操作につながることもあります。AIの動作を「確認が必要な質問」「安全な情報取得」「人間の承認が必要な高リスクな操作」などに分け、それぞれ適切な制御方法を適用し、安全性を高めましょう。\n
\n5. 小さく、集中したエージェント (Small, Focused Agents):\n 何でもできる「万能エージェント」を作ろうとすると、結局うまくいかないことが多いです。それよりも、特定のタスクに特化した「小さな専門家エージェント」を複数作ることで、管理しやすく、それぞれの性能も向上します。\n
\nこれらの原則は、AIエージェントをデモレベルから「実際にビジネスで使えるプロダクト」へと進化させるための大切なヒントになります。ぜひ、今後の開発に役立ててくださいね。”

引用元: https://iwashi.co/2025/07/06/12-factor-agents

VOICEVOX:春日部つむぎ