マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250519
内容紹介
OpenAI の SWE Agent、Codex を試してみる、VoltAgent - Open Source TypeScript AI Agent Framework、LLM Agent 標準化/MCP/ライブラリ欲張り幕内弁当、子育てエンジニアに捧ぐ子どもを喜ばせるためのTips集
出演者
関連リンク
OpenAIが、ソフトウェア開発のタスクを自動化する新しいAIエージェント「Codex」のリサーチプレビューを公開しました。これは、プログラムを書いたり、デバッグしたりといったエンジニアの作業をAIが手伝ってくれるツールです。
Codexはクラウド上で動作し、安全な仮想環境(サンドボックス)の中でタスクを実行します。複数の作業を同時に進めることも可能です。現在はChatGPTのPro、Team、Enterpriseプランで利用でき、今後PlusやEduプランにも対応予定とのことです。
Codexには主に「codex-1」と、軽量版の「codex-mini-latest」というモデルがあります。タスクの完了には1分から30分程度かかり、AIがどのような手順で作業しているかをリアルタイムで見ることができます。
セキュリティにも配慮されており、悪意のあるコードの作成や不正な指示は拒否されます。また、タスク実行中は外部インターネットへのアクセスが無効になるよう設計されています。
CodexはGitHubとの連携機能も持ち、Web UIから直接プルリクエストを作成することも可能です。
筆者は実際にChatGPT Proを契約してCodexを試しており、Web UI版では簡単な指示でテトリスを完成させるなど、その便利さに期待を感じています。複数のタスクを並行で実行させたり、外出中にスマホから作業指示を出したりといった使い方の可能性にも触れています。
一方で、コマンドラインから使う「Codex CLI」と軽量モデル「codex-mini-latest」を試した際は、エラーが発生したり、応答が遅いと感じる場面もあったようです。Codex CLIではChatGPTアカウントでのサインインが可能になり、特定の有料プラン契約者はAPIクレジットがもらえるキャンペーンも実施されています(ただし有効期限や条件あり)。しかし、筆者はCodex CLIの軽量モデルについては現時点では少し課題があると感じているようです。
全体として、筆者はCodex本体(特にWeb UI版)には今後の可能性を感じており、引き続き使っていきたいと考えているようです。多様なAIサービスを展開するOpenAIの強みも改めて評価しています。
引用元: https://zenn.dev/schroneko/articles/introducing-codex
VoltAgentは、TypeScriptを使ってAI Agentを開発するためのオープンソースフレームワークです。AI Agentとは、AI(人工知能)に特定のタスクを自動で実行させるためのプログラムのようなものです。VoltAgentを利用することで、プログラミングの知識がなくても使えるノーコードツールの機能的な限界を超えたり、AI Agentをゼロから手作りする際に発生する大きな開発コストや複雑さを軽減できます。エンジニアは、自分のコードでAI Agentの振る舞いを完全に制御し、ビジネス要件に合わせて柔軟にカスタマイズ、そして様々なシステムと連携させることができます。開発者の使いやすさ(Developer Experience, DevEx)も重視されており、快適に開発を進められます。
このフレームワークの主な特徴をいくつかご紹介します。まず、「ツール呼び出し(Tool calling)」機能です。これにより、開発したAI Agentが外部のAPIやデータベース、他のサービスなどと連携し、情報を取得したり、特定の操作を実行したりといった具体的なアクションを取ることが可能になります。次に、「Unified API」機能は、OpenAIやその他の様々なAIモデルプロバイダーを、同じ統一された方法でコードから利用できるようにするものです。これにより、特定のAIモデルに依存せず、状況に応じて最適なモデルを選んだり切り替えたりすることが容易になります。
さらに、「動的プロンプト(Dynamic Prompting)」機能を使うと、AI Agentへの指示文であるプロンプトを柔軟に管理し、テストや調整を繰り返しながらAIの応答性能を改善していくことができます。「永続メモリ(Persistent Memory)」機能は、AI Agentが過去のユーザーとのやり取りや取得した情報を記憶しておき、会話の文脈を理解したり、以前の状況を踏まえた応答を生成したりするのに役立ちます。
VoltAgentは、これらの機能に加えて、40種類以上の外部アプリやサービスとの連携を容易にする仕組みを提供しています。また、「Observability(可観測性)」機能が充実しており、開発したAI Agentがどのように動作しているか、デバッグ情報や実行ログなどを詳細に確認できます。これにより、問題が発生した場合の原因特定や、AI Agentの挙動改善が効率的に行えます。デプロイ機能も用意されており、開発したAgentをすぐに利用開始できます。
これらの強力な機能を備えたVoltAgentは、個人開発から企業での大規模な利用(エンタープライズレベル)まで対応できる、堅牢で信頼性の高いAI Agentを構築するための包括的なツールキットと言えます。TypeScriptの経験がある新人エンジニアにとっては、AI Agentという新しい分野に挑戦し、その開発・運用プロセスを実践的に学ぶための優れたスタート地点となるでしょう。
引用元: https://voltagent.dev/
この記事は、2025年が「Agent元年」と呼ばれ、AI(人工知能)が私たちの代わりに様々な作業を行う「LLM Agent」の開発が急速に進んでいる中で、注目すべき3つの技術を紹介しています。まるで「幕の内弁当」のように、Agent開発に必要な様々な要素が詰まった情報源となっています。
特に大切なのは、Anthropicの「MCP」、OpenAIの「Agent SDK」、Googleの「A2A Protocol」という技術です。これらはAgentシステムを作る上で、それぞれ異なる役割を持っています。
まず「MCP (Model Component Protocol)」は、LLMがインターネット上のサービスやデータベースなどの「外部の道具(ツール)」を安全に使うための「共通のお約束事(プロトコル)」です。これがあれば、色々なツールがLLMから使いやすくなり、セキュリティも高まります。
次に「OpenAI Agent SDK」は、LLMを使ってAgentを簡単に作るための「開発キット」です。Agentに「何をすべきか」を指示したり、他のAgentに仕事を「お願いしたり(Handoffs)」、間違った指示がないか「チェックしたり(Guardrails)」する機能があります。Agentがどう動いたかを追跡できる機能(Tracing)も便利です。
そして「A2A Protocol (Agent2Agent)」は、異なる会社や仕組みで作られた複数のAgent同士が「お互いに理解し合って」コミュニケーションを取るための「共通の言葉」です。MCPがAgentとツールの連携を助けるのに対し、A2AはAgent同士が協力して、もっと複雑なタスクをこなせるようにするためのものです。
これらの技術が登場したことで、Agent開発のルールが整理され、Agent同士やAgentとツールがスムーズに連携できるようになることが期待されています。これにより、私たちはもっと便利で賢いAI Agentを使えるようになるかもしれません。Agent開発を始める新人エンジニアにとって、これらの技術の存在とそれぞれの役割を知っておくことは、これからの開発を理解する上でとても役立つでしょう。
引用元: https://zenn.dev/cha9ro/articles/2025_intro_to_agent_and_mcp
子育て中のエンジニア向けに、仕事中に子どもが部屋に来ても楽しく対応できるTipsを紹介。ターミナルで汽車や牛のアスキーアートを表示するコマンド(sl
, cowsay
など)や、VSCodeに動物を出す拡張機能などを解説します。仕事道具を遊びに変えて、お子さんとクスっと笑えるひとときを!色々なアイデアを試して反応を楽しめます。
引用元: https://zenn.dev/jy8752/articles/9257ef88fcbf0e
VOICEVOX:春日部つむぎ