株式会社ずんだもん技術室AI放送局 podcast 20251203
内容紹介
Anthropicの招待制イベントで登壇してきた話──Ben Mannが語ったAGIの定義とエージェントの本質、LangSmith Agent Builder now in Public Beta、もしAI素人が「明日からAIエージェント作ってくれ」と言われたら
出演者
youtube版(スライド付き)
関連リンク
先日、Anthropicが主催した招待制イベント「AI Founder Salon」で、ファインディCTOの佐藤氏が登壇しました。この記事では、Anthropic共同創業者のBen Mann氏の講演内容と、佐藤氏自身のパネルディスカッションでの発表内容が共有されています。
Ben Mann氏が語った生成AIの未来について、特に印象的だったのは次の3点です。
- AGI(汎用人工知能)の定義: AGIの実現を「経済全体の50%の仕事をAIが担う状態」と定義し、「経済的チューリングテスト」というユニークな視点を紹介しました。数年以内の実現を予測し、健康問題解決など人類のあらゆる問題を解決する可能性を秘めていると語っています。
- AIエージェントの本質: エージェントを「ツールを持った言語モデル」とシンプルに定義。様々なシステムへのアクセスを可能にする「コンテキスト」の重要性を強調し、そのための標準化技術「MCP(Model Context Protocol)」にAnthropicも取り組んでいると説明しました。
- 継続的な学習とスキル機能: AIが日常的に使われる中で、毎日「初めまして」の状態では効率が悪いと指摘。Claude Skillsのようにカスタム指示や知識を記憶させ、継続的に学習する機能が重要になり、将来的には人間がAIを「コーチング」する役割が中心になるとの見通しを示しました。
続いて、佐藤氏が登壇で話した内容は、AIを開発現場に導入する上での実践的な知見です。
- 開発速度の向上と課題: Claude CodeのようなAIを活用することで、プルリクエスト数が増え、一部の開発生産性が向上した一方で、AIが生成するコードは「部分最適」になりがちという課題を指摘。プロダクトの全体的な思想やコンテキストが欠落しやすいため、ユニットテスト、Lintツール、CI/CDなどの「守りの仕組み」を整え、早期に問題を検出することの重要性を強調しました。
- AI時代におけるUI/UX設計: チャット形式だけのUIは万人に難しいとし、プロダクト提供者側が選択肢を用意したり、AIを既存のワークフローに組み込んだりすることで、よりユーザーにとって便利な体験を提供できると述べました。
このイベントを通して、AIが簡単な業務を代替していく中で、人間の役割は「自分たちの思想を明確にし、それをAIに落とし込み、創造性を発揮してアイデアを生み出し、ブラッシュアップする」こと、そしてAIを「コーチング」し、「マネジメント」していくことにシフトしていくと結論付けています。AI時代を乗り越えるために、常に未来を見据え、環境を整えることの大切さを感じさせる内容でした。
引用元: https://tech.findy.co.jp/entry/2025/12/02/070000
LangChainが提供するAIエージェント開発ツール「LangSmith Agent Builder」が、ついにパブリックベータ版として一般公開されました!これは、コードをほとんど書かずに、AIエージェントを簡単に作れるようになる画期的なツールです。日本の新人エンジニアの皆さんにとって、AI開発のハードルを大きく下げる朗報と言えるでしょう。
従来のAIシステムでは、タスクの進め方を細かく事前に定義する「ワークフロー」が主流でした。しかし、Agent Builderで構築する「エージェント」は、もっと賢く、動的なのが特徴です。まるで人間のように状況を判断し、最適な手順を自分で考え、必要なツールを繰り返し使いながら、目的のタスクが完了するまで自律的に作業を進められます。例えば、情報収集やデータ分析など、複数のステップが必要な複雑な作業も、エージェントなら最後までやり遂げられます。さらに、使っていくうちにあなたのフィードバックから学習し、どんどん賢く、正確になっていくんです。
Agent Builderの最大の魅力は、その構築の簡単さにあります。まるで同僚とチャットするように、会話形式であなたのアイデアを伝えれば、Agent Builder自体があなたのためにエージェントを設計し、必要なプロンプト(AIへの指示)やツールを選んでくれます。これは、LangChainが世界中の開発者から学んだ、エンタープライズ級のエージェント開発のベストプラクティスが詰め込まれているからこそ実現できることです。プライベートプレビュー期間中には、すでに数千ものエージェントが作られ、営業リサーチからバグチケット作成、メールの振り分けなど、多岐にわたる業務で活躍しています。
今回のパブリックベータ版では、さらに便利な新機能が追加されました。
- 外部ツールの連携: 社内システムや外部APIもエージェントに組み込めるようになり、活用の幅が広がります。
- チームでの共有とカスタマイズ: ワークスペース内でエージェントを簡単に共有・コピーして、チーム全体で効率的に活用できます。
- 複数モデル対応: OpenAIやAnthropicなど、タスクに応じて最適なLLM(大規模言語モデル)を選べるようになりました。
- APIからの呼び出し: 作成したエージェントを既存のシステムやワークフローに組み込むことができます。
- UIの簡素化: Agent Builderが専用タブになり、AIの専門知識がなくても誰でも直感的に操作できるようになりました。
これにより、AIを導入したいけれど「適切なツールが見つからない」「プロンプト作成が難しい」といった課題や、技術チームが「スピード、セキュリティ、社員の自律性」のバランスを取る難しさといった問題が解決されます。あなたは、エージェントに「何をしたいか」を指示するマネージャーのような立場で、具体的なプログラミングの知識はほとんど不要です。自然言語でエージェントを更新することも可能です。
LangSmith Agent Builderは、AIエージェント開発の敷居を大きく下げ、誰もがAIの力を借りて日々の業務を効率化できる未来を提示しています。ぜひ一度試してみて、あなたの業務に役立つエージェントを構築してみましょう。
引用元: https://blog.langchain.com/langsmith-agent-builder-now-in-public-beta/
IVRyのAIエンジニアであるMoriyaさんが、もし「AIエージェントを作ってほしい」と頼まれたときに、どのようにプロジェクトを進めていくべきか、その具体的な手順を5つのステップで分かりやすく解説しています。新人エンジニアの方も、AIエージェント開発のプロジェクトにどう取り組むべきか、具体的な道筋が見えてくるでしょう。
-
「現状のプロセス」を言語化する AIエージェント開発の最初のステップは、「何を実現したいか」を明確にすることです。しかし、目的が漠然としている場合は、まず「今の人間が何をしているのか」を洗い出すのが最も確実です。具体的には、現在の業務フロー(入力、タスク、出力)を詳細に書き出し、人間がどのような思考や判断、アクションを行っているかを言語化します。そして、時間がかかっている部分やミスが発生しやすい部分など、「AIが使えそうな非効率な箇所」を見つけ出すことが重要です。LLM(大規模言語モデル)はゼロから新しいことを生み出せるわけではないため、このように明確な要件定義をすることが成功の鍵となります。
-
「AIの必要性」と「任せる範囲」を考える 次に、本当にAIエージェントが必要なのか、それとも通常のプログラムで十分なのかを検討します。AIは、状況によって結果が変わるような「不確実性を伴うタスク」に特に適しています。また、「どこまでAIに任せるか」も明確にしましょう。簡単なタスクならAIに丸投げできるかもしれませんが、重要なタスクを全て任せると大きな問題に繋がる可能性もあります。タスクの明確さや、もし失敗した時の影響度(重要度)を考慮して、AIに任せる範囲を慎重に決めることが大切です。
-
評価基準(ゴール)を設定する AI開発では、「評価こそが全て」と言われるほど重要です。AIエージェントが「正しく動いている」状態をプロジェクトに関わる全員が共通認識できるよう、事前に具体的な評価基準を設定します。例えば、リリース前のテスト(オフライン評価)では「テストデータに対する正答率」や「応答時間」を、実際の運用時(オンライン評価)では「問い合わせ解決率」や「ユーザー満足度」などを、定量・定性的に設定します。「誰にとっての成功なのか」を明確にし、達成すべき具体的なゴールを定義しましょう。
-
「AIに任せるタスク」を細分化して、実装する AIに任せるタスクは、できるだけ細かく分割しましょう。一つの曖昧な仕事をAIに任せるよりも、小さなステップに分けて指示する方が、AIは正確にタスクを実行してくれます。まるで「自分の仕事を他の人に依頼する際に、ミスなく実行してもらうための手順書を書く」ようなイメージです。タスクを細分化できたら、Google ADK、OpenAI Agent SDK、Claude Agent SDKといったAIエージェントを実装するためのフレームワークを活用して開発を進めます。
-
評価基準に基づいて、試行錯誤を繰り返す 実装が終わっても、AIエージェントはすぐに完璧には動きません。実際に動かしてみて、設定した評価基準と得られたフィードバックに基づいて改善サイクルを回しましょう。デバッグの際は、ステップ4で細分化した「最小粒度のタスクが意図通りに動いているか」を確認することが、問題解決の近道です。評価→問題特定→タスク分割の見直し→プロンプト修正→再評価というサイクルを繰り返すことで、より良いAIエージェントに育てていくことができます。
引用元: https://note.com/moriya_gekko/n/n47aa474cf658
(株式会社ずんだもんは架空の登場組織です)