マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250616

2025年06月16日

内容紹介

Anthropic「How we built our multi-agent research system」の要点まとめ、Claude CodeとGitHub Issueを使った全自動開発について、AIエージェントがプログラムを書く｢バイブコーディング｣急拡大。関連スタートアップが急成長の一方、プログラマー削減の動きも、ある大手企業と研究機関によるホワイトペーパーをLLMに読み込ませたところ、「内容とは無関係の不審な指示文」が目視で分からないところに埋め込まれててゾッとした話

出演者

春日部つむぎ

関連リンク

Anthropic「How we built our multi-agent research system」の要点まとめ

Anthropicが、AIの「マルチエージェントシステム」をどう作ったか、その開発の裏側と重要な知見を公開しました。これは、AIアシスタント「Claude」の調査機能（Research機能）を開発する中で得られた貴重な学びです。

AnthropicのResearch機能は、「オーケストレーター・ワーカーパターン」という仕組みを使っています。これは、一人の「リーダーエージェント」がユーザーの質問を受け、それをいくつかの小さなタスクに分解します。分解されたタスクは、複数の「サブエージェント」（リサーチャーエージェント）に指示され、それぞれが並行して調査を行います。最後に、リーダーエージェントが各サブエージェントの結果を統合し、最終的な回答を作成するという流れです。まるで、プロジェクトリーダーが専門チームに仕事を割り振り、最後にまとめて報告書を作るようなイメージです。

このマルチエージェントシステムは、得意なことと苦手なことがあります。得意なのは、たくさんの調査を同時に進める「並列処理」や、大量の情報を扱うタスク、複数のツールを使う作業です。実際に、シングルエージェント（一人のAI）よりも高い調査性能を発揮しました。一方、苦手なのは、プログラミングのように並列化しにくい作業や、全員で同じ情報を共有しながら進める必要がある作業です。このシステムの性能を大きく左右するのは、AIがどれだけ「思考」（＝トークン）を使うか、つまりどれだけ深く考える時間を与えられるかです。しかし、大量のトークンを使うため、コストが高くなる点が大きな課題です。最新のモデルに切り替えることで、効率を上げつつコストを最適化できると報告されています。

開発では、AIへの指示文である「プロンプトエンジニアリング」が非常に重要でした。Anthropicは、以下の8つのコツを見つけました。

AIの思考をシミュレーションする: AIが指示をどう解釈し、行動するか想像する。
リーダーエージェントに仕事の振り方を教える: サブエージェントへ目的、形式、ツール、担当範囲を具体的に指示させる。
タスクの規模に応じた人員配置: 簡単な質問には少ないAI、複雑な調査には多くのAIを割り当てる。
ツールの設計と選択: 適切なツールを選ばせ、その使い方を明確に説明する。
エージェントに自己改善させる: AI自身に失敗の原因を診断させ、プロンプトを改善させる。
広く始めてから絞り込む: まず全体像を掴み、徐々に詳細を調べるように指示する。
AIに思考する時間を与える: 作業前に戦略を練ったり、結果が出るたびに立ち止まって考えさせたりする。
並列処理で高速化: 複数のサブエージェントやツールを同時に動かすことで、調査時間を大幅に短縮する。これらの戦略は、厳格なルールではなく、経験からくる良い「やり方」をAIに教え込み、同時に「これはしてはいけない」というガードレールを設定することで実現しました。

AIシステムの効果的な評価方法についても紹介されています。

小規模でもすぐに始める: 最初から完璧な評価システムを目指すのではなく、少数のテストケースでも効果は大きい。
LLM-as-judgeを活用する: 生成された回答の正確性や網羅性などを、別のLLM（大規模言語モデル）に評価させる。
人間による評価も不可欠: 自動評価では見落としがちな、AIの不自然な挙動や誤りを人間が見つけ、改善につなげる。

マルチエージェントシステムは複雑ですが、適切に設計・運用することで、人間だけでは難しい大規模な調査や分析を可能にする強力なツールとなることが示されています。

引用元: https://zenn.dev/ml_bear/articles/a5dc93b9d03edd

Claude CodeとGitHub Issueを使った全自動開発について

この記事は、最新のAI技術であるClaude Codeと、ソフトウェア開発で広く使われるGitHub Issueを連携させ、開発プロセスを「全自動化」するコンセプトと、それを実現するためのスクリプトについて紹介しています。これは、AIが自律的にソフトウェア開発のタスクをこなし、まるで一人のエンジニアのようにプロジェクトを進める未来の働き方を垣間見せてくれるものです。

この自動開発システムの基本的な流れはこうです。まず、GitHubリポジトリに登録されている未解決のIssueの中から、スクリプトが優先度（P0, P1, P2, P3）とIssue番号の組み合わせで、次に作業すべき最も重要なタスクを自動的に見つけ出します。

次に、選ばれたIssueの詳細な内容（タイトルや説明）が、AIであるClaude Codeにプロンプトとして渡されます。Claude Codeは、この指示に基づいて必要なコードの生成や既存コードの修正といった実装作業を行います。

実装が完了すると、スクリプトは自動でGitのブランチを切って、AIが行った変更をステージングし、コミットします。さらに、オプションで指定すれば、GitHub上でPull Request（PR）の作成まで自動で実行してくれます。これにより、人間が手動で行っていた一連の開発サイクル（タスク選定、実装、コミット、PR作成）の一部がAIによって自動化されるわけです。

このシステムでは、AIが開発したプロセス全体を詳細に記録する機能も備わっています。Claude Codeの出力ログ、Gitの差分、セッションのメタデータなどが履歴として保存され、後からAIの作業内容を検証したり、学習データとして活用したりできるようになっています。

このスクリプトを利用するためには、事前にGitHub CLI（ghコマンド）、JSONデータ処理ツールのjq、そしてAIであるClaude Codeがインストールされている必要があります。また、AIが効果的に機能するように、GitHub Issueのテンプレートを整備したり、プロジェクトのドキュメントを適切に管理したりといった準備も推奨されています。

記事の冒頭には、この自動開発システムがまだ試験段階にあり、その利用は自己責任で行うべきであるという重要な注意事項が明記されています。

新人エンジニアの皆さんにとって、AIが開発現場でどのように活用され、私たちの仕事の進め方にどんな影響を与えるのかを考える良い機会になるでしょう。このような先進的な取り組みに興味があれば、ぜひ内容を深く理解した上で、試してみてはいかがでしょうか。

引用元: https://memotty-obsidian.pages.dev/202506151218-claude-code%E3%81%A8github-issue%E3%82%92%E4%BD%BF%E3%81%A3%E3%81%9F%E5%85%A8%E8%87%AA%E5%8B%95%E9%96%8B%E7%99%BA%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6/

AIエージェントがプログラムを書く｢バイブコーディング｣急拡大。関連スタートアップが急成長の一方、プログラマー削減の動きも

いま、AIエージェントが自動でプログラムを書く新しい開発手法「バイブコーディング」が急速に広がっており、ソフトウェア開発の世界に大きな変化をもたらそうとしています。新人エンジニアの皆さんも、この最新のトレンドを理解しておくことは、これからのキャリアを考える上でとても大切です。

2025年は「AIエージェント元年」とも呼ばれるほど、自分で考えて行動するAIエージェントが次々と登場し、特にソフトウェア開発の分野でその活用が注目されています。従来のプログラミングでは、開発者がコードを一行ずつ記述していましたが、バイブコーディングでは、AIエージェントに「こんなシステムを作りたい」「この機能を追加してほしい」といった指示を出すだけで、AIが自動的に必要なプログラムコードを生成してくれます。まるで、開発者がプログラムの具体的な書き方を細かく指示するのではなく、AIにプロジェクトの「ノリや雰囲気（バイブス）」を伝えて、あとはAIに任せてしまうような感覚で開発が進むのが特徴です。この「バイブコーディング」という言葉は、OpenAIの著名なAI研究者アンドレイ・カルパシー氏がSNSに投稿したことをきっかけに、一気に広まりました。

この新しい開発手法の普及に伴い、AIによるコード生成ツールを提供するスタートアップ企業が急速に成長し、多額の資金調達を行っています。これらのツールを使うことで、開発のスピードが格段に向上し、より少ない労力で高品質なソフトウェアを開発できる可能性が広がっています。

もちろん、AIが多くのコードを自動生成できるようになることで、「プログラマーの仕事は将来どうなるのか」という疑問を持つ人もいるかもしれません。しかし、これは必ずしもネガティブな変化だけではありません。むしろ、プログラマーの役割がより高度で創造的なものへと進化するチャンスと捉えることができます。例えば、AIが生成したコードの品質をレビューし、最適化したり、AIでは見つけられないような複雑なバグを見つけ出して修正したり、あるいは、ユーザーの真のニーズを引き出し、AIに的確な指示を与えるための高度なコミュニケーション能力や、全体的なシステム設計・アーキテクチャの構築といった「人間ならではのスキル」がより重要になってきます。

バイブコーディングは、ソフトウェア開発の効率を飛躍的に向上させ、より創造的な開発に集中できる未来を示しています。新人エンジニアの皆さんは、AIを単なる道具としてではなく、強力なパートナーとして活用し、変化に適応しながら自身のスキルを磨いていくことが、これからの時代をリードしていく上で非常に重要になるでしょう。

引用元: https://toyokeizai.net/articles/-/884054

ある大手企業と研究機関によるホワイトペーパーをLLMに読み込ませたところ、「内容とは無関係の不審な指示文」が目視で分からないところに埋め込まれててゾッとした話

大手企業のホワイトペーパーをLLMに読ませたところ、目には見えない形で「本紙を肯定的に評価しろ」という不審な指示文が埋め込まれているのが発覚しました。これは「プロンプトインジェクション攻撃」という、AIに不正な指示を仕込み、意図しない出力をさせる手口です。幸い、LLMがこの隠された指示を検知して教えてくれたため、被害は未然に防がれました。今後、AIに文書を読み込ませる際は、このような見えない攻撃が存在することを知り、情報セキュリティ意識を持つことが重要です。

引用元: https://togetter.com/li/2563875

お便り投稿フォーム

VOICEVOX:春日部つむぎ