株式会社ずんだもん技術室AI放送局 podcast 20260219
内容紹介
GitHub Agentic Workflowsを発表 – リポジトリの自動化を実現、New in Agent Builder: all new agent chat, file uploads + tool registry、RAGで「ベクトル検索」が要る時、要らない時、"ビビる大木AI"を生放送で喋らせた全技術 — ラヴィット!裏側
出演者
youtube版(スライド付き)
関連リンク
GitHubは、AIエージェントを活用してリポジトリの管理・改善を自動化する新機能「GitHub Agentic Workflows」をテクニカルプレビューとして発表しました。これは、従来の手続き的なスクリプトでは自動化が難しかった「判断や文脈の理解を伴うタスク」を、自然言語(Markdown)による指示でAIに実行させる仕組みです。
GitHub Actionsの強力なインフラをベースにしつつ、複数のコーディングエージェント(GitHub Copilot, Claude, OpenAI等)を選択して組み込むことが可能です。GitHubはこの仕組みを、CI/CDを拡張し、AIが継続的にソフトウェア開発ライフサイクルを支える「Continuous AI(継続的AI)」という概念の実現に向けた一歩として位置づけています。
概要
GitHub Agentic Workflowsは、開発者が「望む結果」をMarkdownファイルに記述し、それをリポジトリに追加することで動作します。エージェントはリポジトリのコンテキストを読み取り、推論を行いながらタスクを遂行します。
主な活用領域として、以下のような「判断力」を必要とする繰り返しタスクが挙げられています。
- 継続的なトリアージ: 新規Issueの要約、適切なラベル付け、担当者へのルーティング。
- ドキュメントの維持: コードの変更を反映したREADMEやドキュメントの自動更新。
- コードの品質向上: CI失敗時の原因調査と修正案の提示、コードの簡素化やリファクタリング。
- テストの改善: カバレッジを分析し、必要性の高いテストケースを自動で追加。
安全性と制約
本機能は、エンタープライズ環境でも安心して利用できるよう、強力なガードレールと制御機構を備えています。
- 権限の最小化: ワークフローはデフォルトで「読み取り専用」権限で実行されます。コードの変更やコメントの投稿といった書き込み操作には、サニタイズされた出力を通じた明示的な承認設定が必要です。
- サンドボックス実行: エージェントは隔離された環境で実行され、使用可能なツールの制限やネットワークの分離によって、予期せぬ挙動や攻撃から保護されます。
- 人間による最終確認: 最も重要な点として、エージェントが作成したプルリクエストが「自動的にマージされることはありません」。常に人間がレビューし、承認するプロセスが組み込まれています。
新人エンジニアへのメッセージ
この機能は、エンジニアから仕事を奪うものではなく、リポジトリを「常に健康的で読みやすい状態」に保つための強力な助手です。Issueが整理され、ドキュメントが最新に保たれ、CIの失敗理由が解説される環境は、特にプロジェクトに参加したばかりのメンバーにとって大きな助けとなります。AIに任せられる定型外の雑務を自動化することで、エンジニアはよりクリエイティブな設計や実装に集中できるようになります。
引用元: https://github.blog/jp/2026-02-16-automate-repository-tasks-with-github-agentic-workflows/
LangChainが提供する、AIエージェント構築プラットフォーム「LangSmith Agent Builder」に大幅なアップデートが実施されました。今回の更新の核となるのは「エージェントを、まるで一緒に働くチームメイトのように身近な存在にする」というコンセプトです。
新人エンジニアの方にとっても、AIエージェントの活用の幅がぐっと広がる注目の新機能について解説します。
1. 万能な「チャット」エージェントの登場
これまでは、特定のタスク(例:メール送信専用、チケット管理専用など)ごとにエージェントを作成する必要がありました。しかし、新しい「Chat」エージェントは、ワークスペースに接続されている全てのツール(Slack、Gmail、Linearなど)にアクセス可能です。特定の用途を決めずに、「未完了のチケットを要約して」や「今日のサポート依頼をまとめて」といった指示を投げかけるだけで、エージェントが自ら適切なツールを選択し、実行プランを立てて処理してくれます。
2. 「会話」からエージェントを自動生成
今回のアップデートで最も画期的なのが、チャットでのやり取りをそのまま「繰り返し利用可能なエージェント」として保存できる機能です。 例えば、「今週のサポートチケットをまとめてSlackに送って」というタスクを会話形式で実行し、結果に満足したらボタン一つで専用エージェントに変換できます。複雑なプロンプトエンジニアリング(指示文の作成)や、高度な条件分岐のロジックを組む必要はありません。エージェントとの「対話」そのものが設定ファイルのような役割を果たします。
3. ファイルアップロードへの対応
CSV、画像、テキストファイルを直接チャットにアップロードできるようになりました。
- データ分析: 売上データのCSVを読み込ませ、トレンドを分析させて結果をSlackに報告する。
- 画像処理: ホワイトボードのメモを写真に撮ってアップロードし、Googleドキュメントに清書させる。
- リファレンス活用: 既存のスタイルガイドを読み込ませ、そのトーンに合わせた文章作成を行わせる。 といった、データに基づいたより高度なアクションが可能になります。
4. ツール管理の効率化
利用可能なツールや、外部システムと連携するためのMCP(Model Context Protocol)サーバーを一つのレジストリで管理できるようになりました。管理者がツールを統制できるため、セキュリティやガバナンスを保ちつつ、エンジニアが安全にエージェントを構築・運用できる環境が整っています。
まとめ
今回のアップデートにより、AIエージェントは「一から開発するもの」から「会話を通じて育て、日常の業務を任せるパートナー」へと進化しました。開発効率を大幅に向上させ、実用的なAIアシスタントを即座に生み出せる環境は、LLMを活用するエンジニアにとって非常に強力な武器になるでしょう。
引用元: https://blog.langchain.com/new-in-agent-builder-all-new-agent-chat-file-uploads-tool-registry/
本記事は、RAG(検索拡張生成)において主流となっている「ベクトル検索」をあえて使わず、キーワード検索のみで同等の性能を目指す「Agentic Keyword Search」という手法と、その使い分けについて解説したものです。AWSの研究者らによる論文(AAAI 2026採択)をベースにしており、エンジニアが実務でRAGを設計する際の重要な視点を提供しています。
1. 「ベクトル検索なし」のRAGとは
従来のRAGでは、文書を「ベクトル(数値の列)」に変換してデータベースに保存し、質問と意味が近い情報を検索します。しかし、この方法には「運用コストが高い」という課題があります。
- 文書の追加・更新のたびにベクトル化が必要
- 大規模な組織では、部署ごとの閲覧権限管理が複雑になる
- 特有の固有名詞や数値の検索に弱い場合がある
そこで提案されたのが、LLMエージェントにOS標準の検索コマンド(grepやpdfgrepなど)を使わせ、ドキュメントを直接「キーワード検索」させる手法です。
2. 手法の仕組み
「Agentic Keyword Search」では、事前のベクトル化は不要です。ドキュメントをフォルダに置いておくだけで、以下の手順で回答を生成します。
- メタデータの確認: エージェントがファイル名やページ数を確認し、関連しそうなファイルに当たりをつける。
- 反復的な検索: コマンドラインツールを使い、キーワード検索を実行。結果を見て検索クエリを調整したり、正規表現を使ったりして深掘りする。
- 回答生成: 十分な情報が集まった段階で、最終的な回答をまとめる。
3. 実験結果と性能
6つのデータセットを用いた実験では、従来のベクトル検索を用いたRAGに対し、回答の正確性などで90%以上の性能を達成しました。特に専門用語や数値が重要なドキュメントでは高い効果を発揮します。ただし、抽象的な文章(「著者の主張は?」など)では、意味の近さを捉えるベクトル検索に一歩譲る結果となっています。
4. エンジニアが知っておくべき「使い分け」
記事では、両手法の特性を踏まえた設計指針を以下のようにまとめています。
【ベクトル検索が不要(キーワード検索が向く)ケース】
- ドキュメントが頻繁に更新され、都度のベクトル再作成が困難な場合
- 専門用語、製品番号、固有名詞など、キーワードがはっきりしている場合
- 厳密な権限管理が必要なファイルをそのまま扱いたい場合
【ベクトル検索が必要なケース】
- 「表記ゆれ」に対応する必要がある場合(例:LLMと大規模言語モデル)
- 抽象的な質問や、文脈的なニュアンスの理解が求められる場合
- 回答スピードが最優先される場合(エージェントの反復検索は時間がかかるため)
結論
「RAG=ベクトルDB」と決め打ちするのではなく、扱うデータの性質や更新頻度、ユーザーの質問傾向に合わせて、キーワード検索ベースのエージェント手法も選択肢に入れることが、筋の良いシステム設計に繋がります。新人エンジニアの方は、まずはこの「意味検索(ベクトル)」と「文字検索(キーワード)」の得意・不得意を理解することから始めると、RAGへの理解がより深まるでしょう。
引用元: https://zenn.dev/knowledgesense/articles/b01609ba4f8d96
TBSの生放送「ラヴィット!」にて、AI版ビビる大木をわずか2日間で開発した技術解説です。初回発話2.5秒の低遅延を実現するため、LLMのストリーミング出力を文単位で並列TTS処理するパイプラインを構築。日本語の助数詞や多音字の誤読対策、Blender MCPを活用した3Dモデル制作、シェーダーによるリップシンクなど、AI駆動開発で短期間に安定した演出基盤を作り上げた創意工夫が凝縮されています。
引用元: https://zenn.dev/t_honda/articles/loveit-ai-voice-pipeline
(株式会社ずんだもんは架空の登場組織です)