株式会社ずんだもん技術室AI放送局 podcast 20250521
内容紹介
GitHub Copilot:新しいコーディングエージェント、Principles of Building AI Agents、Gemini 2.5: Our most intelligent models are getting even better、「猫ロボットで効率化だ!→採用も増えちゃいました」 ガストやしゃぶ葉で導入の配膳ロボット。運営会社も驚いた“意外な効果”を聞いた
出演者
関連リンク
GitHub Copilotに、開発タスクを自動でこなす新しい機能「コーディングエージェント」が登場しました。これは、GitHubに直接組み込まれたAIアシスタントのようなもので、特定の開発作業を任せることができます。
使い方は簡単です。GitHubのIssue(課題や要望などを管理するもの)に、このCopilotコーディングエージェントを割り当てるだけ。すると、エージェントはバックグラウンドで作業を開始します。具体的には、GitHub Actionsという仕組みを使って一時的な開発環境を作り、コードの分析や変更を行います。
エージェントが行った作業は、自動的にドラフトのプルリクエストとして提出されます。プルリクエストとは、コードの変更内容をチームメンバーに確認してもらうための機能です。ここが重要なポイントで、エージェントが勝手にコードを最終的に確定させるのではなく、必ず人間(あなたやチームメンバー)が変更内容を確認し、承認してからコードが取り込まれる仕組みになっています。既存のセキュリティルールもそのまま適用されるため、安心して使えます。
このエージェントは、機能追加やバグ修正、テストコードの作成、コードの整理(リファクタリング)、ドキュメントの改善など、比較的シンプルから中程度の複雑さのタスクを得意としています。
この機能の最大のメリットは、開発者が時間のかかる単調な作業をエージェントに任せられる点です。これにより、あなたはより創造的で、頭を使う必要のある難しい作業に集中できるようになります。ちょうど、自分専用のAIアシスタントが、コードを書く準備や簡単な修正を手伝ってくれるようなイメージです。
エージェントは、Issueの内容だけでなく、リポジトリのこれまでの変更履歴や議論、さらには画像(バグのスクリーンショットなど)も解析して作業を進めることができます。作業の進捗やエージェントがどう考えたかのログも確認できます。
このコーディングエージェントは、GitHub Copilot EnterpriseおよびCopilot Pro+の契約者が利用できます。
GitHub Copilotは、この新しいエージェント機能も含め、開発者がコードを書く際の集中力(フロー状態)を維持し、面倒な作業を減らし、開発をもっと楽しく、効率的にすることを目指しています。
これにより、日々のコーディング作業がどのように変わっていくか、ぜひ試してみてください。
引用元: https://github.blog/jp/2025-05-20-github-copilot-meet-the-new-coding-agent/
大規模言語モデル(LLM)の急速な進化により、「Agent(エージェント)」と呼ばれる新しいタイプのAIアプリケーションが注目されています。この「Principles of Building AI Agents」という書籍は、AI Agentをどう作っていくか、その基本原則を分かりやすく解説したものです。Web開発の経験豊富なベテランが、誇張や流行語を避け、本質的な内容に焦点を当てて書かれています。
この本を読むことで、AI Agent構築の全体像や、必要な技術要素の基礎を学ぶことができます。
まず、AI Agentがどのように構成されているか、その主要な「部品(building blocks)」について解説されています。これには、Agentに様々な機能を提供する「プロバイダー」、Agentの賢さの元となる「モデル(LLMなど)」、Agentに具体的な指示を与える「プロンプト」、Agentが外部のサービスやデータを利用するための「ツール(API連携など)」、そしてAgentが過去のやり取りや情報を覚えておくための「メモリ(短期記憶や長期記憶)」などが含まれます。これらの要素を適切に組み合わせることで、Agentはより高度で人間のような振る舞いをできるようになります。
次に、Agentに複雑な目標を達成させるための考え方として、「Agent的なワークフロー」によるタスクの分解方法が紹介されています。大きなタスクを細かなステップに分け、各ステップでAgentが思考し、行動を選択していくような流れを作ることで、より難しい課題にも対応できるようになります。
さらに、Agentが最新の情報や、学習データには含まれていない特定の知識(例えば、会社の内部資料や専門分野のデータ)を利用できるようにする重要な技術として、「RAG(Retrieval-Augmented Generation:検索拡張生成)」が解説されています。RAGを使うと、Agentは質問やタスクに関連する情報を外部の知識ベースから検索し、その検索結果を参考に回答を生成したり、次の行動を決定したりすることができます。これにより、Agentはより正確で、文脈に即した情報を提供できるようになります。
この書籍は、AI Agent開発の基礎となる構成要素や考え方を、実践的な視点から分かりやすく解説しており、これからAI Agent開発にチャレンジしたいと考えている新人エンジニアにとって、良い指針となるでしょう。
引用元: https://mastra.ai/book
Googleは、LLMモデルであるGemini 2.5 ProとGemini 2.5 Flashをさらに進化させたことを発表しました。
まず、上位モデルのGemini 2.5 Proは、特にコーディング分野での性能が向上し、「WebDev Arena」や「LMArena」といった評価指標でトップクラスの成績を収めています。さらに、教育に特化したLearnLMの技術を取り込むことで、学習支援においても優れた能力を発揮するようになりました。 特に注目すべき新機能として、実験的な「Deep Think」モードが導入されます。これはモデルが複雑な問題に対して、複数の可能性を考慮してより深く推論を行うことができる機能で、難しい数学問題やプログラミングコンテストレベルのコーディング問題で高い性能を示しています。
一方、高速・低コストが特徴のGemini 2.5 Flashも多くの面で改善されました。推論、マルチモーダル(テキスト以外のデータ理解)、コード生成、長い文章の処理能力が向上しつつ、さらに効率的になり、使用するトークン数を削減しています。
Gemini 2.5の全モデル(ProとFlash)に共通の新機能も追加されました。
- ネイティブオーディオ出力: より自然で感情豊かな音声での会話が可能になり、話すスタイルやトーンを調整したり、話者の感情を認識して応答したりできます。
- コンピュータ操作機能 (Project Mariner): モデルが直接コンピュータを操作する能力がGemini APIやVertex AIで利用できるようになります。
- セキュリティ強化: 特に、AIが参照するデータに悪意のある指示が埋め込まれる「間接的なプロンプトインジェクション」への対策が大幅に強化され、安全性が向上しています。
開発者体験も改善されています。
- Thought Summaries: モデルが応答を生成する際の思考プロセスを、分かりやすく整理された形式で確認できるようになり、モデルの振る舞いを理解しやすくなります。
- Thinking Budgets: モデルが思考に使うトークン数を制限できるようになり、応答速度やコストをより細かく制御できるようになります(Flashに加えてProでも利用可能に)。
- MCPサポート: オープンソースツールとの連携が容易になるよう、SDKでのサポートが追加されました。
これらのアップデートにより、Gemini 2.5モデルはより高性能に、より安全に、そして開発者にとってより使いやすいものとなっています。Gemini 2.5 Flashのアップデート版は既にプレビューとして利用可能で、Proと共に順次正式リリースされる予定です。
引用元: https://blog.google/technology/google-deepmind/google-gemini-updates-io-2025/
ガストなどで働く猫型配膳ロボット「ベラボット」は、人手不足解消や効率化のために導入されました。しかし驚くべきことに、単純作業をロボットが担うことで従業員の負担が減り、より接客に集中できるようになった結果、多様な人材の採用が増えるという意外な効果が生まれました。テクノロジーは、現場の働きやすさを向上させ、採用にもプラスの影響を与える可能性がある好事例と言えます。
引用元: https://toyokeizai.net/articles/-/877785?display=b
(株式会社ずんだもんは架空の登場組織です)