株式会社ずんだもん技術室AI放送局 podcast 20260430
内容紹介
Remote agents in Vibe. Powered by Mistral Medium 3.5.、97%のPermission確認を自動化するCoding Agent用OSS「ccgate」が誕生した、AIエージェント時代のWeb〜いま、第二のレスポンシブ設計が始まっている、夫が陣取り系のアプリゲームにハマってて昼夜問わずゲームをしたり軍略会議をしており...「最近はチーム内に人事部や総務部もある」と言っていて驚いた
出演者
youtube版(スライド付き)
関連リンク
フランスのAI企業Mistral AIが、新たなフラグシップモデル「Mistral Medium 3.5」と、それを用いた強力なAIエージェント機能のリリースを発表しました。新人エンジニアの方にとっても、開発ワークフローを劇的に効率化できる可能性を秘めた注目のアップデートです。要点は以下の3点です。
1. 新世代モデル「Mistral Medium 3.5」の性能
Mistral Medium 3.5は、128B(1280億パラメータ)のサイズを持つ高密度なモデルです。コーディング、推論、指示遂行の能力が1つのモデルに統合されており、256kの長いコンテキスト(一度に読み込める情報量)を扱えます。
- 高い実績: ソフトウェア開発能力を測るSWE-Bench Verifiedで77.6%を記録し、競合他社の巨大モデルを凌ぐ性能を示しています。
- オープンな展開: 修正MITライセンスによるオープンウェイトとして公開されており、4枚のGPUがあれば自前でのホスト(セルフホスティング)も可能です。
2. 「Vibe」によるクラウド型コーディングエージェント
これまでローカル環境に縛られがちだったコーディングAIが、クラウド上で非同期に動作するようになりました。
- 並列実行と自動化: CLI(コマンドライン)やウェブ画面から依頼を投げれば、AIがクラウド上で勝手に作業を進めてくれます。完了するとプルリクエストの作成まで行い、通知してくれます。
- テレポート機能: 自分のPC(ローカル)で始めた作業を、そのままの状態を維持してクラウドへ「転送」し、続きを任せるといった柔軟な使い方が可能です。
- 外部連携: GitHubだけでなく、JiraやSlack、Sentryといったエンジニアが普段使うツールと連携し、バグ修正やテスト生成、依存関係の更新などを自動で行います。
3. Le Chatの「Work mode」
対話型AIサービス「Le Chat」に、複雑なタスクを完遂するための「Work mode」が追加されました。これは、AIが「自分で考え、複数のツールを使い分け、試行錯誤しながらゴールを目指す」モードです。
- マルチステップ実行: リサーチ、メールやカレンダーの整理、ドキュメント作成などを、複数の手順を追って自律的に実行します。
- 透明性と安全性: AIの思考プロセスやツールの呼び出し内容はすべて可視化されます。また、メッセージ送信などの重要なアクションの前には必ずユーザーに承認を求める仕組みになっています。
今回の発表により、エンジニアは「AIが1つずつコードを書くのを待つ」必要がなくなり、複数のタスクをAIエージェントに並列で任せ、人間は最終的なレビューや設計判断に集中できる環境が整いつつあります。
引用元: https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5
近年、エンジニアの間では「Claude Code」や「Codex CLI」といった、AIが自律的にコードを書き、ターミナルでコマンドを実行する「Coding Agent(コーディング・エージェント)」の活用が急速に広がっています。非常に便利な一方で、ファイル編集やコマンド実行のたびに人間へ「実行しても良いですか?」という許可(Permission)を求めてくるため、その確認待ちで作業が止まってしまうことが大きな悩みでした。かといって、全ての確認をスキップする設定にするのは、誤操作による環境破壊やセキュリティのリスクから現実的ではありません。
この「安全性」と「利便性」のジレンマを解消するために開発されたOSSが「ccgate」です。ccgateは、エージェントがコマンドを実行する直前に割り込み、その操作の妥当性を「別の軽量なAI(Claude Haikuなど)」に判断させるゲートキーパー(門番)のような役割を果たします。
ccgateの仕組みは非常にシンプルで、判定結果を以下の3つに分類します。
- allow(許可): プロジェクト内のファイル読み取りやテスト実行など、安全な操作を自動で通します。
- deny(拒否): 危険なコマンドや、プロジェクトのルール(例:独自スクリプトではなくnpm scriptsを使うべき等)に反する操作を、理由を添えて拒否します。
- fallthrough(人間に委ねる): データベースの削除など、AIでも判断が難しい重要な操作は、従来通り人間に確認を戻します。
このツールの優れた点は、単に自動化するだけでなく、拒否した際に「なぜダメなのか」「代わりにどうすべきか」というフィードバックをエージェントに返せることです。これにより、エージェントは自らミスを修正して正しい手順で再試行できるようになります。著者の実績では、一日の確認作業のうち約97%を自動化することに成功しており、集中力を削ぐ「許可ボタンのクリック」からエンジニアを解放してくれます。
なお、本ツールを利用する上での制約や注意点もあります。
- 完全な安全装置ではない: AIによる判定であるため誤判定の可能性はゼロではありません。重要なセキュリティ境界は、サンドボックス化などの別手法で守る必要があります。
- APIコスト: 判定のたびにAI(Anthropic API等)を呼び出すため、わずかながら利用料金が発生します。
- 環境の依存: 現在はClaude CodeやCodex CLIの特定のフック機能(PermissionRequest)を利用しており、動作条件はそれらのツールの仕様変更に影響を受けます。
AIエージェントに「自由に動いてほしいが、勝手すぎることはしてほしくない」というエンジニアの願いを、現実的なラインで実現する強力なサポーターと言えるでしょう。
引用元: https://zenn.dev/layerx/articles/20260428-ccgate
かつてiPhoneの登場により、Web制作に「レスポンシブWebデザイン」というパラダイムシフトが起きたように、今、WebはAIエージェントという新たなクライアントに対応するための「第二のレスポンシブ設計」の時代に突入しています。
現在のAIエージェントは、人間向けの画面を「推測」して操作(スクレイピングやComputer Use)していますが、これはUIの微細な変更で壊れやすく、計算コストも高い不安定な状態です。この記事では、Webサイト側がAIエージェントに対して「明示的なインターフェース」を提供するための2つの標準技術を解説しています。
-
WebMCP(操作のツール契約) GoogleやMicrosoftが推進するブラウザAPIです。JavaScriptを用いて、サイト側が「このページで何ができるか(例:カートに商品を入れる)」をツールとしてブラウザに登録します。これにより、エージェントはDOMを解析する手間なく、確実な操作が可能になります。また、決済などの重要なアクションの前にユーザーの承認を求める「Human-in-the-loop」が仕様に組み込まれているのが特徴です。
-
NLWeb(対話の窓口) 自然言語による「問い合わせ」に応えるプロトコルです。サイト内の情報を構造化データ(Schema.org等)として保持し、専用のエンドポイントを通じて、エージェントの「返品ポリシーは?」「予算内の商品は?」といった質問に直接回答します。
これらによって提唱されるのが、UX(User Experience)を拡張した「AX(Agent Experience)」という概念です。エージェントがいかにサイトを理解し、操作しやすいかという指標が、今後の検索順位やサービスの成否を分けるようになると予測されています。
新人エンジニアが今日から意識すべき実践的なアプローチとして、以下の3点が挙げられています。
- 主要操作の棚卸し: ユーザーがサイトで頻繁に行う「ジョブ」をツールとして定義する準備。
- 構造化データの再点検: Schema.orgなどを適切に設定し、情報の機械可読性を高める。
- UIとロジックの分離: ボタンのクリックイベントの中にロジックを詰め込まず、純粋な関数として切り出しておく(これがそのままWebMCPの実行関数になります)。
Webは「人間が読む文書」から「エージェントも操作するプラットフォーム」へと進化しています。この変化を、かつてのモバイル対応と同じ前向きな技術的挑戦として捉えることが、これからのエンジニアに求められています。
引用元: https://takoratta.hatenablog.com/entry/2026/04/28/112859
陣取り系ゲームのコミュニティが、企業さながらの組織へと進化しているという話題です。チーム内に「人事部」や「総務部」が存在し、オンライン面接や外交、多言語対応まで行う実態が明かされました。中には自治体と会議を行うケースもあり、趣味の域を超えた高度な組織運営が行われています。エンジニア組織にも通ずる「役割分担」や「マネジメント」の極致がゲームの世界に現れており、組織の在り方として興味深い内容です。
引用元: https://togetter.com/li/2691060
(株式会社ずんだもんは架空の登場組織です)