株式会社ずんだもん技術室AI放送局 podcast 20250611
内容紹介
メルカリにおけるデータアナリティクス AI エージェント「Socrates」と ADK 活用事例、「世界初の汎用AIエージェント」を豪語、中国発「Manus」がヤバすぎる理由、LangGraph Release Week Recap、Gatebox、竹中工務店とAI活用で協業、AIキャラクターがオフィスビルの設備を自在に操作する実証実験を実施
出演者
関連リンク
メルカリは、膨大な社内データを持ちながらも、SQLなどの専門知識がないとデータ活用が難しいという課題に直面していました。データ分析の依頼が特定のアナリストに集中し、迅速な意思決定が阻害されることもあったため、「誰もがもっと手軽にデータと対話できる」仕組みが求められていました。
この課題を解決するために、メルカリはデータアナリティクスAIエージェント「Socrates(ソクラテス)」を開発しました。Socratesは、ユーザーが普段使う言葉(自然言語)で質問するだけで、まるで優秀なデータアナリストと会話するようにデータ分析を進められるシステムです。従来の「Text2SQL」(テキストからSQLを自動生成する技術)が単純な質問にしか対応できないのに対し、Socratesは「推論(思考)」と「行動(ツール利用)」を組み合わせることで、より複雑なデータ分析や仮説検証、レポート作成支援までを自動化します。これにより、データ分析の「民主化」とビジネスにおける「意思決定の迅速化」を目指しています。
Socratesが自社開発された背景には、高性能なLLM(大規模言語モデル)やAIエージェント構築ライブラリの登場、そしてメルカリに高品質なデータ資産(Basic Tables)が整備されていたというタイミングが重なりました。メルカリは、AIエージェントの核となる技術が汎用化する可能性を見据え、データの構造化や社内ナレッジの整備といった、他社が模倣しにくい「周辺資産」への早期投資と、それらを活用できる「AI Agent Ready」な組織への変革を重視しています。
Socratesの開発には、Googleが提供するAIエージェント開発フレームワーク「ADK (Agent Development Kit)」が活用されています。ADKは、Google Cloudのサービス(BigQueryやVertex AIなど)とスムーズに連携でき、複数の専門エージェントが協力して動く「マルチエージェントアーキテクチャ」の設計を支援します。Socratesでは、このADKを基盤に、BigQueryでのSQL実行、Pythonによるデータ処理、社内ドキュメント検索など、多様なツールと連携することでデータ分析のワークフローを自動化しています。
AIエージェントの運用は、機械学習システムの運用(MLOps)と同様に複雑です。メルカリでは、Socratesの応答品質やタスク達成度を評価するため、オフラインテスト、ユーザーからのフィードバック、さらには「Agent as a Judge」(別のAIエージェントがSocratesの応答を評価する)といった多角的なアプローチで継続的な改善を行っています。また、応答速度(レイテンシ)の改善、コスト最適化、セキュリティ対策(プロンプトインジェクション防止、情報漏洩対策など)にも力を入れています。ADKはGoogleエコシステムとの親和性が高く開発を加速させましたが、一部の課題も認識しており、今後の進化に期待を寄せています。
メルカリの事例は、AIエージェントが企業内のデータ活用を大きく変革する可能性を示しています。AIエージェントは、単に開発するだけでなく、データやドキュメントといった「周辺資産」を整備し、組織文化や業務プロセスを「育て続ける」ことが成功の鍵となります。
引用元: https://speakerdeck.com/na0/merukariniokerudetaanariteikusu-ai-eziento-socrates-to-adk-huo-yong-shi-li
中国のAIスタートアップ「Butterfly Effect」が開発したAIエージェント「Manus」が、AIコミュニティで大きな注目を集めています。同社はこれを「世界初の汎用AIエージェント」と称し、OpenAIの「Deep Research」を超える性能を持つと豪語しています。
「Manus」は、AnthropicのClaude 3.5 SonnetやAlibabaのQwenモデルをベースにした「マルチエージェントシステム」を採用しています。これは、複数のAIが連携して働くことで、より複雑なタスクに対応できる仕組みです。初期の専門家による評価は非常に高く、例えば、犯罪率や起業家密度といった複数の要素を考慮してサンフランシスコの賃貸物件を探したり、リアルタイムのデータを使って自己紹介サイトを作成・公開したりといった、複雑で具体的なタスクを高い精度で実行できたと報告されています。元Google社員のYouTuberも、「最も自律的なAIエージェントに近い」と評価し、様々なタスクでその能力を検証しています。
しかし、2025年4月の一般公開後、ユーザーからの評価は賛否両論に分かれています。新規登録者には無料クレジットが提供されるものの、簡単なタスクでも大量のクレジットを消費するため、無料で試せる回数はごく限られます。月額料金も高額で、これに対しては「法外に高い」という声も上がっています。
実際にユーザーが試したところ、データ入力の自動化や物件探しなど、タスクによっては期待通りの成果が得られなかったり、全く意図しない情報が生成されたりする失敗例も報告されています。一方で、非常に時間のかかる作業を短時間で完了できたといった成功体験も聞かれます。
専門家からは、デモでAIエージェントの可能性が示された一方で、自律的に行動するAIエージェントが、株式売買などの重要なタスクを自動で行うことにはまだ慎重な姿勢を示す意見もあります。
「Manus」は、汎用的なAIエージェントの可能性を示すものですが、実用化にはコスト面や精度、そしてAIが自律的に行動することのリスクなど、まだ多くの課題があることが伺えます。
引用元: https://www.sbbit.jp/article/cont1/165679
AIエージェント開発に挑戦中の皆さん、こんにちは!AIエージェントを構築するフレームワークLangGraphが、Python版とJavaScript版で大規模な新機能アップデートを行いました。今回の機能追加は、AIエージェントの開発効率を大幅に高め、より柔軟な制御を可能にするものです。新人エンジニアの皆さんが、AIエージェント開発をスムーズに進める上で役立つポイントをご紹介します。
AIエージェント開発を加速する共通の新機能
- ノードキャッシュ(Node Caching)で開発サイクルを高速化
- LangGraphの各処理ステップ(ノード)の計算結果をキャッシュ(一時保存)できるようになりました。AIエージェント開発では試行錯誤が多く、同じ計算を繰り返す場面が頻繁にあります。ノードキャッシュにより、以前の計算結果を再利用できるため、実行速度が向上し、開発効率が大きく改善します。
- 遅延ノード(Deferred Nodes)で複雑なワークフローをシンプルに
- 特定のノードの実行を、関連するすべての先行処理が完了するまで待機させることが可能になりました。これにより、複数のAIエージェントが協力して情報を集め、それらが揃ってから最終決定を下すといった、複雑な「map-reduce」や「コンセンサス」型のワークフローを、より効率的に構築できます。
- モデル前/後フック(Pre/Post Model Hook)でエージェントの挙動を詳細に制御
- AIモデルが応答を生成する前後に、独自の処理を挿入できるようになりました。例えば、AIモデルに渡す会話履歴を要約してコストや応答速度を最適化したり(前フック)、AIの生成内容をチェックして不適切な応答を防ぐ「ガードレール」を設けたり(後フック)することが可能になります。これにより、より安全で効率的なAIエージェントを開発できます。
- 組み込みプロバイダツール(Builtin Provider Tools)で外部サービス連携を強化
- Web検索ツールやリモート操作ツールなど、外部の便利なツールをLangGraphのAIエージェントに簡単に組み込めるようになりました。これにより、AIエージェントが最新の情報を取得したり、外部システムと連携して多様なタスクを実行したりと、AIエージェントの能力を飛躍的に拡張できます。
JavaScript開発者向け!さらに便利な機能
- 再開可能なストリーム(Resumable Streams)でアプリケーションの堅牢性を向上
- JavaScript版では、リアルタイムな情報ストリームがネットワーク問題などで中断されても、自動的に中断箇所から再開できるようになりました。ユーザー体験が向上し、データが途中で失われる心配が減ります。
- 開発者体験の向上(DevX Improvements)でスムーズな開発を実現
- コードの「型安全」が強化されたり、複雑なワークフローをより少ないコードで記述できるようになったりしました。これにより、特に新人エンジニアの皆さんがコードを書く際のミスが減り、開発がよりスムーズに進められるよう改善されています。
今回のアップデートにより、LangGraphを使ったAIエージェント開発は、より高速に、より堅牢に、そしてより柔軟に行えるようになりました。これらの新機能を活用し、ぜひ皆さんの手で新しいAIエージェント開発に挑戦してみてください!
引用元: https://blog.langchain.dev/langgraph-release-week-recap/
Gateboxと竹中工務店が協業し、AIキャラクターがオフィスビルの照明や空調などを音声で操作するシステムを開発しました。これは、従来の個人宅向けではなく、オフィスやホテルなどの大規模な建物で多様な設備を遠隔操作できるのが特徴です。自然な会話で設備を制御できるため、オフィスワーカーや宿泊者など、様々な利用者の利便性や快適性を向上させることを目指しています。AIが身近な場所で活躍する未来が楽しみですね。
引用元: https://prtimes.jp/main/html/rd/p/000000120.000026497.html
(株式会社ずんだもんは架空の登場組織です)