株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20251125

2025年11月25日

MP3ファイルをダウンロード

内容紹介

Google Antigravity のスタートガイド    Google Codelabs、仕様書駆動開発で一番いいAIモデル&エージェント検証 11/23版、Build and Run Secure, Data-Driven AI Agents

出演者

ずんだもん
ずんだもん

youtube版(スライド付き)

関連リンク

皆さん、こんにちは!今回は、Googleが新たに発表した画期的なAI開発プラットフォーム「Google Antigravity」について、新人エンジニアの皆さんにも分かりやすくご紹介します。

Antigravityは、今までの開発環境(IDE)を「エージェントファースト」という新しい時代へと進化させるツールです。従来のAIがコードを自動補完するだけだったのに対し、AntigravityではAIがまるで一人前のエンジニアのように、開発の「計画」「コーディング」「ウェブサイトの調査」「テスト」といった複雑なタスクを、自律的にこなしてくれます。私たちはAIに細かい指示を出すというより、プロジェクト全体のゴールを伝え、AIエージェントにその達成を任せる、というイメージですね。

このプラットフォームの主な特徴は以下の通りです。

  1. エージェントマネージャー(ミッションコントロール): 複数のAIエージェントを同時に管理できる「管制室」のようなダッシュボードです。例えば、「認証機能をリファクタリングして」「依存関係を更新して」といった異なるタスクを複数のAIエージェントに並行して指示し、進捗を一覧で確認できます。まるでプロジェクトマネージャーのように、AIエージェントたちを指揮する感覚です。AIエージェントにどれくらいの自由度で作業させるか(ターミナルコマンドの実行や、作業内容のレビューを求める頻度など)も細かく設定できます。
  2. エディタ: お馴染みのVS Codeをベースに作られており、コード編集のしやすさはそのままに、AIエージェントとの連携が強化されています。コードの一部をハイライトして「ここをもっと効率的にしてほしい」「このロジックにコメントを追加して」といった指示を直接AIに出せるのが便利です。
  3. Antigravityブラウザ: AIエージェントが自らChromeブラウザを操作し、ウェブサイトにアクセスして情報収集をしたり、開発したウェブアプリケーションの動作検証を行ったりできます。人間がブラウザを操作するのと同じように、クリックやスクロール、入力などが可能です。
  4. アーティファクト: AIエージェントが作業する過程で作成する「作業記録」のことです。例えば、タスクの計画書、コードの変更点(差分)、画面のスクリーンショット、テスト結果の動画などが自動で生成されます。これにより、AIが「何を」「どうやって」作業したのかが明確になり、その作業が正しかったのかを人間が簡単に確認・承認できるようになります。

具体的な活用例としては、以下のようなことができます。

  • Googleニュースのようなウェブサイトから最新情報を自動で抽出し、要約する。
  • PythonとFlaskを使ったウェブサイトを一から生成し、さらに機能を追加したり修正したりする。
  • ポモドーロタイマーのようなシンプルな生産性向上アプリを生成し、デザインや機能の改善をAIに依頼する。
  • 既存のPythonコードに対して、AIが自動で単体テストコードを生成し、実行してその検証まで行う。

Antigravityは、AIが開発プロセスに深く関わる「エージェントファースト」という新しい働き方を提案しています。プログラミングの経験がまだ浅い新人エンジニアの皆さんでも、AIエージェントの力を借りて、複雑な開発タスクに挑戦したり、効率的に学習を進めたりできる素晴らしいツールです。ぜひ一度、この新しい開発体験を試してみてはいかがでしょうか。

引用元: https://codelabs.developers.google.com/getting-started-google-antigravity?hl=ja

この記事は、最新のAIモデル(GPT5.1、Gemini 3.0、Sonnet 4.5など)を使い、ソフトウェア開発の手法の一つである「仕様書駆動開発(SDD)」において、どのAIエージェントが最も効果的かを検証したものです。AIが仕様書を作成し、その仕様書に基づいてコードを実装するという2つの段階に分けて、各モデルの性能が比較されています。

検証は、個人開発中のゲーム(約4万行のコードベース)に「歯車システムが特定の条件で破壊される」という機能を追加するタスクを例に行われました。

評価対象となったAIエージェント:

  • codex-cli (GPT-5.1)
  • claude-code (Sonnet-4.5)
  • Cursor + gemini-3.0-pro-preview

検証結果:仕様書作成の段階 当初、AIによる評価では、内容が包括的で読みやすい日本語だったClaude(Sonnet-4.5)の仕様書が最も良いと判断されました。しかし、実際にその仕様書をもとにコードを実装させたところ、Gemini 3.0が作成した仕様書から最も質の高い実装ができました。 この結果から、AIは文章量の多いものを良いと評価する傾向がありますが、必ずしもそれが実装のしやすさにつながるとは限らないという考察が述べられています。むしろ、詳細に記述しすぎず、ざっくりとした仕様書の方が、実装を担当するAIがコードの文脈を深く理解し、より柔軟で最適なコードを生成できる可能性が示唆されました。

検証結果:コード実装の段階 仕様書作成とは別に、純粋な「コード実装力」についても比較が行われました。同じ仕様書を使ってAIエージェントに実装させた結果、codex-cli (GPT-5.1-codex-max) が最も優れた実装を生成しました。 Gemini 3.0による実装は、不自然なコードや不要な記述が多く見られ、もし開発者が手直しをする場合、かなりの修正量が必要になると判断されました。これは、Gemini 3.0がソフトウェアエンジニアリングのベンチマーク(SWE-Bench)で他のモデルにやや劣るスコアであることとも一致しています。

結論 今回の検証では、仕様書作成の段階ではGemini 3.0が、そして実際のコード実装の段階ではcodex-cli (GPT5.1) が最も優れたパフォーマンスを発揮するという結論に至りました。

ただし、この検証は一つのプロジェクトにおける特定のテストケースでの結果であり、AIモデルは日々進化しているため、今後のアップデートによって最適な選択は変わる可能性があります。

引用元: https://zenn.dev/sakastudio/articles/a5ea1eee97ec37

この記事は、NVIDIAが提供する「AI-Q Research Assistant」と「Enterprise RAG Blueprints」というAIエージェントの構築方法について、AWS上でのセキュアかつ効率的なデプロイに焦点を当てて解説しています。新人エンジニアの皆さんにとって、AIエージェントがビジネスでどのように活用され、どのように構築できるのかを理解する良い機会になるでしょう。

生成AIの進化により、企業は自社のデータに基づいて、正確で信頼性の高いAIエージェントを求めています。NVIDIAのこれらの「ブループリント」(設計図のようなもの)は、大規模言語モデル(LLM)と検索拡張生成(RAG)技術を組み合わせることで、大量のドキュメントから必要な情報を理解し、要約したり分析レポートを作成したりするのを自動化します。

ソリューションの核となるのは、以下の2つです。

  1. Enterprise RAG Blueprint: これは、企業内の文書(PDFやレポートなど)からテキスト、表、図などの情報を抽出し、ベクトルデータベースに保存します。ユーザーが質問すると、関連する情報をデータベースから検索し、LLMを使って文脈に沿った正確な回答を生成します。これにより、社内ナレッジベースからの迅速な情報検索が可能になります。
  2. AI-Q Research Assistant: RAGの基盤の上に構築され、さらに高度な「エージェント」としての機能を提供します。ユーザーの複雑な調査プロンプトを分析し、社内データ(RAG)とリアルタイムのWeb検索(Tavily API)を使い分けて情報を収集します。そして、これらの情報を整理・統合し、詳細なレポートを自動生成します。これは、まるで専属のリサーチャーを雇うような体験です。

これらのAIエージェントは、Amazon Web Services (AWS) 上に安全かつスケーラブルにデプロイされます。主要なAWSサービスとして、コンテナ化されたAIアプリケーション(NVIDIA NIM microservices)を管理する「Amazon EKS」、企業データを保管する「Amazon S3」、ベクトルデータを効率的に検索する「Amazon OpenSearch Serverless」が利用されます。特に注目すべきは、「Karpenter」というツールで、AIに必要なGPUリソースを、必要な時に必要なだけ自動的に準備し、コストを最適化してくれます。

デプロイは、Terraformなどのツールを使った自動化されたスクリプトによって簡単に行えます。必要なAWS CLIや開発ツール、NVIDIAのAIモデル利用に必要なAPIキーなどを準備すれば、数十分程度でEnterprise RAGのみ、またはAI-Qを含むフルセットの環境を構築できます。構築後は、Web UIを通じて簡単に利用を開始でき、システムの状態を監視するためのPrometheusやGrafanaといった監視ツールも含まれています。

GPUの利用はコストがかかるため、利用が終わったら簡単に全ての環境を削除できるクリーンアップスクリプトも用意されており、安心して試すことができます。

NVIDIAのAIエージェントとAWSの強力なインフラを組み合わせることで、企業は膨大なデータから安全かつ効率的に価値ある情報を引き出し、新たなインテリジェンスを生み出すことが可能になります。これは、現代のエンジニアにとって非常に実用的なAIソリューションと言えるでしょう。

引用元: https://developer.nvidia.com/blog/build-and-run-secure-data-driven-ai-agents/

(株式会社ずんだもんは架空の登場組織です)