株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20250108

2025年01月08日

MP3ファイルをダウンロード

内容紹介

AIやテクノロジーに関する記事を紹介 Google Agentspace、ClineとAIコーディングツールの現状、NVIDIA Launches AI Foundation Models for RTX AI PCs、OpenAIの最新研究が明かすAIのスキルレベル、AIエンジニアリングなど高度スキル領域も自動化される可能性

出演者

ずんだもん
ずんだもん

関連リンク

Google Agentspaceは、Geminiの高度な推論能力、Googleの高品質な検索技術、企業のデータを組み合わせて、従業員が専門知識をAIエージェントを通じて活用できるようにするサービスです。主な機能は以下の通りです。

  • マルチモーダル対応: Gemini, Imagen, Veoモデルにより、画像、テキスト、動画を理解し、多様な情報に対応できます。
  • 高品質な検索: Googleの検索技術により、データがどこに保存されていても、関連性の高い情報を発見できます。
  • データ連携: 一般的なサードパーティアプリケーションとの連携により、データサイロを解消し、迅速な回答やアクションを可能にします。
  • NotebookLMとの連携: NotebookLM Plusにより、複雑な情報を理解し、洞察を発見しやすくなります。ポッドキャストのような音声要約も可能です。
  • 企業全体での情報発見: 企業ブランドのマルチモーダル検索エージェントとして、組織全体の情報源として機能します。
  • カスタムAIエージェント: マーケティング、財務、法務、エンジニアリングなど、様々な分野でAIエージェントを活用できます。ローコードツールでエージェントを構築・調整することも可能です。
  • 各部門での活用: マーケティング、営業、ソフトウェア/IT、研究開発、人事など、各部門での業務効率化や新たな洞察の発見をサポートします。
  • セキュリティ: Google Cloudの安全なインフラストラクチャ上で構築されており、データのプライバシー、コンプライアンス、アクセス制御、暗号化、責任あるAIツールなどのセキュリティ機能を提供します。

このサービスは、従業員の専門知識の活用、生産性の向上、ビジネス機能の自動化を支援します。

引用元: https://cloud.google.com/products/agentspace

AIコーディングツールは、コード補完、チャットアシスタント、コーディングエージェントの3つに分類されます。近年、特にコーディングエージェントの開発が活発です。この記事では、オープンソースのコーディングエージェント「Cline」を中心に、AIコーディングツールの現状を解説します。

ClineはVS Codeの拡張機能で、コード補完やチャット機能は持たず、コーディングエージェントに特化しています。そのため、CopilotやCodyと組み合わせて使われることが多いです。Clineは、全ての仕組みがオープンソースであるため学習に最適であり、活発なコミュニティによって急速に発展しています。

Clineのアーキテクチャは、プレーンテキスト経由のプロンプトエンジニアリングに基づき、XML記法で関数呼び出しや手続きを表現します。これにより、LLMがコード編集、ファイル操作、コマンド実行などのタスクを自動化します。

ClineはデフォルトでClaudeモデルを使用しますが、DeepSeekなどの他のモデルも利用可能です。DeepSeekは比較的安価で高性能なため、Clineユーザーに人気があります。また、ローカルLLMも利用可能ですが、ある程度のスペックのマシンが必要です。

Clineのコミュニティでは、Roo-Cline、Bao Cline、Cool Clineなどのフォーク版が開発されており、独自の機能が追加されています。これらのフォーク版は、カスタマイズ性、コスト効率、シンプルなコードベース、Cline自体でClineを変更できる点、メンテナーがほぼ一人であるなどの理由で多く存在します。

エンタープライズ向けには、ClineはAPIを直接利用するため、各サービスのポリシーに従う必要があります。CursorやContinueは自社サーバーでモデルをホストしており、セキュリティに注意が必要です。DeepSeekについては、データ取り扱いに関する懸念があります。

AIコーディングツールは、プログラミングの自動化を高度に進める一方で、学習や教育には不向きという意見もあります。しかし、プログラミングを始める人を増やし、コスト削減にもつながる可能性を秘めています。

引用元: https://laiso.hatenablog.com/entry/2025/01/07/045009

NVIDIAは、RTX AI PC向けに、ローカルで動作するAI基盤モデルを発表しました。これらはNVIDIA NIMマイクロサービスとして提供され、GeForce RTX 50シリーズGPUで高速化されます。これにより、AIエージェントやクリエイティブなワークフローの開発が容易になります。NIMマイクロサービスは、LLM、画像生成、音声処理など多岐にわたるAIモデルをサポートし、FP4計算により推論性能が向上します。また、NVIDIA AI Blueprintsは、デジタルヒューマンやコンテンツ作成などの事前設定されたワークフローを提供します。

さらに、NVIDIAはLlama Nemotronファミリーのオープンモデルも発表し、特にエージェントタスクに優れたLlama Nemotron NanoがNIMマイクロサービスとして提供されます。これらのAIモデルは、Windows 11のWSL上で簡単にダウンロードして実行でき、主要なAI開発フレームワークとの互換性もあります。

デモンストレーションとして、AIエージェントの構築例であるProject R2Xが紹介され、NVIDIA RTX Neural FacesとAudio2Face™-3Dモデルを活用して、より自然なアバターが実現されます。AI Blueprintsでは、PDFからポッドキャストを作成したり、3Dシーンをガイドとした画像生成など、様々なAI活用例が提供されます。

これらのNIMマイクロサービスとAI Blueprintsは、2月からGeForce RTX 50シリーズ、4090、4080、およびNVIDIA RTX 6000/5000プロフェッショナルGPUで利用可能になります。Acer、ASUS、Dellなどの主要PCメーカーからNIM対応のRTX AI PCが発売されます。

引用元: https://nvidianews.nvidia.com/news/nvidia-launches-ai-foundation-models-for-rtx-ai-pcs/

OpenAIが、AIの機械学習エンジニアリング能力を測る「MLE-bench」という新しい評価基準を発表しました。これは、Kaggleというデータ分析コンペの過去の課題75件を使って、AIがどれだけ高度な問題解決ができるかを評価するものです。この評価では、AIが単に計算するだけでなく、計画を立てたり、問題を解決したりする能力もチェックされます。

特に注目されたのは、OpenAIの「o1-preview」モデルが、他のモデルより優れた成績を収めたことです。このモデルは、与えられた課題に対して、まるで人間のエンジニアのように、モデル設計から実験までの一連の作業をこなしました。しかし、AIにもまだ課題があり、例えば、解答の形式を間違えたり、時間や計算資源をうまく使えなかったりする点が明らかになりました。

この研究で使われた評価基準は公開されており、今後、AIのエンジニアリング能力をさらに向上させるための開発が活発になると考えられます。AIが高度な専門分野でも活躍できる可能性を示す一方で、まだ改善の余地があることも明確になったと言えるでしょう。

引用元: https://ampmedia.jp/2024/12/28/mle/

(株式会社ずんだもんは架空の登場組織です)