株式会社ずんだもん技術室AI放送局 podcast 20250702
内容紹介
Genspark ships no-code personal agents with GPT-4.1 and OpenAI Realtime API、How to Build Custom AI Agents with NVIDIA NeMo Agent Toolkit Open Source Library、AIエージェント × MCP × スプレッドシートで寝ている間に仕事をしてくれる「小人のくつ屋さん」を実現する、上から見ると、あのキャラが…今年も完成!東北最大級の「トウモロコシ迷路」鏡石町の岩瀬牧場 福島(テレビユー福島)|dメニューニュース
出演者
関連リンク
AIの世界は進化が速く、新しい技術が次々と登場していますね。今回は、Gensparkという会社が開発した「Super Agent」という画期的なAIエージェントについてご紹介します。これは、新人エンジニアの皆さんも注目すべき、AI活用の最前線を示す事例です。
Super Agentは、プログラムを書かなくても(ノーコードで)使えるAIエージェントです。例えば、電話をかけたり、プレゼンテーション資料を作ったり、レシピを短い動画に変えたりといった、普段の仕事や生活で発生する「現実世界でのタスク」をAIが自動でこなしてくれるのが最大の特徴です。
このAIエージェントのすごいところは、OpenAIの最新のAIモデル(GPT-4.1やGPT-image-1など)と「Realtime API」という技術を組み合わせて使っている点です。これにより、テキスト、画像、音声といった様々な情報を扱えるようになり、ユーザーが「これをしてほしい」と指示するだけで、裏側で複数のAIモデルや80種類以上のツールが連携し、複雑な作業も自動で完結できるようになりました。
GensparkはもともとAI検索エンジンを作っていましたが、ユーザーが単に「答え」を知りたいだけでなく、「成果物」(例えば、提案書や動画)を求めるようになったため、2025年4月に思い切ってAIエージェントに事業の軸を移しました。
このSuper Agentは、ローンチからわずか45日間で年間売上(ARR)が3600万ドル(約56億円)に達するという驚異的な成長を遂げました。しかも、これは20人の小さなチームが、一切有料広告を使わず、口コミと製品自体の魅力だけで達成したものです。
特に面白い機能として、「Call For Me」というものがあります。これはAIがユーザーの代わりに電話をかけ、予約をしたり、配送の変更を依頼したりと、人間相手に自然な会話をリアルタイムで行ってくれます。日本では、この機能を使って会社に退職の連絡をする事例が話題になるほどで、AIが「まさかこんなことまでできるのか!」と多くの人を驚かせました。
Gensparkは、OpenAIとの密接な連携を通じて、モデルの性能を最大限に引き出し、APIの使いやすさも相まって、記録的な速さで製品を開発・拡大できました。Super Agentは単なるチャットAIではなく、様々な作業をこなす「オールインワンのAIワークスペース」を目指しており、今後のAIの進化を示す事例として、新人エンジニアの皆さんにとっても大変参考になるはずです。
引用元: https://openai.com/index/genspark
昨今、AIエージェントは企業の業務を自動化し、効率を大幅に向上させる存在として注目されています。NVIDIAが提供するオープンソースライブラリ「NVIDIA NeMo Agent toolkit」は、このAIエージェントを効率的に構築・統合するためのツールです。異なるAIフレームワークで作成されたエージェントであっても、このツールキットを使えば、様々なデータ源やツールを簡単に組み合わせて、統一された環境で動かすことができます。
このツールキットを使うと、以下のようなステップでカスタムAIエージェントを構築できます。
-
プロジェクトの準備: まずは
workflow create
コマンドを使って、エージェント開発の土台となるプロジェクトのひな形(スケルトン)を作成します。これにより、エージェントの構成要素やプラグインを定義する設定ファイル(pyproject.toml
やconfig.yaml
)が用意されます。開発したエージェントは、Web APIとして広く使われるFastAPIのマイクロサービスとして動かすこともでき、外部から簡単に利用できるようになります。 -
マルチRAGエージェントの作成: RAG(Retrieval Augmented Generation)とは、外部の知識源から情報を取得し、それを基にAIが回答を生成する技術です。このツールキットでは、複数のRAGを連携させて、様々な情報源から必要な情報を引き出し、複雑な問題に対しても根拠に基づいた推論ができるエージェントを作成できます。例えば、社員の服装規定、給与、休暇ポリシーといった異なる情報を管理するRAGを組み合わせることが可能です。これらのRAGは、ローカル環境でもリモート環境でもホストでき、設定ファイルで柔軟に定義できます。
-
ReActエージェントの設定: ReAct(Reasoning and Acting)エージェントは、思考(Reasoning)と行動(Acting)を繰り返し、問題解決を行うAIエージェントの一般的な手法です。NeMo Agent toolkitを使ってカスタムエージェントを実装する際には、利用するツールの一覧、大規模言語モデル(LLM)と連携するためのクライアント、そしてエージェントの応答を導くためのプロンプトを設定します。これにより、エージェントは過去の会話履歴や最新のメッセージを考慮しながら、RAGツールを効果的に活用し、正確で文脈に合った回答を提供できるようになります。
-
FastAPIマイクロサービス化: 最後に、構築したエージェントを外部から利用できるように、FastAPIを使ってマイクロサービスとして公開します。設定ファイルを更新し、コマンドラインツールでパラメータが正しく指定されていることを確認すれば、エージェントはユーザーからの問い合わせに応答できるようになります。
NVIDIA NeMo Agent toolkitは、GitHubで公開されており、カスタムAIエージェントを構築するための具体的な手順は、付属の動画チュートリアルでも詳しく解説されています。AIエージェント開発に興味のある新人エンジニアにとって、実践的な学びの機会となるでしょう。
引用元: https://developer.nvidia.com/blog/how-to-build-custom-ai-agents-with-nvidia-nemo-agent-toolkit-open-source-library/
この記事では、最新のAI技術を組み合わせて、まるで童話の「小人のくつ屋さん」のように、人間が寝ている間に仕事を進めてくれる自動化システム「小人の調べ屋さん」の実現について解説しています。
このシステムは、AIエージェントが人間の代わりにウェブブラウザを操作し、ウェブサイトを自動で調査して、その結果をGoogleスプレッドシートに記録するものです。例えば、多数のウェブサイトを一つずつ開いて、アクセスランキングが表示されているかを確認し、その有無や名称をスプレッドシートに記入するといった、これまで人間が目視で確認し、手作業で行っていた単純だけど手間のかかる作業をAIが肩代わりしてくれます。URLが間違っていても、AIがウェブ検索で正しいURLを調べて修正するといった柔軟な対応も可能です。
このシステムを動かす主な技術要素は以下の通りです。
- AIエージェントフレームワーク「Mastra」: AI(LLM)が自律的に仕事をするための基盤となるプログラムの枠組みです。今回はTypeScriptで開発されています。
- MCP (Model Context Protocol) サーバー: AIエージェントが外部のシステムと連携するための仕組みです。
- Playwright MCP: AIがブラウザを起動して、ウェブページを閲覧したり、操作したりできるようにします。
- Brave Search MCP: AIが必要に応じてウェブ検索を行い、情報を収集できるようにします。
- Googleスプレッドシート: 調査対象のリストを入力したり、AIが収集した結果を自動で書き込んだりするデータ管理ツールとして活用します。普段使い慣れた表計算ソフトなので、リストの確認や調整が簡単に行える点がメリットです。
開発は、まずAIエージェント単体でウェブサイトの調査ができるかを確認し、次にGoogleスプレッドシートとの連携、そして一連の作業を自動で繰り返す「バッチ処理」のワークフローを組む形で行われました。AIエージェントが自然言語で得た調査結果を、プログラムで扱えるように構造化する工夫もされています。このプログラムのソースコードも公開されています。
記事の筆者は、AIにどこまで仕事を任せるか、そしてプログラムで制御する部分とAIに任せる部分の線引きについて考察しています。今回は安定性を重視して、AIが自然言語で出した結果を、別のAIが構造化データに変換するという二段階のアプローチを採用しています。
このようなAIエージェントの活用により、これまで専門スキルや多くの人手が必要だった「緻密なフィールドワーク」のようなデータ収集が、より手軽に、効率的に行えるようになる可能性を示しています。新人エンジニアの皆さんも、日々の業務で「これ、AIに任せられないかな?」と考えてみると、新しい発見があるかもしれません。
引用元: https://qiita.com/miyanaga/items/89c241f9c9b5558626cc
福島県鏡石町の岩瀬牧場に、東北最大級のトウモロコシ迷路が完成しました。広さ1万5000平方メートル、全長2キロのコースは、上から見ると人気キャラクター「ずんだもん」の形になっているのが特徴です。アナウンサーが挑戦し、目標時間を大幅に上回る好タイムでゴールしました。冒険気分と達成感を味わえるこの迷路は、7月19日にグランドオープンし、9月中旬まで楽しめます。気分転換にいかがでしょうか。
引用元: https://topics.smt.docomo.ne.jp/article/tuf/region/tuf-2014949
(株式会社ずんだもんは架空の登場組織です)