株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20250715

2025年07月15日

MP3ファイルをダウンロード

内容紹介

AIエージェントのサービス構築を検討しているあなたへ、10個のAIアプリケーションと3個のAIエージェントを1人で開発してみた、Raspberry PiでリモートからアクセスできるAIエージェントを作る、『Desktop Mate』に初音ミク「マジカルミライ2025 Ver.」DLC、録り下ろしボイス51種類を収録

出演者

ずんだもん
ずんだもん

関連リンク

この記事は、これからAIエージェントサービスを開発する新人エンジニアに向けて、その基本的な概念から実践的な構築ガイドまでを分かりやすく解説しています。

AIエージェントとは、ユーザーに代わってタスクを自律的に遂行するシステムです。従来の決まったルールで動く自動化とは異なり、AIエージェントは高度な判断が必要な複雑なワークフロー(例えば、支払い不正の分析や、複雑な顧客対応、非構造化データの処理など)で特に力を発揮します。

AIエージェントの設計には、主に3つの大切な要素があります。

  1. モデル: エージェントの「頭脳」となるLLM(大規模言語モデル)のことです。タスクの複雑さやコストを考慮して適切なモデルを選びますが、最初は高性能なモデルで動かしてみて、後からコストの低い小型モデルに切り替えるのがおすすめです。
  2. ツール: エージェントが外部システムと連携して情報を取得したり、実際のアクションを実行したりするためのAPI(アプリケーションプログラミングインターフェース)です。データ検索、情報更新、他のエージェントとの連携など、さまざまな機能を提供します。
  3. 指示 (Instructions): エージェントがどのように振る舞うかを定める明確なガイドラインです。既存の業務手順書などを参考に、タスクを細かいステップに分け、具体的なアクションを定義し、想定外の状況(エッジケース)にも対応できるように工夫することが重要です。

エージェントの連携方法(オーケストレーション)には2つの主要なパターンがあります。

  1. シングルエージェントシステム: 1つのエージェントが、必要なツールを増やしながら様々なタスクを処理する方法です。まずはこのシンプルな構成から始めることが推奨されています。
  2. マルチエージェントシステム: 複数のエージェントが協力してタスクをこなす方法で、複雑なワークフローでパフォーマンスや拡張性を高めたい場合に検討します。「マネージャー型」(指揮役のエージェントが専門エージェントに指示を出す)と「分散型」(複数のエージェントが対等にタスクをバトンリレーする)があります。

そして、AIエージェントを安全に運用するために不可欠なのが「ガードレール」です。これは、エージェントが危険な領域に逸脱しないように設ける「安全柵」のようなものです。ユーザー保護、機密情報保護、システム保護、ブランド保護などを目的に、入力のフィルタリング、不適切コンテンツの検出、ツール利用の制限など、複数の対策を組み合わせて多層的に防御します。開発初期から完璧を目指すのではなく、運用しながら段階的に強化していくのが効果的です。

この記事では、さらにAzure AI Agent Serviceを活用した実践的な実装例も紹介しています。これは、マネージャー型マルチエージェントシステムをAzureのサービス「Connected Agents」を使って構築するハンズオンの概要で、ユーザーからのリクエストをRouter Agentが受け取り、一般的な質問はGeneral Agent、簡単な質問はFAQ Agent、専門的な質問はExpert Agentといったように、適切な専門エージェントに振り分ける仕組みを簡単に実現できることが示されています。

AIエージェントのサービス構築は、まずは小規模な構成から始め、実際の利用状況に合わせて徐々に能力を拡張していくことが成功への道筋です。

引用元: https://zenn.dev/microsoft/articles/azure_nextjs_multi_agent

AIエンジニアの逆瀬川さんが、この半年間で個人開発した10個のAIアプリケーションと3個のAIエージェントについて紹介しています。これらの開発の背景には、「AIパートナー」というAIアシスタントの“手足”となるシステムを作り、現在の不便なAI利用体験を改善したいという強い思いがあります。Googleのような大企業が取るような戦略を個人で実行した点が特徴的です。

開発された3つのAIエージェントは、それぞれ異なる環境でのタスク自動化を目指しています。

  • Task Agent: 事前に用意されたツールを組み合わせてタスクをこなす「ツールベース」のエージェントです。20種類以上のツールを搭載し、柔軟な設計で新しいツールも簡単に追加できます。
  • Computer Agent: パソコン(Mac/Windows/Linux)上のソフトウェアを操作し、任意のタスクを実行します。AIが計画通りに進まない「操作ミスのループ」に陥った際に、連続して同じような行動を繰り返した場合に計画を見直す「フィードバック機構」を設けるなど、AIが自己改善できるように工夫されています。
  • RPA Agent: パソコン上で一度録画した作業を元に、その続きの作業や定期的な反復作業を自動で行います。複雑な操作にも対応し、作業手順を自動で作成する機能も持っています。

さらに、多岐にわたる10個のAIアプリケーションも開発されています。

  • AI Study: 資料をアップロードすると、チャットやレクチャー、スライド、動画を自動生成。動画生成はわずか3秒と超高速。
  • AI Translator: ファイルの自動翻訳。画像やPDFでもレイアウトを保ちながら翻訳できる点が特徴。
  • AI Video Translator: 動画の吹替や字幕を自動生成。翻訳後の発話量や話速を考慮して自然な吹替を実現。
  • AI Slide Generator: スライドを瞬時に自動生成。軽量モデルの採用で、高速な動作を実現しています。
  • AI Stylist Assistant: 服の組み合わせを提案したり、バーチャル試着ができるシステム。リアルタイムでの試着を実現するために独自の方法を開発。
  • その他、一般的なAIチャット、AI検索(初期レスポンスの高速化を重視)、執筆支援、データ分析支援などがあります。特にデータ分析アシスタントでは、複雑なファイルから正確にデータを抽出する工夫がされています。

これだけのシステムを個人で開発するにあたり、アイデア出しから開発までのフローを安定させ、LLM(大規模言語モデル)の活用は、既存のコーディング支援ツールをそのまま使うのではなく、必要な部分で手動と組み合わせて使うことで効率を高めたとのことです。

筆者は、これらの成果をさらに洗練させて商品化することを目指しており、サーバー等のリソース確保のため企業からの協力を呼びかけています。

引用元: https://zenn.dev/sakasegawa/articles/2a7119364775e7

この記事は、Raspberry Pi(ラズパイ)という小型コンピューターを使って、どこからでもアクセスできるAIエージェントを構築し、「Vibe Coding」(生成AIを活用して、思いついた時にすぐコーディングできるような環境)を実現する方法を紹介しています。まるで自宅に自分専用のAIアシスタントがいて、お風呂や布団の中からでも声をかけるだけで様々な作業を任せられるような、夢のような環境を構築することが目的です。

構築の核となるのは、ラズパイと大規模言語モデル(LLM)の一つであるClaude Codeです。まず、ラズパイを準備し、GitHub CLIやパッケージ管理ツールなどの開発環境、そして安全なリモート接続を可能にするTailscaleを設定します。

スマートフォンからのアクセス方法は主に二つあります。一つは「SSHアクセス」です。これはTailscaleを使って安全にラズパイに遠隔接続し、コマンドラインで操作する方法です。接続が切れてもAIの処理が中断しないように、byobuというツールを使うと便利だと説明されています。もう一つは「ブラウザでアクセス」する方法です。これは、著者が自作した「llm-assistant」というWeb UI(ユーザーインターフェース)をラズパイ上で動かし、Tailscale経由でスマートフォンのブラウザからアクセスできるようにするものです。このWeb UIは音声認識にも対応しており、「美味しいからあげについてリサーチして、レポートとしてNotionの調査データベースにまとめておいて」といった自然言語での指示が可能です。

このシステムを構築することで、ラズパイが24時間稼働のパーソナルAIコーディングアシスタントとなり、場所を選ばずにAIを活用した作業ができるようになります。ただし、自作Web UIのセットアップでは、セキュリティリスクを伴うオプション(--dangerously-skip-permissions)を使用しているため、利用には注意が必要であることも触れられています。

この記事は、小さなコンピューターとAIを組み合わせることで、私たちの働き方や生活がどう便利になるかを示してくれる、非常に興味深い内容です。

引用元: https://zenn.dev/karaage0703/articles/881425bd61a670

PCデスクトップでキャラクターが動くアプリ「Desktop Mate」に、初音ミク「マジカルミライ2025 Ver.」のダウンロードコンテンツ(DLC)がSteamで発売されます。このDLCには、初の録り下ろしボイスが51種類も収録され、様々なシーンで初音ミクの声が楽しめます。さらに、既存の初音ミクや雪ミクのDLCにも、今後無料アップデートでボイス機能が追加される予定です。PC画面を楽しく彩る、ちょっと嬉しいニュースですね。

引用元: https://www.appbank.net/2025/07/14/game/2789186.php

(株式会社ずんだもんは架空の登場組織です)