株式会社ずんだもん技術室AI放送局 podcast 20250514
内容紹介
MCPやAIエージェントに必須の「LLMの外部通信・連携」におけるセキュリティ観点、AIワークフローサービス比較メモ(Dify / n8n / Gumloop)、GPT-4.1、Claude 3.7 Sonnet、Gemini 2.5 Pro、Grok 3、用途別で見るベストLLMとは?、Vtuberしぐれうい、風邪で声が出ないのに雑談配信!? 自身の過去ボイス音源とずんだもん音声で挑む神対応に視聴者歓喜
出演者
関連リンク
大規模言語モデル(LLM)はテキスト生成などで高い能力を持ちますが、単体では最新情報や非公開データを知らなかったり、現実世界でアクションを起こせなかったりする制約があります。これらの「知識の壁」「実行の壁」「能力の壁」を超えるために、LLMは外部サービス(APIなど)と連携する必要があります。MCPやAIエージェントでは、このような外部連携が不可欠です。
しかし、LLMが外部と連携できるようになると、新たなセキュリティリスクが生まれます。開発者の皆さんは、このリスクを理解し対策することが重要です。
記事では、具体的な機能例として「URL指定による情報取得機能」と「Gitホスティングサービス連携機能」を取り上げ、潜むリスクを解説しています。
例えば「URL指定による情報取得機能」では、指定されたURLから情報を取得するために外部へ通信します。ここで、悪意のあるURLを指定されると、サーバー内部のリソースに不正アクセスされる「SSRF」という危険性があります。また、ユーザーからの指示や外部の情報に埋め込まれた悪意のあるテキスト(プロンプトインジェクション)によって、LLMが意図せず機密情報を含むリクエストを生成してしまうリスクも考えられます。
「Gitホスティングサービス連携機能」のように、LLMが外部サービスで実際に操作を行う機能では、「過剰な代理行為」に注意が必要です。LLMに必要以上の権限を与えていると、ユーザーの曖昧な指示や、外部の情報に仕掛けられた偽の指示によって、意図しない広範囲な操作(リポジトリの削除など)を実行してしまう可能性があります。また、LLMが扱うプライベートな情報(コードやIssue内容など)が、LLMの「コンテキストウィンドウ」を通じて外部に漏洩するリスクもあります。
これらのリスクに対して、記事では以下の対策を挙げています。
- 最小権限の原則: LLMが利用する外部連携ツールの権限は、必要最低限に絞る。
- 認証情報の分離: 外部サービスへの認証情報は、LLMのコンテキストから完全に分離し、安全な場所に管理する。
- コンテキストウィンドウの分離: LLMのコンテキストウィンドウには、漏洩しても問題ない情報や、そのタスクに必須の情報のみを含めるように設計する。
- 入出力の境界での防御: LLMへの入力や出力に対して、不適切な内容がないかチェックする機能(ガードレールなど)を設ける。
外部連携するLLMアプリケーションを開発する際は、これらのセキュリティ観点をしっかり考慮し、安全な設計を心がけましょう。
引用元: https://blog.flatt.tech/entry/llm_ext_collab_security
この記事では、AIを使った様々な作業を自動化する「AIワークフローサービス」の中から、特に注目されているDify、n8n、Gumloopの3つを比較して紹介しています。これらのツールを使うと、プログラミングの専門知識が少なくても、AIや他のサービスを組み合わせて複雑な自動化の仕組み(ワークフロー)を簡単に作れるようになります。
Dify
日本で特に人気があるのがDifyです。その理由は、UIやドキュメントが日本語でしっかり整備されているため、日本のユーザーが使い始めやすい点にあります。Difyは、主にチャットボットや、企業のデータを使った質疑応答システム(RAG)のような、生成AIを使ったアプリケーションの開発に特化しています。オープンソース版とクラウド版が提供されており、企業が社内向けのAIアプリを素早く作るのに役立ちます。
n8n
n8nは、SlackやGoogle Workspaceなど、様々なWebサービス同士を連携させて業務を自動化するためのツールとして以前から使われています。最近はAIとの連携機能も強化され、AIを使った新しい自動化が可能になりました。例えば、「メールの内容をAIで要約してチャットツールに通知する」といったワークフローが作れます。400種類以上の外部サービスと連携できる汎用性があり、完全にノーコードだけでなく、コードを書いてより柔軟な処理も組み込めるため、技術者にも適しています。こちらもオープンソース版とクラウド版があります。
Gumloop
Gumloopは、AIワークフローに特化した比較的新しいサービスです。UIが直感的で使いやすいと評価されています。Gumloopの大きな特徴は、Chromeブラウザの拡張機能と連携できる点です。これにより、Webサイト上で行う操作(情報の取得や入力など)をワークフローに組み込み、AIと連携させて自動化できます。これは、AIを使った軽量なRPA(ロボットによる業務自動化)のような使い方ができるということです。現在は主にクラウドサービスとして提供されており、ビジネス部門での定型タスク自動化に役立ちます。
まとめ
Dify、n8n、Gumloopは、それぞれ得意な分野や特徴が異なります。Difyは生成AIアプリ開発、n8nは汎用的なサービス連携とAIの組み合わせ、GumloopはAI特化とWeb操作連携が強みです。作りたいものや必要な機能、技術レベルに合わせて、最適なツールを選ぶことが大切です。
引用元: https://note.com/_kayato/n/ncb305c10c9d7
最新の生成AI市場では、OpenAIの「GPT-4.1」、Anthropicの「Claude 3.7 Sonnet」、Googleの「Gemini 2.5 Pro」、xAIの「Grok 3」という主要な大規模言語モデル(LLM)が競争を繰り広げています。この記事では、これらのLLMがそれぞれどのような特徴を持ち、どのような用途に適しているかを比較しています。新人エンジニアの皆さんが、今後LLMを業務で活用したり、どのモデルを選ぶかの参考にしたりする際に役立つ情報がまとめられています。
まず、チャットボットとしての性能では、GoogleのGemini 2.5 Proが人間の評価で最も高いスコアを獲得しており、自然な対話が得意なため、一般消費者向けのカスタマーサポートなどに期待されています。OpenAIのGPT-4.1は、複数のやり取りが続く会話の質が向上し、過去の発言をうまく踏まえた応答ができるようになりました。これにより、複雑な問い合わせが多い金融や医療分野でのサポートで力を発揮すると考えられます。AnthropicのClaude 3.7 Sonnetは、一度に非常に多くの文章(約15万単語)を読み込める能力(コンテキストウィンドウが広いと言います)が特徴です。そのため、分厚いマニュアルやたくさんの情報を参照しながら回答する必要がある技術サポートなどで強みを発揮します。xAIのGrok 3は、もともと高い会話能力で知られており、特に若い世代向けのカジュアルな対話や、状況に合わせて柔軟な話し方ができる点が特徴です。また、これらのLLMは、ユーザーの感情を読み取って、AIだけでは難しいと判断した場合に人間の担当者へ引き継ぐ、といった高度な使い方もできるようになっています。
次に、プログラムコードを書いたり修正したりするコーディング支援としての性能です。この分野で特に優れていると評価されているのがClaude 3.7 Sonnetです。コードの問題を見つけて修正するテストで高い正解率を示しており、特に大規模なプログラムコードを扱う開発に適しています。実際の開発者からも「実践で使える質の高いコードを生成できる」と評価されています。OpenAIのGPT-4.1もコーディング性能が大幅に向上しており、特に既存コードの変更や修正作業を効率化するのに役立ちます。GoogleのGemini 2.5 Proは、自動化ツールと組み合わせることで、複数のプログラムファイルにまたがるような複雑なコーディングタスクで高い能力を発揮し、Webアプリケーション開発の支援などに期待できます。Grok 3は、「思考モード」というじっくり考えてエラーを修正したり別の方法を探したりする機能を使うことで、複雑なプログラミング課題で高いスコアを出しています。
このように、最新のLLMはそれぞれに得意なことや特徴があり、どのような目的で使いたいかによって最適なモデルが異なります。この記事を参考に、皆さんの業務や開発に合ったLLM選びをしてみてください。
引用元: https://www.sbbit.jp/article/cont1/163498
VTuberのしぐれういさんが風邪で声が出ない中、工夫を凝らした配信を行いました。過去の自身の声を使った「しぐれういボタン」や、音声合成技術による「ずんだもん」の声を活用。状況説明はずんだもん、コメントへの応答は高速タイピングでの筆談と、様々な手法を駆使して視聴者を楽しませました。声が出ないという困難を技術とアイデアで乗り越えた配信は「神対応」と話題になりました。
引用元: https://www.appbank.net/2025/05/13/vtuber/2769611.php
(株式会社ずんだもんは架空の登場組織です)