株式会社ずんだもん技術室AI放送局 podcast 20250528
内容紹介
Build AI agents with the Mistral Agents API Mistral AI、DifyワークフローでDeepResearchを実現する、特化型大規模言語モデル『PLaMo翻訳』を公開しました - Preferred Networks Research & Development、庭に住み着いてる猫のためにいい将来を用意しようとしていたが、紆余曲折あって結局うちの猫になった話「律儀でワロタ」
出演者
関連リンク
Mistral AIが新しい「Agents API」を発表しました。これは、AIをもっと便利に、そして自分で考えて行動できる「エージェント」として使えるようにするためのものです。
従来のAIは、文章を作るのは得意でしたが、実際に何か行動したり、過去の会話の内容を覚えて続けて話したりするのが苦手でした。新しいAgents APIは、この課題を解決するために作られました。
Agents APIの主な特徴は以下の3つです。
- 組み込みコネクタ: AIエージェントがコードを実行したり、ウェブで情報を検索したり、画像を生成したり、独自のツール(MCPツール)を使ったりできるようになります。例えば、コード実行コネクタを使えば、AIが計算やデータ分析をしたりできます。ウェブ検索を使えば、最新の情報に基づいて応答できます。Document Libraryを使えば、アップロードしたドキュメントの内容を理解して応答(RAG)することも可能です。
- 永続的なメモリ: これまでの会話の内容をしっかり覚えています。これにより、スムーズで自然なやり取りが続き、文脈に沿った応答ができます。会話の途中から再開したり、話を分岐させたりもできます。
- エージェントのオーケストレーション: 複数のAIエージェントを連携させて、複雑なタスクをこなすことができます。例えば、情報収集が得意なエージェントと、分析が得意なエージェントを連携させ、タスクを分担させて解決にあたらせるといったことが可能です。タスクを別々のエージェントに引き渡す「ハンドオフ」機能も備わっています。
このAgents APIは、Mistralの既存のChat Completion APIとは異なり、AIエージェントを作るための専用のフレームワークです。これを使うことで、企業はAIをより実用的で効果的な方法で活用できるようになります。
この記事では、このAPIを使って作られたAIエージェントの具体例として、コードを書くのを手伝ってくれるアシスタントや、仕事のタスク管理をするアシスタント、金融分析をしてくれるアシスタントなどが紹介されています。(具体的な使い方については、Mistral AIが提供するcookbookなどで確認できます。)
この新しいAPIは、AIエージェント開発を進める上で非常に役立つ基盤となりそうです。興味を持った方は、ドキュメントを見て試してみてはいかがでしょうか。
引用元: https://mistral.ai/news/agents-api
この記事は、AIを活用してより深く包括的な調査を自動で行う「DeepResearch」と、それを実現するためのツール「Dify」について、新人エンジニアにも分かりやすく解説しています。
まず、「DeepResearch」とは、単にキーワードで検索するだけでなく、AIが検索結果を基に次に調べるべき情報を考え、段階的に調査を深めていく仕組みです。これにより、人間が何時間もかけて手動で行うような、インターネット上の様々な情報源から関連データを集めて分析・統合する複雑な調査タスクを、AIが短時間で効率的に自動化できるようになります。OpenAIがChatGPTに統合した機能としても注目を集めています。
次に紹介されている「Dify」は、プログラミングのコードを書かずに、画面上でブロックを組み合わせて生成AIを使ったアプリケーションやワークフロー(AIに一連の作業を行わせる手順)を作成できる便利なプラットフォームです。直感的な操作(GUI)で、ChatGPTやClaudeなど、様々な大規模言語モデル(LLM)を組み合わせてAIアプリを開発できます。
この記事では、Difyの「ワークフロー」機能を使ってDeepResearchを実現する方法が説明されています。DifyにはDeepResearchのテンプレートが用意されており、これを利用することで簡単に始めることができます。このワークフローの核心となるのは、「イテレーションブロック」という繰り返し処理を行う部分です。ユーザーが調べたいテーマを入力すると、AI(LLMノード)がそのテーマを出発点として、これまでに得られた情報から「次に何を調べたらもっと詳しくなるか?」という新たな検索トピックを生成します。そして、そのトピックで再度検索・分析を自動で繰り返します。
この繰り返し(イテレーション)は、ユーザーがあらかじめ指定した回数を行うか、AIが「もう十分な情報が集まった」と判断するまで続きます。このように、AIが自律的に次の調査項目を判断し、自動で深掘りしてくれることで、手動では難しい多角的で深いリサーチが可能になります。
実際にこのワークフローをDifyで動かしてみたところ、単なる概要に留まらない、関連情報を含んだ包括的な調査結果が得られたとのことです。また、AIがどのように考えて次のトピックを生成したかという思考過程も確認できるようです。
結論として、Difyのワークフロー機能を使えば、AIが連続的に検索・分析を行い、調査の深さを自動で調整するDeepResearchを実現できることが示されています。Bedrockなどのクラウドサービスとも簡単に連携でき、柔軟なAIモデルの選択肢があるDifyは、調査業務の効率化を目指すエンジニアにとって強力なツールとなりそうです。
引用元: https://acro-engineer.hatenablog.com/entry/2025/05/26/120000
Preferred Networks(PFN)とPreferred Elements(PFE)が、国のプロジェクト(GENIAC)の一環で、高性能かつ軽量な大規模言語モデル(LLM)の開発を進めています。その中で今回、翻訳に特化したLLM『PLaMo翻訳』を開発し、誰でも利用できるデモページとともに公開しました。
翻訳技術はルールベース、統計的、そして現在のニューラル機械翻訳(NMT)と進化してきました。NMTは高性能ですが、学習には対訳データが大量に必要だったり、長文や文脈を理解した自然な翻訳が難しかったりする課題がありました。
『PLaMo翻訳』は、従来のNMTとは異なり、「LLMベース翻訳」という新しいアプローチを採用しています。まず、Web上の大量のテキストデータを使って大規模言語モデル(PLaMo)を事前学習し、その後、翻訳タスク向けに追加学習(ファインチューニング)しています。これにより、対訳データに過度に依存することなく、文章全体の流れや文脈、そして日本語特有の表現などをより深く理解できるようになりました。
PLaMo翻訳の大きな強みはいくつかあります。 まず、Web上の多様な文章で学習しているため、論文のような堅い文章から物語のような柔らかい文章まで、原文の文脈や文体に合わせた自然で読みやすい翻訳が可能です。長い文章でも内容の一貫性を保てます。 また、国産モデルであるPLaMoが日本語を非常に多く学習しているため、手元でも動かせる規模のモデルながら、高い日本語⇔英語の翻訳性能を実現しています。特に、一般的な対訳データには少ない慣用句なども適切に翻訳できる例が紹介されています(例:「家計は火の車だ」を「Our household finances are in dire straits」と適切に翻訳)。
このPLaMo翻訳はPLaMo Community Licenseのもと公開されており、デモページでその性能を試すことができます。PFNは、このモデルは高い性能を持ち商用利用も可能だと考えており、関心のある企業からの相談も受け付けています。
PFN/PFEでは、今後もLLM開発を続け、翻訳性能のさらなる向上を目指していくとのことです。
引用元: https://tech.preferred.jp/ja/blog/plamo-translate/
庭に住み着いた野良猫「ごんた」の良い飼い主を見つけようとした漫画家さん。しかし、律儀で愛らしいごんたの姿に心奪われ、結局自分が家族として迎え入れることになりました。野良猫だったごんたが家猫になるまでの温かいエピソードと、ごんたのユニークな魅力に癒やされると評判です。
引用元: https://togetter.com/li/2555980
(株式会社ずんだもんは架空の登場組織です)