株式会社ずんだもん技術室AI放送局 podcast 20250121
内容紹介
AIやテクノロジーに関する記事を紹介 How Minimal Built a Multi-Agent Customer Support System with LangGraph & LangSmith、GitHub - deepseek-ai/DeepSeek-R1、共通テスト、AIの得点率91% 東大文1のボーダー超える、「アニメ、ずんだホライずん2を制作したい!」クラウドファウンディング内容説明
出演者
関連リンク
オランダのスタートアップMinimalは、LangChainのエコシステムを活用し、eコマースの顧客サポートを自動化するシステムを開発しました。このシステムは、顧客からの問い合わせを効率的に処理し、顧客満足度を向上させることを目指しています。
システムの概要 Minimalは、eコマース企業向けに、複雑な顧客サービス業務を自動化することに特化しています。基本的な問い合わせ(T1)だけでなく、より複雑な問い合わせ(T2, T3)にも対応できます。Zendesk, Front, Gorgiasなどの主要なサポートプラットフォームと連携し、顧客からの問い合わせに一元的に対応できます。AIは、下書きモード(コパイロット)または完全自動モードで顧客に対応し、注文のキャンセルや配送先住所の更新などのアクションも実行できます。
多層エージェントアーキテクチャ このシステムは、3つの主要なエージェントで構成される多層エージェントアーキテクチャを採用しています。
- プランナーエージェント: 問い合わせをサブ問題に分解します。
- リサーチエージェント: 関連するドキュメントや顧客プロトコルを検索し、情報を集めます。
- ツール呼び出しエージェント: 注文の払い戻しなどのアクションを実行します。
このアーキテクチャにより、複雑なタスクを効率的に処理し、エラーを減らすことができます。
LangSmithによるテストとベンチマーク 開発中、MinimalはLangSmithを使用してシステムを徹底的にテストしました。これにより、モデルの応答とパフォーマンスを追跡し、さまざまなプロンプトを比較し、エラーを特定し、プロンプトを改良することができました。
LangChainとLangGraphの選択理由 Minimalは、LangGraphのモジュール性を評価しました。これにより、柔軟にサブエージェントを管理し、カスタマイズされた機能を追加できます。また、Shopifyなどのeコマースサービスとの連携も容易に行えます。
結果と今後の計画 Minimalは、すでにオランダのeコマース企業から収益を上げており、ヨーロッパ全土への拡大を目指しています。多層エージェントワークフロー、LangChainエコシステム、および強力なeコマース統合を組み合わせることで、顧客サポートの自動化を推進しています。
引用元: https://blog.langchain.dev/how-minimal-built-a-multi-agent-customer-support-system-with-langgraph-langsmith/
DeepSeek-R1は、DeepSeek社が開発した大規模言語モデル(LLM)で、特に推論能力に焦点を当てています。このモデルは、教師あり微調整(SFT)なしで強化学習(RL)のみで訓練されたDeepSeek-R1-Zeroをベースに、コールドスタートデータを取り入れて改良されたDeepSeek-R1と、その推論能力を蒸留した軽量版モデル群で構成されています。 DeepSeek-R1-Zeroは、RLのみで複雑な問題解決能力(CoT)を獲得し、自己検証や反省といった高度な推論行動を示しました。一方、DeepSeek-R1は、RL前にコールドスタートデータを加えることで、より人間が理解しやすい形式で推論できるよう改善されています。 さらに、DeepSeek-R1の推論能力を蒸留した、QwenやLlamaをベースにした1.5Bから70Bパラメータの軽量モデル群も公開されており、特にDeepSeek-R1-Distill-Qwen-32Bは、様々なベンチマークでOpenAIの同規模モデルを上回る性能を示しています。 これらのモデルは、研究コミュニティでの利用を促進するためにオープンソースで公開されており、商用利用も可能です。リポジトリには、モデルのダウンロード方法、評価結果、ローカルでの実行方法などが記載されています。
引用元: https://github.com/deepseek-ai/DeepSeek-R1
2025年1月18、19日に実施された大学入学共通テストを、最新のAIモデル「o1」を用いて解かせたところ、得点率が約91%に達したという結果が報告されました。これは、東大文科一類の合格可能性50%ライン(86%)を上回る数値です。特に国語94%、英語リーディング98%と高い得点率を示しました。一方で、日本史は世界史に比べ学習データが少ない影響で79%とやや低い結果となりました。この結果は、AIが高度な学力を有していることを示すとともに、今後の教育や試験のあり方に一石を投じる可能性を示唆しています。
引用元: https://nordot.app/1253987498611343534
アニメ「ずんだホライずん2」制作のため、クラウドファンディングが開始されます。目標金額は2400万円で、アニメの尺は5分から10分程度を予定しています。前作のスタッフが再集結し、AI歌唱技術を活かしたミュージカルアニメを目指します。人型のずんだもんが登場し、他のキャラクターとのコラボや壮大なストーリー展開も計画されています。
リターンには、ストリーミング配信、動画データ、限定Blu-ray、CD、原画、アニメスタジオ見学など様々なコースが用意されています。特に、アニメ制作に使用するブルーバック動画素材を提供するユニークなプランも用意されており、個人クリエイターが非商用で利用できます。その他、旧作のBlu-rayやデータ集、ファンブックなどの特典もあります。
引用元: https://togetter.com/li/2495454
(株式会社ずんだもんは架空の登場組織です)