株式会社ずんだもん技術室AI放送局 podcast 20260409
内容紹介
Introducing Muse Spark: Scaling Towards Personal Superintelligence、ALTK‑Evolve: On‑the‑Job Learning for AI Agents、macOS 26 TahoeのApple Intelligenceに利用されている3BパラメータのLLMをコマンドラインで利用できるようにするツール「apfel」がリリース。 AAPL Ch.、まさかのくずし字AI解読技術つながり 読み取り困難な「中世ギリシャ語」の文字起こしをTOPPANが開発したAIで行うプロジェクトがスタート、「ヴォイニッチ手稿も解読してくれ」
出演者
youtube版(スライド付き)
関連リンク
Meta Superintelligence Labsは、個人向けの「超知能(Superintelligence)」の実現に向けた第一歩となる新モデル「Muse Spark」を発表しました。このモデルは、ネイティブでマルチモーダルな推論、ツール利用、そして「マルチエージェント・オーケストレーション」を統合した、極めて野心的なシステムです。
1. 圧倒的な推論能力と「熟考モード」 Muse Sparkの大きな特徴は、複数のエージェントを並列で走らせて推論を行う「熟考(Contemplating)モード」です。これにより、Gemini Deep ThinkやGPT Proといった競合の最先端モデルに匹敵する、極めて高度な論理的思考を可能にしています。難解な科学研究や試験(FrontierScience Research等)においても、従来を大きく上回る高い正答率を叩き出しています。
2. 開発スタックの刷新による劇的な効率化 今回の発表で特筆すべきは、モデルの学習効率が劇的に向上している点です。Metaは事前学習スタックをゼロから再構築し、アーキテクチャやデータの選定プロセスを最適化しました。その結果、前モデルである「Llama 4 Maverick」と比較して、同じ性能に到達するために必要な計算量(FLOPs)を10分の1以下に削減することに成功しています。これは、限られたリソースでより高い知能を実現できることを意味します。
3. 「思考の圧縮」とテストタイム推論の進化 エンジニアとして注目したいのが、「思考の圧縮(Thought compression)」という概念です。強化学習(RL)を通じて、モデルが回答前に「考える」プロセスを学習していますが、単に長く考えるだけでなく、トークン効率を最大化するように訓練されています。これにより、少ないトークン数で深く正確な推論を行うことが可能になりました。また、複数のエージェントを並列稼働させることで、応答の遅延(レイテンシ)を抑えつつ知能レベルを引き上げています。
4. 実践的なアプリケーション:健康と日常生活 Muse Sparkは個人の生活に寄り添う設計がなされています。特に「健康」分野では、1,000人以上の医師と協力して訓練データを作成しており、栄養分析や運動解説など、視覚的かつ専門的なフィードバックを生成します。また、カメラで写した家電の修理を支援したり、対話を通じてミニゲームを作成したりといった、マルチモーダルな体験も強化されています。
5. 安全性と信頼性 高度な知能を持つゆえに、安全性も重視されています。生物・化学兵器やサイバー攻撃のリスクに対して厳格なガードレールが設けられています。また、モデルが「自分がテストされている」ことを認識する「評価意識」についても調査が行われており、高い透明性を持って開発が進められています。
Muse Sparkは、AIが単なる検索ツールから、個人の能力を最大限に引き出す「パーソナルなパートナー」へと進化する、テクノロジーの大きな転換点を示すプロダクトと言えます。
引用元: https://ai.meta.com/blog/introducing-muse-spark-msl/
AIエージェントの導入が進む中で、多くのエンジニアが直面するのが「エージェントが同じ間違いを繰り返す」という課題です。本記事では、IBM Researchが開発した、エージェントが実務を通じて「知恵」を蓄積し、成長するための長期記憶システム「ALTK-Evolve」を紹介しています。
1. 「永遠のインターン」問題の解消
従来のAIエージェントは、過去のログ(実行履歴)を読み直すことはできても、そこから「教訓」を得て新しい状況に応用することが苦手でした。これは、レシピは暗記しているが「このオーブンは火力が強い」といった現場特有のコツを学習できない「永遠のインターン」のような状態です。ALTK-Evolveは、実行履歴をそのまま読み返すのではなく、汎用的な「ガイドライン」へと昇華させることで、この問題を解決します。
2. システムの仕組み:知識のサイクル
ALTK-Evolveは、以下の連続的なループによってエージェントを成長させます。
- 観測と抽出(Downward flow): エージェントの思考、ツールの呼び出し、結果などの一連の流れ(トレース)をキャプチャし、構造化されたパターンとして抽出します。
- 洗練と蓄積(Upward flow): 抽出された候補から重複を排除し、効果的な戦略をスコアリングします。質の高いルールだけを「ガイドライン」や「標準作業手順書(SOP)」としてライブラリ化します。
- ジャストインタイムの適用: 次のタスク実行時、関連するガイドラインのみを検索してコンテキストに注入します。これにより、不要な情報でコンテキストを埋めることなく、必要な知見だけを活用できます。
3. 圧倒的な成果
ベンチマーク(AppWorld)を用いた評価では、特に複雑なマルチステップのタスクにおいて、信頼性が大幅に向上しました。難易度の高いタスク(Hard)では、成功率がベースラインの19.1%から33.3%へと14.2ポイント(相対的に約74%)も向上しています。これは、エージェントが単なる「手順の丸暗記」ではなく、状況に応じた「判断力」を獲得していることを示しています。
4. エンジニアへの示唆
新人エンジニアにとっても、このアプローチは非常に学びが多いものです。「ログを溜めるだけでは不十分で、そこから汎用的な原理を抽出することが成長の鍵である」という、人間自身のスキルアップにも通じる教訓を提示しています。ALTK-Evolveは、Claude Codeなどの既存ツールへの統合も進んでおり、AIエージェントを「ただのツール」から「共に成長するパートナー」へと進化させる重要な技術となるでしょう。
プロジェクトの概要と制約
本プロジェクトは、AIエージェントの信頼性と汎用性を高めるための長期記憶サブシステムを提供します。主な制約として、メモリの肥大化を防ぐためのスコアリングとフィルタリングが必須であり、現在の実装では特定のフレームワークやMCP(Model Context Protocol)を介した統合が推奨されています。詳細な使い方は公式のリポジトリやドキュメントをご確認ください。
引用元: https://huggingface.co/blog/ibm-research/altk-evolve
macOS 26 Tahoeで提供される「Apple Intelligence」の核となる3B(30億)パラメータのLLM(大規模言語モデル)を、ターミナルから手軽に扱えるようにするオープンソースツール「apfel」が登場しました。これは、Appleが開発者向けに公開している「FoundationModels」フレームワークを利用し、Macに内蔵されたオンデバイスAIモデルをCLI(コマンドラインインターフェース)から直接呼び出すためのものです。
最大の特徴は「完全ローカル・プライバシー重視」である点です。外部サーバーへのデータ送信が一切行われず、APIキーの取得やクラウドサービスの契約も不要です。セキュリティが厳しい開発環境や、機密性の高いデータを扱う際でも安心して利用できます。エンジニアにとって、使い慣れたターミナル上でチャット、文章作成、ドキュメントの要約、翻訳ができるだけでなく、Unix哲学に基づいた他のコマンドとのパイプ連携が可能になる点は、作業自動化の面で大きなメリットとなります。
また、開発者向けの拡張性も考慮されており、OpenAI APIと互換性のあるサーバー機能や、最新のAI連携プロトコルであるMCP(Model Context Protocol)もサポートされています。これにより、ブラウザベースのGUI(apfel-gui)を利用したり、他のAIアシスタントツールからMac内のAIを呼び出したりといった柔軟な運用が可能です。
【制約およびシステム要件】
- 動作環境: macOS 26 Tahoe以降がインストールされた、Appleシリコン(M1チップ以降)搭載のMacが必要です。
- コンテキスト制限: 処理できるコンテキスト長は4,096トークンに制限されています。これは日本語に換算すると約2,000文字程度となるため、非常に長いドキュメントを一度に処理する場合には、内容を分割するなどの工夫が必要です。
- 依存関係: インストールにはHomebrewが必要ですが、ツール自体の実行には外部ライブラリやインターネット接続への依存はありません。
新人エンジニアの方々にとって、高価なGPUサーバーやクラウド料金を気にすることなく「自分のMacの中で高品質なLLMが動く」体験ができるこのツールは、AIの仕組みや活用方法を学ぶための優れた入門ツールとなるでしょう。
引用元: https://applech2.com/archives/20260407-apfel-cli-access-apple-on-device-llm.html
TOPPANが、日本の「くずし字」解読で培ったAI画像認識技術を応用し、解読困難な「中世ギリシャ語」を文字起こしするプロジェクトをヴァチカン教皇庁図書館と開始しました。中世ギリシャ語は字形の揺れや分かち書きの欠如が課題でしたが、くずし字解読のノウハウが有効に機能した形です。日本の独自技術が時空を超えて西洋の歴史解明に貢献するという、エンジニアの探求心を刺激する夢のあるAI活用事例です。
引用元: https://togetter.com/li/2683580
(株式会社ずんだもんは架空の登場組織です)