株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

私立ずんだもん女学園放送部 podcast 20260605

2026年06月05日

MP3ファイルをダウンロード

内容紹介

Dreaming: Better memory for a more helpful ChatGPT、NVIDIA Nemotron 3 Ultra Powers Faster, More Efficient Reasoning for Long-Running Agents、VoidZero is Joining Cloudflare、Cloudflare Agentsで自分をマイクロマネジメントするAIを作った

出演者

お嬢様ずんだもん
お嬢様ずんだもん

youtube版(スライド付き)

関連リンク

OpenAIは、ChatGPTにおいてユーザーの過去の会話文脈をより賢く、効率的に記憶・整理するための新しいメモリシステム「Dreaming(ドリーミング)」の大幅なアップデートを発表しました。この技術は、長期間にわたる多数のユーザーとの対話における「情報の陳腐化」「正確性」「スケーラビリティ」といった技術的課題を解決するために開発されました。

■ メモリ機能の進化と「Dreaming」の仕組み ChatGPTのメモリ機能は、2024年にユーザーからの明示的な指示(「〜を覚えておいて」など)を記録する形で始まりました。しかし、これでは情報のアップデートが難しく、指示がないと忘れてしまうという課題がありました。 そこで2025年に導入されたのが「Dreaming」です。これは、AIがバックグラウンド処理(人間が寝ている間に夢を見て記憶を整理するようなプロセス)を通じて、自動的に過去の対話履歴を分析・要約し、メモリを最新状態に更新するシステムです。今回のアップデート(Dreaming V3)は、この仕組みをさらに高性能かつ計算効率よく再構築したものです。

■ Dreamingが実現する3つのコア体験 本システムは、エンジニアリングにおける「優れたメモリ」の要件として以下の3つを高度にクリアしています。

  1. 有用な文脈の引き継ぎ:過去に話した「自分のカメラ機材」などの前提情報を保持するため、次回からは「私のセットアップに互換性のあるパーツは?」と聞くだけで、個別具体的な提案が得られます。
  2. 好みの遵守:「ベジタリアン」や「静かな店が好き」といった個人の制約や嗜好を常に反映した回答を行います。
  3. 時間経過への適応:時間の経過を認識します。例えば「7月にシンガポールへ行く」という記憶は、旅行期間が過ぎると自動的に「過去に旅行した」と更新されます。これにより、帰国後に「今日の夕食のテイクアウトを提案して」と聞いた際に、旅行先ではなく現在の居住地に基づく提案を正しく行えます。

■ 技術的ブレイクスルーと展開 今回の新アーキテクチャにより、メモリの合成処理に必要な計算コストを約5分の1にまで劇的に削減することに成功しました。このコスト効率の向上により、これまで有料プラン(Plus/Pro)限定だった高度なDreamingシステムが、数週間以内に無料プラン(Free)ユーザーへも順次提供開始される予定です。

ユーザーは「メモリ概要(Memory Summary)」画面から、ChatGPTが覚えている自身の情報を一覧で確認し、手動で追加や修正、削除を行うことができます。効率的なパーソナライズ基盤として、今後のAIエージェント開発においても重要なマイルストーンとなるアップデートです。

引用元: https://openai.com/index/chatgpt-memory-dreaming

タイトル: NVIDIA Nemotron 3 Ultra Powers Faster, More Efficient Reasoning for Long-Running Agents

要約: NVIDIAは、長時間自律的に稼働する「AIエージェント」向けに最適化された新しいオープンLLM「NVIDIA Nemotron 3 Ultra」を発表しました。複数のツールやサブエージェントを組み合わせる複雑なワークフローにおいて、劇的な高速化とコスト削減を実現します。

1. 概要と優れたパフォーマンス 本モデルは、総パラメータ数550B(アクティブパラメータ数55B)のMixture-of-Experts(MoE)モデルです。エージェントがタスクを長期実行すると、会話履歴の肥大化によるコスト増や目的のブレ(ゴールズレ)が課題になります。本モデルはこれらを解決し、同クラスのオープンモデルと比較して「5倍のスループット(処理速度)」を達成。タスク完了までのトークンコストを「最大30%削減」することに成功しました。

2. 性能を支える革新的な技術

  • MambaとTransformerのハイブリッド: 長文脈を効率よく処理できる「Mamba」と、精密な情報回収が得意な「Transformer」を融合。長時間のタスクでも一貫した意思決定を維持します。
  • MOPD(複数教師による強化学習): 10以上の専門分野を持つ「教師モデル」から、本モデル自身が試行錯誤しながら学習する手法を採用。コーディングや高度な推論能力を効率よく向上させました。
  • NVFP4量子化: 1つのチェックポイントでHopperやBlackwellなど多様なNVIDIA GPUに対応。従来のBF16精度と比較して最大5倍のスループットを発揮します。
  • LatentMoE & 複数トークン予測(MTP): 効率的な専門家ルーティングと、一度に複数のトークンを予測する技術により、生成時間を大幅に短縮します。

3. 周辺ツールとライセンス 安全性確保のためのガードレールモデル「Nemotron 3.5 Content Safety」や、40カ国語以上に対応するリアルタイム音声認識モデル「Nemotron 3.5 ASR」も同時にリリース。また、開発者が安心して利用・改変できるよう、ライセンスはLinux Foundationの「OpenMDW-1.1」を採用しています。

Hugging FaceやNVIDIA NIM、主要クラウドで既に利用可能で、主要なエージェントフレームワーク(Hermes Agent、LangChainなど)とも連携できます。エージェント開発の未来を担う大注目のモデルです。

引用元: https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents/

フロントエンド開発で広く使われているビルドツール「Vite(ヴィート)」などの開発を主導する企業「VoidZero(ボイドゼロ)」が、クラウド大手の「Cloudflare(クラウドフレア)」に統合されることが発表されました。この統合は、モダンなWeb開発に携わる日本のエンジニアにとって非常に大きなニュースです。

1. VoidZeroと主要な開発ツール

VoidZeroは、人気フロントエンドフレームワーク「Vue.js」や「Vite」の作者であるEvan You氏が2023年に立ち上げた企業です。JavaScript/TypeScriptエコシステム全体を高速化する統一ツールチェーンの構築を目指し、以下の強力なツール群を提供してきました。

  • Vite / Vitest: 現代のWeb開発でデファクトスタンダード(事実上の標準)となっている、超高速なビルドツールとテストフレームワーク。
  • Rolldown: Rust製で極めて高速な次世代バンドラー。最新のVite 8でデフォルトとして採用されています。
  • Oxc / Oxlint / Oxfmt: Rustで書かれた超高速なJavaScript解析ツール群。従来のESLintやPrettierと互換性を保ちながら、数十倍の高速化を実現しています。

2. Cloudflareとの統合に至った背景

Viteは週1億回以上ダウンロードされるなど爆発的に普及しましたが、オープンソース・ソフトウェア(OSS)単体でのビジネス的な収益化(マネタイズ)には課題を抱えていました。 そこでVoidZeroは、OSSのロードマップや開発方針を歪めずに相乗効果を生み出せるサービスとして、Cloudflareのインフラ上で動作するViteネイティブなデプロイプラットフォーム「Void」の開発を始めました。この開発を通じて両社のシナジーがより明確になり、チームを統合して互いの強みを最大限に活かす道が選ばれました。

3. 今後の影響と日本のエンジニアへのメリット

  • オープンソースとしての継続: Vite、Vitest、Rolldown、Oxcなどの主要ツールは、今後もMITライセンスのオープンソースとして提供され、誰でも自由に無償で利用できます。開発チームも引き続きEvan You氏らが主導します。
  • AI時代への適応: 近年、AIエージェントによる自動化ツールや開発支援が増加しています。今後は「AIエージェントのためのクラウド」を目指すCloudflareと手を取り合い、人間だけでなくAIにとっても摩擦のない、次世代の開発・デプロイ環境の構築を目指します。

この統合により、フロントエンドツールの開発体制がより強固になり、Cloudflareのクラウドインフラとの親和性も一層高まります。新人エンジニアの皆様にとっても、将来にわたり信頼して学べる強力な開発環境が保証されたと言える、非常にポジティブなニュースです。

引用元: https://voidzero.dev/posts/voidzero-cloudflare

Cloudflare Agentsを活用し、Obsidianのタスクを元に能動的に自身をマイクロマネジメントするAIエージェント「Kuro」の開発事例です。受動的なチャットボットとは異なり、進捗確認などをTelegram経由で自発的に話しかけてくれます。安全性を考慮し、メモの書き換えは直接行わず変更差分を提案する設計です。個人開発におけるCloudflareの有用性やプロンプト調整の工夫が紹介されています。

引用元: https://odiak.net/cloudflare-agents-personal-micromanager

VOICEVOX:ずんだもん