マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260615

2026年06月15日

内容紹介

Z.ai launches GLM-5.2 with a 1-million-token context window ahead of an MIT-licensed release next week、AIはもうクラウド不要？Googleが公開したローカルAIモデル『Gemma 4 12B』の衝撃 DXマガジン、最新AI「Claude Fable 5」が敗北。55の産業ツールを操る究極の実務ベンチマーク「ALE」でGPT-5.5が首位を獲得した理由、ウェブ版「Google Earth」にて“フライトシミュレータ機能”が全ユーザーで利用可能に。「操作が難しいけど面白い」「めちゃくちゃ時間が溶ける」と話題

出演者

春日部つむぎ

youtube版(スライド付き)

関連リンク

Z.ai launches GLM-5.2 with a 1-million-token context window ahead of an MIT-licensed release next week

Z.ai（Zhipu AI）は、コーディングおよび複雑なタスクの自律処理に特化した最新のフラグシップAIモデル「GLM-5.2」を発表しました。このモデルは、開発者にとって非常に実用的で強力な機能と、オープンソース化へのロードマップを備えています。

主な特徴と技術的ポイント

100万トークン（1M）の超巨大コンテキストウィンドウ 「コンテキストウィンドウ」とは、AIが一度に理解・処理できるテキストの長さのことです。100万トークンという圧倒的な大容量により、巨大なソースコード群やプロジェクト全体のドキュメントを丸ごとAIに読み込ませることが可能になります。これにより、システム全体の文脈を理解した上での高度なコーディング支援や、長期にわたるタスクを自律的に実行する「AIエージェント」の構築が現実的になります。
2段階の「思考レベル」のサポート GLM-5.2は、推論の深さに応じて「High」と「Max」という2つの思考レベル（Thinking-effort levels）を選択できます。特に複雑なコーディング作業においては、より深く推論を行う「Max」を使用することで、より正確で信頼性の高いコードを生成することができます。
MITライセンスでのオープンソース（OSS）化 最大の注目点は、来週に「MITライセンス」でオープンソースとして一般公開される予定であることです。MITライセンスは商用利用や改変、再配布の制限が非常に緩いため、世界中のエンジニアが自由にカスタマイズして、自社のシステムやプロダクトに組み込むことができます。

提供状況と今後のスケジュール

現在利用可能な環境: すでにGLM Coding Plan（Lite、Pro、Max、Teamプランなど）を契約しているユーザー向けに先行リリースされています。「Claude Code」や「Cline」などの人気な開発補助ツールを介して、すでに実務への導入が可能です。
来週の予定: API（システム連携用のインターフェース）の提供と、ブラウザから手軽に使えるチャットボットサービスが開始されます。同時に、モデル自体のオープンソース公開も行われる予定です。

新人エンジニアに向けた意義

このモデルの登場により、私たちは「開発プロジェクト全体のソースコードをAIに見せながら質問・相談する」という贅沢な開発体験を、より身近に（そしてオープンな技術として）得られるようになります。AIが単に数行のコードを提案するだけでなく、システム全体を俯瞰してバグを修正したり、新機能を提案したりすることが可能になります。日々の学習やトラブルシューティングの強力な相棒になる可能性を秘めており、来週のAPI公開やOSSリリースは見逃せないイベントです。

引用元: https://digg.com/tech/ii9xibgn

AIはもうクラウド不要？Googleが公開したローカルAIモデル『Gemma 4 12B』の衝撃 DXマガジン

Googleが発表した「Gemma 4 12B」は、一般的なノートPC（16GB程度のメモリ）のローカル環境で動作する、高性能な「中型マルチモーダルAIモデル」です。クラウド不要で、高度なAI処理を自分の手元（エッジ環境）で完結させられる技術として、エンジニアの間で大きな話題となっています。

1. 16GBのPCで「AIエージェント」がサクサク動く Gemma 4 12Bは、上位の大型モデル（26B）に近い高い推論能力を持ちながら、必要なメモリ容量は半分以下に抑えられています。さらに、応答速度を向上させる「マルチトークン予測（MTP）ドラフター」を搭載。ネットに繋がらない完全オフラインの環境でも、音声の文字起こしや翻訳、自律的に動く「AIエージェント」のタスクを高速に実行可能です。

2. 仕組みの革新：エンコーダ不要の「直接統合」設計 従来のマルチモーダルAIは、画像や音声といった異なるデータを、別々の専用翻訳機（エンコーダ）で処理した後に言語モデルへと渡していました。このやり方は、処理の遅延（レイテンシ）とメモリ負荷を増やす原因となっていました。 Gemma 4 12Bではこのボトルネックを解消。視覚データは軽量な埋め込みモジュールで処理し、音声データは生の信号のまま言語モデルの心臓部（バックボーン）に直接流し込む設計を採用しました。このシンプルなアーキテクチャが、ローカルでの超高速動作とメモリ効率の向上に直結しています。

3. 開発者に嬉しいオープンライセンスと高い互換性 本モデルは「Apache 2.0」ライセンスで公開されており、実務でも非常に扱いやすいのが特徴です。すでにエンジニアの間で広く普及しているローカル実行ツールの「Ollama」や「LM Studio」、推論ライブラリの「llama.cpp」や「vLLM」に対応しています。モデルは「Hugging Face」や「Kaggle」から簡単に入手でき、効率的な微調整（ファインチューニング）ツールである「Unsloth」もサポートしています。もちろん、Google Cloudを用いたクラウドへのスムーズなスケールアップも可能です。

インフラコストの削減や強固なデータプライバシー、超低遅延を求められる現代のサービス開発において、ローカルマルチモーダルAIの新たな基準となる極めて重要なモデルです。

引用元: https://dxmagazine.jp/news/ykmt26/

最新AI「Claude Fable 5」が敗北。55の産業ツールを操る究極の実務ベンチマーク「ALE」でGPT-5.5が首位を獲得した理由

従来のAI性能評価（ベンチマーク）は、学習データの汚染や、AI自身に採点させる「自己採点方式」の蔓延により、実務能力を正確に測れていませんでした。この課題を解決するため、UCバークレー等の専門家集団が開発したのが、新たな実務ベンチマーク「ALE（Agents’ Last Exam）」です。

1. 新ベンチマーク「ALE」の画期的な特徴

ALEは、AIが単にテキストを生成するだけでなく、PC上で人間のように専門ツールを操作して実務を完遂できるかを測定します。

厳格な決定論的採点: 「AIによる曖昧な採点」を排除し、成果物のバイト列や3Dデータの数値など、数学的・物理的な証拠に基づき93%以上のタスクを厳密に自動採点します。
データ汚染の防止: 問題の約90%を非公開とし、定期的に問題を入れ替える「ローリングリリース」を採用。AIの「過去問の丸暗記」を防ぎます。
広範な実務領域: 3Dモデリングやゲノム解析など55の専門領域を網羅し、画面認識（視覚）とツール操作（動作）を高度に連携させる必要があります。

2. GPT-5.5の首位獲得と、Claude Fable 5の敗因

初の評価テストでは、OpenAIの「GPT-5.5」が合格率24.0%で首位を獲得し、最新の「Claude Fable 5」は22.0%で3位に沈みました。

複雑な指示への追従性: 長期的な作業において、Claudeは途中で指示を忘れる傾向が見られた一方、GPT-5.5は高い追従性と安定性を示しました。
圧倒的なコスト格差: 1タスクあたりの推論コストは、GPT-5.5が約3.80ドルであるのに対し、Claude Fable 5は約15.70ドルと高額。実用化において、力技の巨大モデルから「低コストな特化型モデルの組み合わせ」へのシフトを示唆しています。

3. 明確になったAIの「限界」とエンジニアへの道標

最難関のタスクにおいて、全モデルの平均合格率はわずか2.6%でした。失敗の約75%はツールの操作方法ではなく、「ドメイン（専門分野）の知識不足」や「出力結果を目視でセルフチェックする仕組みの欠如」に起因しています。

ALEは、AI万能論の幻想を打ち砕くと同時に、AIが実務で活躍するために解決すべき具体的な課題を可視化しました。新人エンジニアにとっても、AIの強みと限界を理解し、協働するための重要な開発ロードマップを示すものとなっています。

引用元: https://xenospectrum.com/agents-last-exam-benchmark-gpt-5-5-beats-claude-fable-5/

ウェブ版「Google Earth」にて“フライトシミュレータ機能”が全ユーザーで利用可能に。「操作が難しいけど面白い」「めちゃくちゃ時間が溶ける」と話題

Googleはウェブ版「Google Earth」で「フライトシミュレータ機能」を全ユーザー向けに公開しました。メニューの「ツール」から起動でき、キーボードやマウスで操縦して世界中を探索できます。墜落しても即座に再開できる手軽さの一方、3Dデータの動的ストリーミングを伴うため通信環境の影響を受けます。新人エンジニアの息抜きや、地図データのレンダリング技術を体感するのにも最適な面白い機能です。

引用元: https://news.denfaminicogamer.jp/news/260614j

お便り投稿フォーム

VOICEVOX:春日部つむぎ