私立ずんだもん女学園放送部 podcast 20260522
内容紹介
An OpenAI model has disproved a central conjecture in discrete geometry、Appleが神アプデ! ネット不要で安全なオンデバイスAIを自分のアプリに直接組み込める『Foundation Modelフレームワーク』の近未来UX DXマガジン、NVIDIA-Verified Agent Skills Provide Capability Governance for AI Agents、この前、魔の2歳児の対応についてGeminiに質問したら、「〇〇くんは~」と固有名詞を出され、「どこからその名前を参照しましたか?」と聞くとハルシネーションだった話
出演者
youtube版(スライド付き)
関連リンク
OpenAIが開発した新しい汎用推論AIモデルが、数学界で約80年間未解決だった難問「エルデシュの単一距離問題」の予想を覆す証明を自律的に導き出しました。AIが数学の主要な未解決問題を人間の手を借りずに解決したのは史上初の快挙であり、AIと人間による共同研究の新たな未来を示す重要なマイルストーンとなりました。
1. 解決された難問「単一距離問題」とは?
この問題は、1946年に天才数学者ポール・エルデシュが提唱した離散幾何学の超有名問題です。「平面上に $n$ 個の点を置くとき、距離がちょうど『1』になる点のペアは最大で何個作れるか?」という非常にシンプルな問いです。 これまでは「格子状(正方形グリッド)に並べる方法」がほぼ最適であり、これ以上のペースでペア数を増やす配置は存在しない($n^{1+o(1)}$ が上限である)と広く信じられていました。しかし、OpenAIのモデルはこの予想を覆し、それを上回る効率でペアを作れる「新しい点の配置ルール」が無限に存在することを証明しました。
2. なぜAIにこれができたのか?(技術的な驚き)
今回のブレイクスルーには、エンジニアにとっても注目すべき2つのポイントがあります。
- 汎用推論モデルによる自律的な解決: この証明は、数学専用にファインチューニングされたAIや、特定の検索アルゴリズムを組み込んだシステムではなく、新世代の「汎用推論モデル」によって達成されました。これは、AIが「長大で複雑な論理の鎖を、破綻させずに組み立てる高い推論能力」を手に入れた証拠です。
- 異分野の知識を融合する「独創性」: 幾何学の問題に対し、AIは一見関係のなさそうな「代数的数論」という全く別の数学分野の高度な理論(無限類体塔など)を組み合わせて解決策を提示しました。これは単なるデータの学習やパターンの暗記ではなく、異なる知識を結合して新しいアイデアを生み出す「創造的な思考」がLLMに可能であることを示しています。
3. 私たちエンジニアにとっての意味
この成果は、数学の世界に留まらず、AIが今後のあらゆるエンジニアリングや科学研究の強力な「パートナー」になる未来を強く予感させます。 複雑なソフトウェアアーキテクチャの設計、高度なバグの検出、物理や材料科学における新発見など、厳密な論理的整合性が求められるタスクにおいて、AIは人間のアシスタントを超え、人間が思いつかないような革新的なアプローチを自発的に提案してくれる存在になりつつあります。 「AIが人間の仕事を奪う」という悲観的な見方ではなく、「人間が解くべき重要な問い(プロンプトや課題設定)を決め、AIがその独創的な思考力で探究を加速させる」という、人間とAIのワクワクするような協働の形が、まさに始まろうとしています。
引用元: https://openai.com/index/model-disproves-discrete-geometry-conjecture
本記事は、Appleが提供を開始した「Apple Intelligence」の最新アップデートと、それに関連する開発者向けの新フレームワークについて解説しています。これにより、アプリ開発者はセキュリティの高いオンデバイスAI機能を、極めて簡単に自作アプリへ組み込めるようになります。
■ 1. 開発者待望の「Foundation Modelフレームワーク」 最も大きな技術的革新は、Appleの「オンデバイス基盤モデル」に直接アクセスできる新しい開発環境(フレームワーク)の提供です。
- 完全なオンデバイス動作:インターネット接続を一切使わずにAI処理がデバイス内で完結します。データが外部に送信されないため、個人情報や機密データを扱うアプリでも安全に利用できます。
- わずか3行のコードで実装:Swiftにネイティブ対応しており、最小限(わずか3行)のコードを記述するだけで、高度なAIモデルを呼び出せます。これまで膨大だったAIの組み込みコストが劇的に削減されます。
- 手軽なAI機能の実装:テキストの要約、データ抽出、ガイド付きテキスト生成、他のツールとの連携といった高度な機能を、既存のiOSアプリやゲームへスムーズに実装できます。
■ 2. 画面をすべて認識する「ビジュアルインテリジェンス」 ユーザーが体験する操作性(UX)も大きく進化します。
- 画面そのものを検索・解析:iPhoneに表示されている「現在の画面」をAIが瞬時に認識します。スクリーンショットを撮るような手軽さで、画面上のコンテンツについて質問やアクションが可能です。さらに「App Intent」を介して自作アプリの検索機能を統合すれば、現実世界のオブジェクトをも含めた横断検索に対応できます。
- ショートカット「Use Model」による自動化:ショートカットアプリに新機能が追加され、AIの応答を他の自動化タスクに直接引き渡せるようになります。
■ 3. クリエイティブ表現の拡張 「ジェン文字」での髪型などの詳細なカスタマイズ機能や、「Image Playground」における表情のコントロール、さらに外部のChatGPT連携による多様なデザインスタイルの利用など、表現力も高まっています。
■ まとめ(新人エンジニアへのメッセージ) 従来、高度なAIをアプリに組み込むには、クラウドサーバーの構築や複雑なAPI連携、コスト管理が必要でした。今回のアップデートにより、それらが「ローカルかつ数行のコード」で実現可能になります。これはモバイルアプリ開発のあり方を根底から変える出来事であり、ユーザーが「AIを使っている」と意識しない、極めて自然な次世代のユーザー体験(UX)を作るための強力な武器になります。
引用元: https://dxmagazine.jp/news/2620ty-23/
AIエージェント(自律的にタスクを実行するAIシステム)の進化に伴い、エージェントに「どのような能力(スキル)を持たせるか」を安全に管理・統制(ガバナンス)する重要性が高まっています。NVIDIAが発表した「NVIDIA-Verified Agent Skills(検証済みエージェントスキル)」は、エージェントが使用するスキル(指示やツールのセット)の信頼性を担保し、安全にエージェントを拡張・運用するための新しい仕組みです。
1. 背景と課題:なぜ「スキルの検証」が必要なのか? 従来のAIエージェントの安全対策は、実行時に不適切な入出力を制御する「ガードレール(実行時制御)」が中心でした。しかし、ビジネスの現場でエージェントを本格的に活用するには、エージェントに組み込む「機能(スキル)」そのものの安全性や透明性を事前に担保する仕組みが必要です。信頼できないスキルを読み込んでしまうと、予期せぬ動作やセキュリティリスクにつながるためです。
2. NVIDIA-Verified Agent Skillsの4つの特徴 検証済みのスキルは、オープンな仕様(agentskills.io)に基づいて構築されているため、Claude CodeやCursorなどの主要なAIコーディングアシスタントでも共通して安全に利用できます。主な特徴は以下の通りです。
- Skill Card(スキルカード): スキルの役割、作成者、ライセンス、依存関係、既知のリスクや制限事項などを機械可読な形式(YAML等)で記載した「透明性の高い説明書」です。
- SkillSpectorによる事前スキャン: スキルが公開される前に、従来のソフトウェアの脆弱性だけでなく、プロンプトインジェクションや隠された指示、不要な権限の要求といった「AIエージェント特有のリスク」を自動で検出・ブロックします。
- 暗号署名による保証: ダウンロードしたスキルが改ざんされておらず、NVIDIAが公式に提供したものであることを証明するためのデジタル署名が付与されています。
- 公式チームによる日次同期: NVIDIAの製品チームが管理し、毎日最新の状態にアップデートされるため、常に正しく安全なスキルを利用できます。
3. 新人エンジニアに向けたポイント 実務でAIエージェントを構築する際、ただ動くだけでなく「システム全体の安全性と信頼性(ガバナンス)」を考慮することが不可欠です。本技術は、エージェントの能力を安全に流通させるための先駆的な取り組みであり、今後の安全なAI開発において必須となる「責任あるAI(Trustworthy AI)」の考え方を学ぶ上で、非常に参考になる仕様です。
引用元: https://developer.nvidia.com/blog/nvidia-verified-agent-skills-provide-capability-governance-for-ai-agents/
あるユーザーがGeminiに子供の相談をした際、教えていない子供の実名を提示され、AI側が「ハルシネーション(もっともらしい嘘)」と釈明した体験談です。偶然にしては不自然なため、Chromeの履歴やGoogleアカウントのアクティビティ、セッションを横断する「ユーザーサマリー(メモリ)」機能等を通じて、AIが裏で個人情報を参照している可能性が議論されており、AI利用時のデータ管理の重要性を学べます。
引用元: https://togetter.com/li/2699548
VOICEVOX:ずんだもん