私立ずんだもん女学園放送部 podcast 20260612
内容紹介
OpenAI to acquire Ona、Introducing North Mini Code: Cohere’s First Model For Developers、Build AI-powered scripts with the fm CLI and Python SDK - WWDC26 - Videos - Apple Developer、「クロード!もういい!もどれ!」Claude Fableが50時間かけて「ポケモンFR」をクリア
出演者
youtube版(スライド付き)
関連リンク
概要:OpenAIによる「Ona」の買収とAIエージェントの未来 OpenAIは、安全なクラウド実行環境とシステム管理(オーケストレーション)技術を持つ「Ona」を買収することを発表しました。この買収の目的は、OpenAIの開発者向けAI支援プラットフォームである「Codex」を強化し、自律的に動く「AIエージェント」をより実用的かつ安全に使えるようにすることです。
1. なぜOnaが必要なのか?「永続的」なAI作業の実現 現在、Codexは週に500万人以上のユーザーに利用されています。従来のAIツールは、人間が指示を入力して数秒〜数分で回答を得る「単発のやり取り」が中心でした。しかし、AIが人間の代わりに「テストの実行」「バグの修正」「システムの移行」といった複雑なタスクを自律的にこなす(エージェント化する)ようになると、作業時間は数時間から数日間に及びます。 ユーザーがPCを閉じたり、ブラウザのセッションを切ったりしても、AIがクラウド上で安全に作業を継続できる「永続的な(裏側で働き続けられる)実行環境」が必要です。Onaはこれまで、200万人以上の開発者に対してセキュアなクラウド開発環境を提供してきた実績があり、その知見と技術がCodexの次の進化に直接活かされます。
2. 企業が求める「セキュリティと管理性」の確保 AIエージェントを実際の業務システム(本番環境)で動かすためには、セキュリティや権限管理が極めて重要になります。機密データへのアクセス制限や、AIの操作ログの記録、人間の承認フローの構築などが必須です。 Onaの技術(顧客管理型の実行モデル)を導入することで、企業は自社のクラウド環境内で安全にAIエージェントを動作させることができるようになります。OpenAIが優れた「知能」を提供し、Onaの技術が「安全な実行境界(インフラ)」を担保することで、企業はデータ漏洩などのリスクを抑えながらAIの恩恵を最大化できます。
3. 今後の展望とエンジニアへの影響 買収手続き完了後、OnaのチームはOpenAIに合流し、開発のライフサイクル全体(テスト、脆弱性対応、複雑なワークフローの維持など)をAIが安全にサポートできる環境を作ります。 エンジニアにとっては、「AIに長時間の面倒な作業を任せ、自分は進捗の確認や最終的な意思決定に集中する」という、新しい開発スタイルが当たり前になる未来を引き寄せる重要なニュースです。
引用元: https://openai.com/index/openai-to-acquire-ona
Cohere社は、自律型AIエージェントによるソフトウェア開発に特化した、開発者向けの新しいコード生成モデル「North Mini Code」をApache 2.0ライセンスで公開しました。
本モデルは、総パラメータ数30B(300億)のスパースMixture-of-Experts(MoE)モデルであり、推論時にはそのうち3B(30億)のパラメータのみをアクティブにする軽量な設計です。それでありながら、同等クラスやさらに巨大な競合のオープンソースモデルを凌駕する極めて高いコーディング・エージェント性能を誇ります。
■ 主な特徴とアーキテクチャ ・ハイブリッド・アテンション: 局所的な処理を行うスライディングウィンドウと、全体を俯瞰するグローバルなアテンションを組み合わせることで、長文のコードも効率的に処理します。 ・MoE(混合専門家)構成: 128個の「専門家(エキスパート)ブロック」からなり、トークンごとに最適な8個をアクティブにします。これにより、無駄な計算を省きつつ高度な推論が可能です。
■ 高性能を実現する学習アプローチ(ポストトレーニング) 実世界で「動くAIエージェント」として機能させるため、以下の高度な学習プロセスが採用されています。
- 2段階のSFT(教師あり微調整): 1段階目で基礎的なコーディングや推論能力を学習させ、2段階目で検証済みの高品質なエージェント行動データ(最大128Kの長い文脈)を用いて専門性を高めました。
- 複数環境(ハーネス)への適応: AIエージェントが操作する開発環境やツール(SWE-Agent、OpenCodeなど)は多種多様です。複数の環境データを混ぜて学習させることで、予期せぬツール環境でも正しく機能する「頑健性(ロバスト性)」を獲得しました。
- 実証可能報酬を用いた強化学習(RLVR): コードが実際に実行可能か、ユニットテストをパスするかといった「結果」に基づいてモデルを強化しました。これにより、無駄なコードの繰り返しや、ツールの誤用、ハルシネーション(嘘の出力)が劇的に減少しました。
■ 評価と成果 人間による評価では、強化学習(RLVR)を行ったモデルは、SFTのみの段階と比較して「コード修正タスク」などで66.1%の勝率を収め、大幅な実用性の向上が確認されました。
新人エンジニアにとって、開発を強力にサポートしてくれる頼もしいAIエージェントの基盤となるモデルです。BF16版および軽量なFP8版の重みがすでに公開されており、APIやHugging Face経由で手軽に利用できます。
引用元: https://huggingface.co/blog/CohereLabs/introducing-north-mini-code
macOS 27で導入された、Appleの高性能なローカルAI(Apple Foundation Models)を、コマンドラインやPythonから手軽に操作できる新機能「fm CLI」と「Python SDK」についての解説です。これまでSwiftでの開発が中心だったAppleのAIモデルを、エンジニアが使い慣れているシェルスクリプトやPythonから直接呼び出せるようになり、開発や運用の効率が飛躍的に向上します。
1. ターミナルでAIを動かす「fm CLI」
macOS 27に標準搭載された fm コマンドを使うと、ターミナルから直接オンデバイスAIや、より高性能なPrivate Cloud Compute(PCC)のサーバーモデルを呼び出せます。
- 直感的な操作:
fm respond "質問"と入力するだけでAIから回答を得られます。テキストだけでなく、画像ファイルを渡して「このスクリーンショットに写っているアプリは何か」を解析させることも可能です。 - 構造化出力(JSON): AIの回答を指定したJSON形式に固定して出力させられます。これにより、プログラムで扱いやすいデータを取得できます。
- 業務の自動化: これらをシェルスクリプトに組み込むことで、「フォルダ内にある複数のファイルをAIに判定させ、最新版と下書きに自動で仕分ける」といった高度な自動化タスクが簡単に作れます。
2. アイデアを素早く形にする「Python SDK」
機械学習(ML)の分野で広く使われているPython向けに、ライブラリ apple_fm_sdk が提供されました(動作要件:Apple Silicon搭載Mac、Python 3.10以上、Xcode)。Swiftで本実装する前のプロトタイピングに最適です。
- ツール呼び出し(Tool Calling): AIが状況に応じて、自作したPythonプログラム(例:ユーザーの過去の注文履歴を取得する関数)を自発的に実行して回答に役立てることができます。
- 構造化生成(Guided Generation):
@fm.generableというデコレータを使うことで、AIの回答を特定のPythonオブジェクト(クラス)として直接受け取ることができます。パース処理を自作する必要がありません。
3. 豊富なエコシステムを活用した「プロンプト評価」
Python SDKを使う最大のメリットは、Jupyter Notebook、Pandas、matplotlibなどの強力なPythonエコシステムと連携できる点です。アプリに組み込むプロンプト(AIへの指示文)の回答精度をテストデータで自動採点し、グラフ化して分析する「評価パイプライン」を容易に構築できます。Swiftでアプリを作り込む前に、Python上でプロンプトの試行錯誤を高速に回すことができます。
まとめ
このアップデートにより、エンジニアは特別なAIインフラを用意することなく、手元のMac上で動く強力なローカルAIをスクリプトやアプリ開発に組み込めるようになりました。まずはターミナルを開いて fm respond を試したり、Python SDKを使って簡単なAIアシスタントを作ってみることから始めてみましょう。
引用元: https://developer.apple.com/videos/play/wwdc2026/334/
Anthropicの最新AIモデル「Claude Fable 5」が、人間の手助けなしに『ポケモン ファイアレッド』を約50時間で自律クリアしました。外部データは一切使わず、人間と同じようにゲーム画面の視覚情報だけを頼りに状況を判断し、ボタン操作を繰り返して殿堂入りを達成。高い画像認識能力と長期記憶力を証明しました。この高度な視覚処理技術は、今後のアプリ開発の自動化など実用的なビジネス分野への応用が期待されています。
引用元: https://www.sbbit.jp/article/cont1/185707
VOICEVOX:ずんだもん