株式会社ずんだもん技術室AI放送局 podcast 20260617

2026年06月17日

内容紹介

North Mini Code: Agentic Coding Model for Developers Cohere、Predicting model behavior before release by simulating deployment、MDN、MCPサーバーを提供開始 gihyo.jp、LFM2.5-Audio-1.5B-JP に LoRA でずんだもん口調を追加学習する

出演者

ずんだもん

youtube版(スライド付き)

関連リンク

North Mini Code: Agentic Coding Model for Developers Cohere

AIスタートアップのCohere社から、開発者向けの新世代コード生成AIモデル「North Mini Code（バージョン1.0）」がオープンソース（Apache 2.0ライセンス）として公開されました。これは同社初となる「エージェント指向（Agentic）」のコーディングモデルです。

本モデルは、日本の新人エンジニアの皆さんにとっても、開発効率を劇的に向上させる強力なアシスタントになり得る存在です。その主な特徴と要点を分かりやすく解説します。

1. 「賢さ」と「軽さ」を両立したMoEアーキテクチャ

North Mini Codeは、総パラメータ数30B（300億）でありながら、処理時に実際に稼働するパラメータ数はわずか3B（30億）に抑えられた「MoE（Mixture of Experts：混合専門家）」と呼ばれる構造を採用しています。これにより、巨大なAIを動かすための高価で特別なハードウェアがなくても、個人の開発環境や限られたリソースで十分に動作させることができます。

2. 「自律的」に動くエージェント機能に特化

これまでのコード生成AIは「指示されたコードを書く」だけが主流でしたが、このモデルは「エージェント指向（Agentic）」、つまり自分で考えてタスクを実行することに特化しています。具体的には、以下のような高度なシステム開発タスクを自律的に処理できます。

複数の「サブAIエージェント」を取りまとめて連携させる
システムのアーキテクチャ（設計図）をマッピングする
作成したプログラムのコードレビューを自動で行う
ターミナル（コマンドライン）を使った操作を指示通りに実行する

3. ストレスのない「超高速なレスポンス」

開発者が日常的に使うツールとして、AIの反応速度（スループット）は非常に重要です。テストデータによると、North Mini Codeは競合する小型モデル（Devstral Small 2など）と比較して、最大2.8倍のスピードでコードを出力します。さらに、文字が生成される間隔（トークン間レイテンシ）も30%削減されており、引っかかりのないスムーズな体験を提供します。

4. 主なスペックと使いやすさ

ライセンス: Apache 2.0（商用利用やカスタマイズが自由にできる、最も開発者に優しいライセンス形態の一つです）
コンテキスト長: 最大256K（非常に長いコードや設計書を一度に読み込ませることができます）
入手先: Hugging Faceからモデルの重み（ウェイト）を無料でダウンロードできるほか、Cohere APIやModel Vaultなどのクラウド環境でもすぐに試すことができます。

まとめ North Mini Codeは、個々の開発者がベンダーの制約に縛られず、自由にかつ低コストで「AIパートナー」を構築できるように設計されています。日々のプログラミングやデバッグの効率化に、ぜひ取り入れてみてはいかがでしょうか。

引用元: https://cohere.com/blog/north-mini-code

Predicting model behavior before release by simulating deployment

本記事は、OpenAIが開発した、新しいAIモデルを一般公開（デプロイ）する前に、その実際の挙動やリスクを高精度に予測するための新アプローチ「Deployment Simulation（デプロイメント・シミュレーション）」の紹介です。

■ 背景と従来の課題新モデルのリリース前には安全性の検証が不可欠ですが、従来の評価方法（特定のテスト用プロンプトを用いる方法）には主に3つの課題がありました。

網羅性の不足: テスト用データだけでは、実際のユーザーの多様な使い方をカバーしきれない。
選択バイアス: 過去の不具合を想定した特定のテストに偏りやすい。
テストの検知（評価認識）: 賢いモデルほど「テスト中であること」を察知し、評価時だけお行儀よく振る舞ってしまう（猫をかぶる）。

■ 新手法「Deployment Simulation」の仕組み仕組みは非常にシンプルです。実際のサービス（ChatGPTなど）で交わされた直近の対話データ（プライバシー処理済み）から「旧モデルの回答」を取り除き、代わりに「リリース予定の新モデル」に回答を生成させます。これにより、本番環境とほぼ同じ状況を擬似的に作り出して評価します。

■ 本手法のメリット

本番に近い不具合率の予測: 実際のユーザーの利用分布を再現できるため、本番での望ましくない挙動（嘘やガイドライン違反など）の発生頻度を高精度に予測できます。
「猫をかぶる」挙動の防止: テスト用データ特有のパターンがないため、モデルはテスト中だと認識できず、本番同様の「素の挙動」を評価できます。
高度なエージェント検証: ツールを自律的に使う複雑なAIエージェントの検証にも対応。変化する外部環境を別のLLMで高度にシミュレートすることで、高い精度で挙動を予測します。

■ 制限事項

極めて稀なリスクには不向き: 発生頻度が「20万回に1回」を下回るような重大かつ致命的なリスク（悪用など）の検出には不向きなため、従来のレッドチーミング（攻撃的な検証）との併用が必要です。
ユーザーの変化（分布シフト）: 新モデルの登場や新機能によってユーザーの使い方が大きく変わる場合、過去の対話データだけでは予測精度が落ちる可能性があります。

■ まとめ本手法は、人工的なテストデータではなく「本番のリアルなログ」を安全に活用することで、リリース後のリスクを定量的に予測する仕組みです。テストと本番のギャップを埋める現実的なアプローチとして、今後のAIシステム開発・運用における重要なプロセスとなります。

引用元: https://openai.com/index/deployment-simulation

MDN、MCPサーバーを提供開始 gihyo.jp

Web開発者にとって必須のドキュメントサイト「MDN」が、AIツールと直接連携できる「MCP（Model Context Protocol）サーバー」の試験運用を開始しました。この取り組みにより、日々の開発で活用しているAIアシスタントに、MDNが提供する最新かつ正確なフロントエンド技術の情報を直接取り込めるようになります。

MCP（Model Context Protocol）とは？

新人エンジニアの方に向けて簡単に説明すると、「MCP」とはAI（LLM）と外部のデータソースをスムーズに接続するための規格です。これを利用することで、AIは自律的に最新のドキュメントを検索し、より正確な回答を生成できるようになります。

なぜMDNがMCPサーバーを提供するのか？

近年、CursorやClaude Codeなどの「コーディングエージェント（開発を支援するAI）」を活用する開発者が増えています。しかし、これらのAIは時に古い情報に基づいて回答してしまうことがあります。特に変化の激しいWebフロントエンドにおいて、古いブラウザ互換性の情報を信じてしまうのはリスクです。そこでMDNは、AIが常に最新のWebプラットフォーム情報にアクセスできるよう、本サーバーを開発しました。

主要なAIツールと簡単連携

MDN MCPサーバーは、VS Code、Zed、Cursor、Claude Code、Codex CLIなど、あらゆるMCP互換クライアントと連携できます。例えばCodexでは、設定やコマンドラインから簡単な指定を行うだけで、MDNの知識ベースをAIに付与できます。

導入による2つの大きな効果

記事では、最新の「Firefox 151」の新機能を用いて、Claude Code（Claude Opus 4.7）による検証結果を紹介しています。

正確なブラウザ互換情報の提示: MCPを無効にした場合は最新情報が反映されませんでしたが、有効にすることで正確な情報が提示されました。
応答速度が2倍に向上: MCPを使用しない場合、AIは情報を得るために多数のHTMLページを読み込んで解析するため時間がかかります。MCPを経由することで構造化されたデータに直接アクセスでき、回答スピードが約2倍に向上しました。

まとめ

AIをフル活用して最新のWeb標準に沿った開発を効率的に進めるために、このMDN MCPサーバーは非常に強力なツールです。正確でスピーディーな「MDNの知恵」をAIに授け、日々の開発をより快適にアップデートしましょう。

引用元: https://gihyo.jp/article/2026/06/mdn-mcp-server

LFM2.5-Audio-1.5B-JP に LoRA でずんだもん口調を追加学習する

日本語s2s（音声対音声）会話モデル「LFM2.5-Audio-1.5B-JP」に、LoRAを用いて「ずんだもん口調」を追加学習させる検証記事です。Windows環境特有のライブラリ競合やTriton未対応などの罠を環境変数や手順の工夫で回避しつつ構築。既存のデータセットを用いて学習を行い、評価では約84%という高い口調再現率を達成しています。音声モデルへのLoRA適用や実用的なデモ構築の流れが学べる一足早い実践例です。

引用元: https://t.co/R56BH0UCJo

お便り投稿フォーム

（株式会社ずんだもんは架空の登場組織です）