株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260420

2026年04月20日

MP3ファイルをダウンロード

内容紹介

Full-Stack Optimizations for Agentic Inference with NVIDIA Dynamo、gh コマンドでエージェントスキルをインストール・管理できるようになった、プロンプトの再現性をAI に自動チューニングさせる方法 ~ 暗黙知を排除する、「理解ってる人だ」 実寸大ガンダムを見に行った際、あえてガンダムの斜め後方に立ちピンチを救われた一般人ごっこをした投稿が納得感しかない

出演者

春日部つむぎ
春日部つむぎ

関連リンク

NVIDIAが発表した「Dynamo」は、AIエージェントの推論処理を劇的に効率化するためのフルスタック最適化基盤です。現在、Claude CodeやStripeのエンジニアリングエージェントのように、自律的にコードを書き、大量のPRを生成するエージェントが普及しています。これらのエージェントは、一つの会話セッションで何度もAPIを呼び出しますが、そのたびに過去の会話履歴(KVキャッシュ)を再利用するため、読み込み回数が書き込みの11倍以上に達するという「一度書いて何度も読む(WORM)」特有の負荷パターンを持っています。Dynamoはこの特性に着目し、以下の3つのレイヤーで最適化を計ります。

  1. フロントエンド(API層): 「Agent Hints」という拡張機能を導入しました。これにより、エージェント側から推論インフラに対して「このリクエストは優先度が高い」「ツール実行が終わるまでキャッシュを1時間保持してほしい」といったヒントを伝えられます。これにより、従来は「匿名のリクエスト」として処理されていた推論が、エージェントの文脈を理解したインテリジェントな処理に変わります。

  2. ルーター層: 「KV-Aware Placement」により、どのサーバーにどの会話のキャッシュが残っているかをリアルタイムで追跡します。リクエストを「キャッシュが残っているサーバー」へ優先的に割り振ることで、高コストな再計算(キャッシュミス)を最小限に抑えます。また、優先度に基づいたスケジューリングにより、重要なタスクを優先して実行します。

  3. KVキャッシュ管理層: GPU、CPU、ローカルNVMe、リモートストレージの4層からなるメモリ階層を構築します。システムプロンプトのような「全ターンで使う高価値なデータ」は永続化して全ワーカーで共有し、逆に思考プロセス(Thinkingトークン)のような「一度使ったら不要なデータ」は早期に破棄します。これにより、メモリの有効活用と、複数エージェント間でのキャッシュ共有を可能にします。

Dynamoは、エージェントの「思考のライフサイクル」をインフラ側が理解できるようにすることで、推論の待ち時間とコストを大幅に削減します。エンジニアにとっては、LLMの推論を単なるAPI呼び出しとしてではなく、メモリ管理やルーティングといった低レイヤーの最適化が重要な「計算資源の管理」として捉え直すきっかけとなる技術です。

引用元: https://developer.nvidia.com/blog/full-stack-optimizations-for-agentic-inference-with-nvidia-dynamo/

GitHub CLI(gh)のバージョン2.90.0において、新しく「gh skill」コマンドが追加されました。これにより、GitHub上で公開されている「エージェントスキル」を直接インストール、検索、管理することが可能になりました。

1. エージェントスキルとその共有の重要性 エージェントスキルとは、コーディングエージェント(AIアシスタント)の振る舞いや特定の開発ルールを文書化したものです。個人のノウハウをチームで共有し、AIに再利用させることで、開発速度の向上や品質の安定化に寄与します。これまでサードパーティツールの「npx skills」が主流でしたが、GitHub CLIが公式に対応したことで、より安全かつシームレスな管理が実現しました。

2. 主な機能と特徴 「gh skill」コマンドには、以下の主要な機能が含まれています。

  • 検索(search): GitHub上の公開リポジトリから必要なスキルをキーワードで探せます。
  • プレビュー(preview): インストール前にスキルの内容を安全に確認でき、悪意のある指示が含まれていないかチェックできます。
  • 管理(install/update): 特定のAIエージェント(GitHub Copilot, Claude Code, Cursor等)に対し、プロジェクト単位またはユーザー単位でスキルを導入・更新できます。
  • 公開(publish): 自身のノウハウをスキルとして公開する際、仕様に沿っているかのバリデーションやセキュリティ設定のチェックを自動で行えます。

3. 安全性の向上(サプライチェーン攻撃対策) 新人エンジニアが特に意識すべき点は「セキュリティ」です。外部のスキルを導入する際、タグやコミットハッシュを指定してバージョンを固定(ピン留め)することで、意図しない内容の書き換えによるリスク(サプライチェーン攻撃)を軽減できます。GitHubのネイティブ機能として、タグの保護やリリースの不変性を活用できる点が大きな強みです。

4. まとめと展望 「gh skill」は、Agent Skills仕様に準拠しているため、既存のツールからの移行も容易です。AIエージェントを「ただ使う」だけでなく、チームのナレッジを「スキル」として形式知化し、GitHubという慣れ親しんだプラットフォームで管理していくことは、今後のモダンな開発フローにおいて標準的なスキルとなっていくでしょう。

この記事は、AIエージェントを使いこなし、チーム全体の開発力を底上げしたいエンジニアにとって、非常に価値のあるアップデート情報を伝えています。

引用元: https://azukiazusa.dev/blog/gh-agent-skill-management/

本記事は、AIエンジニア界隈で著名なmizchi氏による、プロンプトの「再現性」を劇的に向上させるための自動チューニング手法を解説したものです。

1. プロンプトにおける「暗黙知」の問題

エンジニアがプロンプトを作成した直後は、自分自身の頭の中に前提知識があるため、不完全な指示でも「これで伝わるはずだ」と思い込んでしまうバイアス(主観バイアス)が生じます。しかし、別のセッションや異なるAIでそのプロンプトを実行すると、定義不足や曖昧さから期待通りの結果が得られない、つまり「再現性がない」状態に陥ります。これを防ぐには、書き手側の主観を排除した客観的な検証が不可欠です。

2. AIによる自動評価と修正のループ

プロンプトの可読性と精度を高めるために、プログラミングにおけるTDD(テスト駆動開発)のようなサイクルをプロンプト開発に導入します。

  • 別AIによる評価: 作成者とは別のAI(サブエージェント)にプロンプトを実行させます。この際、AIに「不明瞭だった点」や「自分の判断で勝手に補完した箇所」をレポートさせることが重要です。
  • 定量的・定性的評価: AIの自己申告だけでなく、実行にかかった時間やツール呼び出し回数(tool_uses)を計測し、構造的な欠陥がないかをチェックします。
  • 反復修正: レポートで指摘された「不明瞭点」を1つずつ修正し、常に「新しいAIセッション」で再評価します。同じセッションを使い回すとAIが過去の文脈を学習してしまうため、評価が甘くなるのを防ぐためです。

3. 本手法のメリットと新人が学ぶべきポイント

実際にこの手法を適用した結果、初稿で50点程度だったプロンプトが、数回の反復で80〜90点まで引き上げられた例が紹介されています。 新人エンジニアにとって特に有益なのは、「AIに動かしてもらうことで、自分のプロンプトの足らざるを知る」という姿勢です。

  • 再現性の重視: 「たまに成功する」プロンプトではなく、「誰が使っても成功する」プロンプトを目指す。
  • エッジケースのテスト: 典型的な例だけでなく、難しい状況(エッジケース)を評価シナリオに含める。
  • 計測の重要性: 「良くなった気がする」という感覚ではなく、精度や実行ステップ数というデータに基づいて改善を判断する。

この記事の手法を採り入れることで、AIとの協働における最大の壁である「指示の曖昧さ」を構造的に解決できるようになります。

引用元: https://zenn.dev/mizchi/articles/empirical-prompt-tuning

実物大ガンダムの展示にて、定番の記念撮影ではなく「戦闘中に窮地を救ってくれた機体を見上げる一般人」という独創的な構図で撮影したSNS投稿が話題です。物語のワンシーンを再現するような「解像度の高い」こだわりは、多くのファンの共感を呼んでいます。新人エンジニアの皆さんも、単に仕様を満たすだけでなく、その背景にある「ストーリー」や「ユーザー視点」を想像する遊び心を楽しんでみてはいかがでしょうか。

引用元: https://togetter.com/li/2687477

VOICEVOX:春日部つむぎ