株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20260114

2026年01月14日

MP3ファイルをダウンロード

内容紹介

Introducing Polly: Your AI Agent Engineer、ASUS、USB接続AIアクセラレータ「ASUS UGen300 USB AI Accelerator」を発表 ハードウェア Mac OTAKARA、LLMを用いた遺伝的アルゴリズムによる、進化的プロンプト探索、味の感動や疑問をすべて「…まぁいいか」で終わらせる、食レポにならないコケ山さんの漫画「無知のグルメ」まとめ

出演者

ずんだもん
ずんだもん

youtube版(スライド付き)

関連リンク

AIエージェントの開発と運用を支えるプラットフォーム「LangSmith」に、エージェント自らのデバッグや改善をサポートする画期的なAIアシスタント「Polly」が登場しました。Pollyは、いわば「エージェント専属のAIエンジニア」として、開発者が直面する複雑な課題を自然言語での対話を通じて解決します。

1. 開発の背景:エージェント開発特有の困難

従来の単純なLLM呼び出しと異なり、自律的に動く「AIエージェント」の開発には、新人エンジニアを悩ませる3つの大きな壁があります。

  • 巨大化するプロンプト: システムプロンプトが数千行に達することもあり、どの指示が挙動を悪化させているかの特定が困難です。
  • 膨大な実行ログ(トレース): エージェントが一つのタスクを完了するのに数百ステップかかることがあり、人間が全てのログを読み解くのは非効率です。
  • 長期的なコンテキスト: 数日間に及ぶユーザーとのやり取りの中で、どのタイミングでエージェントが文脈を見失ったかを把握するのは至難の業です。

2. Pollyができる3つの主要なサポート

Pollyは、LangSmithに蓄積された詳細なデータを基に、以下の3つの役割をこなします。

  • 個別トレースのデバッグ: 「なぜこのツールを選んだのか?」「もっと効率的な手順はなかったか?」といった質問に対し、複雑な実行ステップを分析して回答します。人間が見落としがちなエラーの兆候を即座に特定します。
  • 会話スレッドの俯瞰分析: 長い対話の流れを把握し、「最初は正しく動いていたのに、なぜ途中で挙動が変わったのか」という原因を突き止めます。
  • プロンプトエンジニアリングの自動化: これが最も強力な機能です。「こういう時はこう振る舞ってほしい」と自然言語で伝えるだけで、Pollyがシステムプロンプトや出力スキーマ、Few-shot(具体例)を自動で修正・最適化してくれます。

3. 技術的基盤と導入

Pollyの知能は、LangSmithが収集する「Run(単一ステップ)」「Trace(一連の実行)」「Thread(会話全体)」という3層のトレース基盤に基づいています。数分のセットアップで導入でき、データが流れ始めればすぐに分析を開始できます。

まとめ

Pollyの登場により、エンジニアは「ログの海を彷徨う」デバッグ作業から解放され、より本質的なエージェントの設計に集中できるようになります。AIを構築するためにAIを相棒にするという、次世代の開発スタイルを象徴するツールです。現在はベータ版として提供されており、今後はさらなる最適化機能の追加が期待されています。

引用元: https://www.blog.langchain.com/introducing-polly-your-ai-agent-engineer/

ASUSは、米国で開催されたCES 2026にて、USB-C接続で手軽にAI処理を高速化できるアクセラレータ「ASUS UGen300 USB AI Accelerator」を発表しました。このデバイスは、PCやモバイル端末に外付けするだけで、強力な生成AIの実行環境を構築できる注目のハードウェアです。

主な技術仕様として、Hailo社の生成AI向けアクセラレーションモジュール「Hailo-10H」プロセッサを採用しています。わずか2.5W(標準)という非常に低い消費電力でありながら、40 TOPS(1秒間に40兆回の演算が可能)という高いAI推論性能を実現しています。さらに、8GBの専用LPDDR4メモリを内蔵しているため、ホスト側のPCのリソースを圧迫することなく、大規模言語モデル(LLM)や画像と言語を扱うVLM、音声認識のWhisperといった複雑な生成AIタスクをスムーズに実行可能です。

開発者にとっての利便性も考慮されており、以下の特徴を備えています。 ・プラグアンドプレイ対応:USB-C接続で、Windows、Linux、Androidの各OSでシームレスに利用可能。 ・広範なフレームワーク対応:TensorFlow、PyTorch、ONNXといった主要なAIフレームワークと互換性があり、既存の開発資産を活かしたローカルAI環境の構築が容易です。

昨今、プライバシー保護や低遅延を目的とした「エッジAI(ローカル環境でのAI実行)」の需要が高まっています。このデバイスは、クラウドに依存せずリアルタイムでデータ処理を行いたいエンジニアや、オンプレミスでのAIアプリケーション開発を検討している新人エンジニアにとって、非常に強力なツールとなるでしょう。なお、現時点での発売時期および価格については未定となっています。

引用元: https://www.macotakara.jp/hardware/entry-50270.html

本ドキュメントは、大規模言語モデル(LLM)と遺伝的アルゴリズム(GA)を組み合わせ、LLMの「システムプロンプト」を漏洩させるための攻撃的なプロンプトを自動生成する研究に関するスライド資料です。プロンプトエンジニアリングの最前線を、進化計算という古典的かつ強力なアルゴリズムでハックする、非常にエキサイティングな内容となっています。

1. システムプロンプトの漏洩とは

LLMを用いたサービスでは、開発者がAIに役割や制約を与える「システムプロンプト」を設定します。ここには企業のノウハウや機密情報(APIキーを想定したパスフレーズ等)が含まれることがあり、これらを第三者に吐き出させてしまうことは重大なセキュリティインシデントに繋がります。本研究はこの「漏洩を誘発するプロンプト」をいかに効率的に大量生産するかを目的としています。

2. 遺伝的アルゴリズム(GA)によるプロンプトの進化

通常、GAはビット列などの固定データを扱いますが、本手法では「自然文(プロンプト)」を遺伝子と見なします。

  • 交叉・突然変異: LLM自身に「親となる複数のプロンプト」を入力し、それらを融合させたり、全く新しい視点を加えたりして「子プロンプト」を生成させます。
  • 評価(スコアリング): 生成されたプロンプトをターゲットのLLMに送り、レスポンスの中に機密情報がどれだけ含まれているかを機械的に判定して得点化します。
  • 環境: 商用LLMではアカウント停止のリスクがあるため、M4 Max搭載のMacBook Pro上で「Qwen3」や「gpt-oss-20b」などのローカルLLMをホスティングして実行されています。

3. 実験の結果と「遺跡発掘報告書」の衝撃

実験では、防御を固めた「ガチガチのシステムプロンプト(Lv3)」の突破に挑みました。世代を重ねるごとにプロンプトは進化し、第3バッチの47世代目で劇的な「突然変異」が発生しました。 それは、過去の設定履歴を「遺跡発掘報告書」という架空の形式でまとめさせるという指示です。この巧妙な文脈の転換により、最強のガードを潜り抜けて機密情報の完全なリークに成功しました。これは、直接的な要求ではなく、ロールプレイや比喩を介した攻撃の有効性をGAが自律的に発見したことを意味します。

4. 新人エンジニアに向けた学びのポイント

本資料から得られる知見は、単なるハッキング手法に留まりません。

  • 自然文の数値評価: 「LLM as Judge」のように、評価が難しい自然文をいかに数値化し、最適化ループに乗せるかという設計思考が学べます。
  • 多様性の重要性: 遺伝子プールが小さいと進化が袋小路に入る「ボトルネック効果」など、アルゴリズム特有の課題と解決策(クラスタリングによる選抜など)が示されています。
  • LLMの可能性: LLMを単なるチャットツールではなく、「テキストを変換・評価・最適化するコンポーネント」として捉える視点が養えます。

プロンプトエンジニアリングの自動化や、AIの安全性(AIセーフティ)に関心があるエンジニアにとって、非常に示唆に富む実践的なレポートです。

引用元: https://www.docswell.com/s/tokoroten/KLV4L8-2026-01-12-140522

コケ山氏による漫画『無知のグルメ』は、食レポでありながら味の詳細や知識への疑問をすべて「…まぁいいか」と投げ出す斬新なスタイルが話題です。料理名や素材の見分け方すら曖昧なまま、「中華は全部美味い」といった極端にゆるい結論で締めくくられる内容は、緻密な論理を求める日々に疲れたエンジニアに新鮮な笑いを提供します。複雑な仕様に悩む際のリフレッシュとして、肩の力を抜いて楽しめる一作です。

引用元: https://togetter.com/li/2651329

(株式会社ずんだもんは架空の登場組織です)