株式会社ずんだどん技術室AI放送局 podcast 20260401
お知らせ
重要告知ごわす。遂にずんだもんAI放送局のライブ配信の開催が決定したごわす。なんて、うそごわす。今日はお約束のエイプリルフールごわす。
内容紹介
Claude Codeの/loopで自律的にパフォーマンスチューニングのPDCAを回させる仕組みを作った【autoresearch】、Announcing the LangChain + MongoDB Partnership: The AI Agent Stack That Runs On The Database You Already Trust、Prompt→Context→Harness、全部やった。要件だけ渡す、変わっても壊れない。整合性駆動開発CoDD爆誕、キュアアンサー、ポチタ、MEMちょ色んなキャラクターに出会える「AnimeJapan 2026」が最高!実際に出会えたキャラクターをフォトレポートでお届け【フリーダム山中の練り歩き日誌 vol.4】 1枚目の写真・画像 超!アニメディア
出演者
youtube版(スライド付き)
関連リンク
本記事は、AIエージェントにプログラムの改善を自律的に繰り返させる「autoresearch」という手法を、サーバーサイド(Rails)のパフォーマンス改善に応用した実践記録です。開発者が寝ている間もAIが試行錯誤を繰り返し、レスポンスタイムを自動で短縮し続ける仕組みを構築しています。
1. 「autoresearch」の仕組みと3つの原則
元ネタは、AIに自身の訓練コードを修正・実行・評価させることで性能を向上させるプロジェクトです。これをサーバーサイド開発に転用するにあたり、以下の3つの原則を定義しています。
- 固定された評価基準: AIが改ざんできないベンチマークスクリプトと評価関数を用意し、公正に比較する。
- 固定された時間予算: 1サイクルの時間を一定(例:10分)に制限し、小さな改善を積み重ねる圧力をかける。
- 進化的選択圧: 改善すれば採用(Keep)、改悪なら破棄(Discard)。常に最良の状態から次の試行を開始する。
2. Claude Codeを活用した自律ループの実装
Claude Codeのスキル機能と/loopコマンドを組み合わせ、「コード分析 → 実装 → テスト実行 → ベンチマーク計測 → 判定・記録」というPDCAサイクルを自動化しています。これにより、エンジニアが介在することなく、数十回の実験を自律的に走らせることが可能になりました。
3. AIを暴走させない「ハーネスエンジニアリング」
AIに自律的な権限を与えるため、安全性を確保する「手綱(ハーネス)」の設計が重要視されています。
- テストデータの隔離: 「チューニング用AI」と「データ準備用AI」を分離。チューニング用AIにテストデータの中身を見せないことで、特定データに特化した不正な最適化(過学習)を防ぎます。
- フック機能によるツール制限: Claude Codeのツール実行(ファイルの読み取りやコマンド実行)を監視し、ホワイトリスト方式で許可された安全なコマンドのみを実行できるように制限しています。
- ブランチ保護: 作業用の特定ブランチ以外では動作しないよう制限し、メインのコードベースを守ります。
まとめ:エンジニアの新たな役割
これからのエンジニアは、自らコードを書くだけでなく、「AIが安全かつ自律的に動くための行動原理と環境」を設計することが重要なスキルになります。本記事の実践は、AIエージェントと共に開発を進める次世代のソフトウェアエンジニアリングの姿を示しています。新人エンジニアにとっても、AIを単なる「チャット相手」ではなく「自律的なチームメンバー」として使いこなすための非常に示唆に富む内容です。
引用元: https://zenn.dev/dely_jp/articles/3117e590465e38
AIアプリケーション開発で広く使われる「LangChain」と、クラウドデータベースの「MongoDB」が戦略的パートナーシップを発表しました。この提携は、AIエージェントをプロトタイプ(試作)からプロダクション(本番運用)へとスムーズに移行させるための「AIエージェント・スタック」を提供することを目的としています。
背景:本番環境におけるエージェント開発の課題
AIエージェントを実際のビジネス現場で動かすには、単にモデルに指示を出すだけでは不十分です。
- クラッシュしても続きから再開できる「永続的なメモリ(記憶)」
- 企業の膨大なデータから必要な情報を探す「検索機能(RAG)」
- データベース内の構造化データへのアクセス
- 何が起きたかを分析できる「デバッグや監視の仕組み」 これらを実現するために、従来は複数の異なるシステムを組み合わせて同期させる必要があり、インフラが非常に複雑になるという課題がありました。
今回の統合が提供する主な機能
今回の提携により、MongoDB AtlasをAIエージェントの包括的なバックエンドとして利用できるようになります。
- Atlas Vector Searchの統合: ベクトル検索がLangChainにネイティブ対応しました。運用データと同じ場所でベクトル検索ができるため、データの同期の手間が省け、セキュリティ管理も一本化できます。
- MongoDB Checkpointerによる状態管理: LangGraphやLangSmithを用いた開発において、エージェントの「状態」をMongoDBに直接保存できるようになります。これにより、途中で止まった会話の再開や、過去の状態に遡る「タイムトラベル・デバッグ」が可能になり、信頼性が大幅に向上します。
- Text-to-MQL(自然言語からクエリ生成): エージェントが自然言語の指示をMongoDBのクエリ(MQL)に変換し、データベース内の情報を直接検索・集計できる仕組みが提供されます。
- LangSmithによる可観測性(オブザーバビリティ): エージェントがどのように考え、どのデータを検索し、どのような状態遷移を行ったかを、LangSmithを通じてエンドツーエンドで追跡・評価できます。
まとめ
新人エンジニアの方にとっても、このニュースは重要です。なぜなら、「複数のデータベースを使い分ける」という複雑なアーキテクチャの構築に時間を割く代わりに、「使い慣れたMongoDBという一つの基盤」で、強力なAIエージェントを構築できる道が開かれたからです。特定のAIベンダーに縛られず(Zero Lock-in)、マルチクラウドで動作するこのスタックは、今後エージェント開発の標準的な選択肢の一つになるでしょう。
引用元: https://blog.langchain.com/announcing-the-langchain-mongodb-partnership-the-ai-agent-stack-that-runs-on-the-database-you-already-trust/
本書は、AIを活用したソフトウェア開発手法の急速な変遷を振り返りつつ、最新のパラダイムとして提唱される「整合性駆動開発(CoDD: Coherence-Driven Development)」について解説した論考です。
1. AI開発手法の進化の歴史
AI開発はこの数年で3つの段階を経て進化してきました。
- プロンプトエンジニアリング(2023〜2024): 1回の入力(プロンプト)を最適化する手法。
- コンテキストエンジニアリング(2024〜2025): 背景知識(コンテキスト)をファイルとして持たせ、AIに継続的な文脈を与える手法。
- ハーネスエンジニアリング(2025〜2026): AIの動きにルールや制約(ガードレール)を設け、プロセスを標準化する手法。
2. 直面している課題:プロジェクトの肥大化と変更
これまでの手法は「AIをどう動かすか」に焦点を当ててきましたが、プロジェクトが大規模になると、一つのコンテキストファイル(CLAUDE.md等)に情報を詰め込むのは限界に達します。また、開発途中で要件や設計が変更された際、「どこまで影響が及び、どこが壊れるか」を人間が把握することが困難になるという、レイヤー3の「未踏領域」が残されていました。
3. CoDD(整合性駆動開発)の概要と特徴
CoDDは、「設計の整合性を保つことで開発を駆動する」という新しい方法論です。開発者が要件や制約を渡すだけで、AIが設計書・コード・テストを生成し、その後の変更にも自動で追従することを目指します。
主な仕組みと制約:
- 依存グラフの構築: 各設計書(Markdown形式)のフロントマター(メタデータ)に依存関係を記述し、プロジェクト全体の繋がりを可視化します。
- 変更影響分析(Impact Analysis): 要件が数行変わった際、依存グラフを辿って「影響を受ける設計書やコード」を即座に特定します。
- Wave(ウェーブ)による順序制御: 依存関係の上流(要件定義)から下流(実装・テスト)へと、波が伝わるように順番に更新処理を行います。
- 導出原則: 「上流の設計が決まれば下流の実装方針は自明である」という考えに基づき、設定ファイルを最小化します。
4. エンジニアにとってのメリット
新人エンジニアにとって特に魅力的なのは、「変更を恐れなくて済む」点です。手作業で膨大な設計書の整合性をチェックする代わりに、ツール(codd-dev)が影響範囲を「Green(自動更新可)」「Amber(要件確認が必要)」といった信頼度付きで提示してくれます。
これにより、プロトタイプを素早く作る「バイブコーディング」の速さと、大規模開発に耐えうる「設計の堅牢性」を両立させることが可能になります。TDD(テスト駆動)やDDD(ドメイン駆動)に並ぶ、AI時代の新しいスタンダードな開発手法として期待されています。
引用元: https://zenn.dev/shio_shoppaize/articles/shogun-codd-coherence
2026年3月に開催された「AnimeJapan 2026」の様子を伝えるフォトレポートです。会場にはプリキュアやポチタ、『【推しの子】』のMEMちょなど、人気キャラクターが多数集結しました。特にエンジニアにも馴染み深い「ずんだもん」や、猫とバナナが融合した「ばなにゃ」といった愛らしいキャラクターたちも登場し、作品の垣根を超えた共演が楽しめます。最新のアニメ文化に触れられる、心温まるイベント記事です。
引用元: https://cho-animedia.jp/article/img/2026/03/30/58172/1179799.html
VOICEVOX:ちび式じい