株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20260519

2026年05月19日

MP3ファイルをダウンロード

内容紹介

『作って学ぶAIエージェント』を書きました ── TypeScriptでコーディングエージェントを自作する本、データ分析は自動化できる。ただし、DWHとメタデータを舐めてはいけない、GenCAD: Image-conditioned Computer-Aided Design Generation with Transformer-based Contrastive Representation and Diffusion Priors、『ずんだもん』×「大川ぶくぶ」のコラボレーションアイテムの受注を開始!!アニメ・漫画のオリジナルグッズを販売する「AMNIBUS」にて

出演者

ずんだもん
ずんだもん

youtube版(スライド付き)

関連リンク

本書は、AIエージェントを単に「使う」段階から一歩進み、その内部構造を自ら「作る」ことで、AI時代のエンジニアリングの本質を理解するための実践ガイドです。「Claude Code」や「Cursor」といったツールの普及により、AIが自律的にコードを修正する開発スタイルが主流になりつつある今、その裏側の仕組み(思考ループやツール利用)を自作することは、エンジニアにとって非常に価値のある経験となります。

1. 本書の背景:なぜ「自作」が必要なのか

著者は、AIの性能が単にモデル(LLM)の賢さだけで決まるのではなく、それを制御する「ハーネス(実装層)」の設計に大きく左右されることに注目しています。同じモデルでも、エージェントの実装次第で挙動が劇的に変わるため、その動作原理を理解し、予測・制御・カスタマイズできる能力が重要になっています。

2. 実装するAIエージェント「Nano Code」の概要と制約

本書では、最小限の部品で構成された「Nano Code」というエージェントを、TypeScriptとBunを用いて段階的に構築します。

  • 概要: LLM APIとの接続、ファイル操作やコマンド実行などの「ツール」、思考ループ、Git操作、そしてGitHub Actionsへの統合までを扱います。最終的には、GitHub Issueを起点にPR作成までを自動化するワークフローを実現します。
  • 制約・設計方針:
    • 薄い抽象化レイヤー: Vercel AI SDK等の既存フレームワークに頼りすぎず、各社LLM APIの「個性(最新機能やパラメータ)」を直接扱えるよう、あえて薄い抽象化層を自作します。
    • セキュリティと隔離: エージェントが安全にコマンドを実行できるよう、Dockerやプロセス隔離技術を用いたサンドボックス環境の構築を重視しています。

3. 新人エンジニアに向けた学習のポイント

  • 「エージェントループ」の理解: AIが「思考(Reasoning)」と「行動(Acting)」を繰り返し、エラーを自ら修正しながらゴールに到達する仕組みをコードで理解できます。
  • TypeScript/Bunの採用: Web開発者に馴染み深い言語スタックで構成されており、Pythonや機械学習の専門知識がなくても、コマンドラインツールの延長として開発を学べます。
  • エンジニアの役割の変化: コードを書くこと自体から、AIへの「指示・制御・環境設計」へとシフトしていく次世代のエンジニア像を体感できます。

本書を通じて、ブラックボックスになりがちなAIエージェントの仕組みを「自分の道具」として扱えるようになることで、AIと共に歩むエンジニアとしての確かな一歩をサポートします。

引用元: https://blog.lai.so/build-ai-agent-book/

AI技術の進化により、自然言語で問いかけるだけでAIがSQLを書き、グラフを作成し、分析結果を解釈する「データ分析の自動化」はすでに現実のものとなっています。しかし、新人エンジニアが特に意識すべきなのは、これが「AIをデータ基盤(DWH)に接続するだけで完結する魔法ではない」という点です。

自動化の恩恵を十分に受けるためには、AIがデータを正しく解釈するための「文脈(コンテキスト)」を人間側が用意しなければなりません。AIはテーブル名の雰囲気だけで判断してクエリを書くため、例えば「売上」という言葉一つとっても、それが税込みなのか、キャンセル分を含んでいるのか、あるいはテストデータが混ざっているのかといった背景を知らなければ、もっともらしい顔をして間違った数字を出力してしまいます。

これを防ぐための主戦場は、派手なチャットUIの開発ではなく、以下のような泥臭いデータ整備にあります。

  1. DWH設計とデータマートの構築: AIが迷わず集計できる構造に整える。
  2. 徹底したメタデータの付与: テーブルやカラムの説明、指標の定義、更新頻度、参照すべきではない古いテーブルの明示など。
  3. ビジネス文脈の明文化: a16zが提唱する「Context Layer(文脈レイヤー)」のように、組織内での数字の定義や業務上の例外、過去の意思決定の経緯をAIが参照できる形に残す。

人間のアナリストが無意識に行っていた「このテーブルは古いから使わない」「この数字は経理用の定義だ」といった暗黙知を、メタデータやドキュメントとして言語化することが、AIを賢く働かせるための必須条件です。

これからのデータエンジニアやアナリストに求められる役割は、単にSQLを書いて集計することから、「会社の数字の意味を設計し、AIが迷わないための地図(メタデータ)を整備する」ことへとシフトしていきます。一見地味に見えるカラム説明の記述やデータクレンジングといった作業こそが、データ分析自動化の成否を分ける最も重要なエンジニアリング作業となります。

引用元: https://datamesi.hatenablog.com/entry/data-agents-need-context

本記事は、1枚の画像から編集可能な「CADプログラム(コマンド履歴)」を直接生成するAIモデル『GenCAD』に関する技術解説です。

従来の3D生成AIは、メッシュや点群、ボクセルといった形式での出力が主流でした。しかし、これらは製造業やエンジニアリングの現場で求められる「精緻な寸法管理」や「設計変更への対応」が難しく、実務への適用には課題がありました。GenCADは、3Dの形状そのものではなく、形状を形作るための「CAD操作の履歴(パラメトリック・コマンド・シーケンス)」を生成することで、この問題を解決します。

GenCADのアーキテクチャは、以下の4つの主要なステップで構成されています。

  1. CAD操作の潜在表現学習: 自己回帰型のTransformerエンコーダを用いて、複雑なCADコマンドの並びを効率的な数値データ(潜在変数)として学習します。
  2. 画像とCADの紐付け(対照学習): CLIPのような手法を用い、CADデータの潜在空間と、その完成予想図である画像データの潜在空間を対応付けます。これにより「この画像ならこのCADデータ」という関係性をAIが理解します。
  3. 潜在拡散モデル(Latent Diffusion Model)による生成: 入力された画像に基づき、対応するCADデータの潜在表現を拡散モデルによって生成します。
  4. CADコマンドへのデコード: 生成された潜在表現を、最終的なCADプログラム(コマンドのシーケンス)へと変換します。

この手法の最大の利点は、出力が「編集可能なプログラム」である点です。生成されたモデルに対して、ジオメトリカーネル(CADエンジン)を通すことで、エンジニアは後から特定の寸法を変更したり、形状を微調整したりすることが容易になります。

新人エンジニアの方にとっても、画像生成AIの技術(拡散モデルやTransformer)が、単なる画像生成に留まらず、製造業の根幹であるCAD設計の自動化に応用されている点は、非常に興味深いエンジニアリング事例と言えるでしょう。この技術は、将来的に設計業務の自動化や、ラフスケッチからの高度な3Dモデリングを可能にする大きな一歩となる可能性を秘めています。

引用元: https://gencad.github.io/

人気キャラクター「ずんだもん」と、『ポプテピピック』で知られる漫画家・大川ぶくぶ氏のコラボグッズが、通販サイト「AMNIBUS」で受注開始されました。描き下ろしのスクールver.イラストを用いたTシャツやマウスパッド、デスクマットなど、エンジニアの作業環境を楽しく彩るアイテムが揃っています。音声合成界隈で馴染み深い「ずんだもん」の、独特なタッチで描かれた新境地を楽しめるファン必見の内容です。

引用元: https://prtimes.jp/main/html/rd/p/000009021.000016064.html

(株式会社ずんだもんは架空の登場組織です)