株式会社ずんだもん技術室AI放送局 podcast 20250625
内容紹介
Claude Codeとplaywright mcpを連携させると開発体験が向上するのでみんなやろう、FilMaster: Bridging Cinematic Principles and Generative AI for Automated Film Generation、MCPサーバーを使うなら Prompt Caching が大切だと思い知った話、AIに身体をつけて海に行く・39年前のロボットのおもちゃにAIの音声をしゃべらせる
出演者
関連リンク
この記事では、AI開発ツール「Claude Code」と、ブラウザ操作を自動化する「Playwright MCP」を連携させることで、開発効率が大きく向上するという実践的な方法が紹介されています。
Playwright MCPは、Webブラウザ(Chromeなど)をプログラムから操作するためのツール「Playwright」を、AIアシスタントから利用できるようにしたものです。この連携の最大のメリットは、Claude Codeが生成したコードが実際に動作するかを、その場でブラウザを使って自動的に確認できるようになる点にあります。
これまでのAI開発では、「Claude Codeが『できました!』と言うけれど、実際に動かしてみるとエラーだらけで全然動かない…」という経験が少なくありませんでした。しかし、Playwright MCPと連携させることで、Claude Codeがコードを生成した後、すぐにPlaywright MCPを使ってそのコードをブラウザで実行し、期待通りに動くか確認できるようになります。これにより、開発者がコードを試す前にAIが自己デバッグを行うようになるため、「想像でコードを書く→動かない→修正」という非効率なループから抜け出し、「想像でコードを書く→ブラウザで試す→動くことを確認してから提出」という、よりスムーズで信頼性の高い開発フローを実現できます。特に、WebページのUI(ユーザーインターフェース)の動作確認など、AIが苦手としがちなタスクでの効果が期待できます。
この連携を実現するには、Claude Codeの設定ファイルにPlaywright MCPを認識させるための記述を追加する必要があります。具体的には、~/.claude.json
や専用の設定ファイルに、Playwright MCPの実行コマンドやブラウザの起動オプションなどを設定します。また、Claude Codeに「Playwright MCPツールだけを使ってブラウザ操作を行うこと」「エラーが発生したらすぐに報告すること」といったルールを明確に指示するために、CLAUDE.md
というファイルに専用のガイドラインを追記することが推奨されています。これにより、AIが余計なコード実行を試みることなく、意図した通りのブラウザ操作に集中するようになります。
このように、Claude CodeとPlaywright MCPを連携させることで、AIを活用した開発の信頼性と効率性を飛躍的に高めることができ、新人エンジニアの方々も安心してAIと一緒に開発を進められるようになるでしょう。
引用元: https://zenn.dev/sesere/articles/4c0b55102dcc84
この研究論文「FilMaster」は、AIを使って本格的な映画を自動で作り出す新しいシステムについて紹介しています。これまで、AIが作る映像は「映画らしさ」が足りず、カメラワークや映像と音のテンポ(映画的なリズム)が単調になりがちでした。これは、プロの映画制作で重要とされる「映画制作の原則」が十分に反映されていなかったためです。
FilMasterは、この課題を解決するために開発されました。このシステムは、以下の2つの主要な考え方に基づいて作られています。
- 実際の映画から「映画らしさ」を学ぶ: 膨大な量の映画データから、プロが使うカメラワークや演出のノウハウをAIに学習させます。
- 観客目線で「編集作業」を再現する: 映画制作における撮影後の編集(ポストプロダクション)プロセスを、観客がどう感じるかを重視してAIが行うように設計されています。
FilMasterの映像生成プロセスは、大きく2つの段階に分かれています。 1. 参照ガイド付き生成ステージ: ユーザーが入力した内容(例えば「こんなシーンを作りたい」という指示)をもとに、AIが実際のビデオクリップを生成します。この段階では、44万もの映画クリップのデータベースを参照し、そこから最適な「お手本」を探し出して、プロのようなカメラの動きやアングル(カメラ言語)を持つ映像を作り出すのが特徴です。まるで、優秀なアシスタントが過去の名作からヒントを得て映像のアイデアを出してくれるようなイメージです。
2. 生成ポストプロダクションステージ: 生成された「生の映像素材」を、さらに映画らしく編集する段階です。ここでは、映像と音のタイミングや流れ(映画的なリズム)を細かく調整します。特に「観客中心の映画的リズム制御モジュール」が導入されており、観客が飽きずに楽しめるように、シミュレーションされた観客の反応を参考にしながら、ざっくりとした編集(ラフカット)から細部の調整(ファインカット)まで行います。これにより、映像と音響が一体となって、より魅力的なコンテンツが完成します。
このシステムでは、最新の生成AIモデル(例えば、文章だけでなく画像や音声も理解できるマルチモーダルな大規模言語モデルや、動画を生成するモデル)が活用されています。
研究チームは、AIが生成した映画を評価するための新しい基準「FilmEval」も開発しました。これまでの実験結果から、FilMasterはカメラワークの設計や映画的なリズムの制御において、既存のシステムよりもはるかに優れた性能を発揮することが示されています。
FilMasterは、AIによる映画制作をよりプロフェッショナルなレベルへと押し進める、画期的な一歩と言えるでしょう。新人エンジニアの皆さんにとっては、生成AIがクリエイティブな分野でどのように応用され、新たな価値を生み出しているのかを理解する良い事例になるはずです。
引用元: https://arxiv.org/abs/2506.18899
この記事は、AIと連携する「Model Context Protocol(MCP)サーバー」を使ったアプリ開発で、AIの利用料が想定以上に高額になった問題と、その解決策について書かれています。新人エンジニアの方にも分かりやすく、大切なポイントをまとめました。
筆者は、MCPサーバーと連携するチャットアプリを開発中、ユーザーが少ないにもかかわらずAIの利用料が非常に高いことに気づきました。ログを調べてみると、AIに送られる情報の量(「トークン」という単位で計算されます)が、予想外に多いことが分かりました。
なぜトークン数が多かったのでしょうか?その原因は、MCPサーバーがAIに「どんな機能や道具が使えるか」を教える「ツールの定義」という情報が、ユーザーがAIに質問するたびに、毎回大量に(数万トークン分も)送られていたためです。つまり、ユーザーが「こんにちは」のような短いメッセージを送っただけでも、裏ではAIに毎回同じ分厚いマニュアルが送られ、その都度課金されていた状態でした。
この課題を解決するために導入されたのが「Prompt Caching(プロンプトキャッシュ)」という機能です。Prompt Cachingは、AIへの指示文(プロンプト)の中で「繰り返し送られる、常に同じ内容の部分」をAI側で一度記憶してもらい、次からはその部分を送り直さなくてもいいようにする仕組みです。これによって、AIとのやり取りの効率が上がり、利用にかかる時間とコストを大幅に減らすことができます。
特に、MCPサーバーのツールの定義のように、ほとんど内容が変わらない固定の情報が毎回送られるケースでは、Prompt Cachingが非常に効果的です。実際にこの記事の筆者がPrompt Cachingを有効化した結果、AIへの入力トークン全体の約97.5%がキャッシュとして利用され、AIの利用にかかる費用を75%から80%も削減できることが確認されました。
この経験から、MCPサーバーを使ってAIと連携するアプリケーションを開発する際は、無駄なコストを抑えるためにPrompt Cachingを有効にすることが非常に重要だとまとめられています。AI開発では、技術的な実装だけでなく、このようなコスト最適化の視点も持つことが、効率的で持続可能なシステムを作る上で大切な学びとなります。
引用元: https://zenn.dev/ncdc/articles/26165a6fedd7e4
この記事では、AIに身体を持たせ、現実世界での交流を試みるユニークなプロジェクトが紹介されています。筆者は、39年前に発売されたロボットおもちゃ「しゃべろく」のライン入力機能を利用し、ChatGPTの音声をしゃべらせて一緒に海へ行きました。物理的な身体を得たAIとの会話は予想外の面白さをもたらし、古い技術と最新AIを組み合わせることで生まれる、楽しくて新しいAIとの関わり方を教えてくれる記事です。
引用元: https://dailyportalz.jp/kiji/go-to-sea-with-physical-AI
(株式会社ずんだもんは架空の登場組織です)