株式会社ずんだもん技術室AI放送局 podcast 20260121
内容紹介
Cisco and OpenAI redefine enterprise engineering with AI agents、[翻訳] Anthropic ハッカソン優勝者による Claude Code 完全ガイド、高階関数ツールを使ったAI Agent検証 - ブラウザ操作自動化タスクで3.4倍高速・コスト1/5を実現、GateboxとBelong、デジタルフィギュアボックス向け中古スマートフォン販売において協業開始
出演者
youtube版(スライド付き)
関連リンク
CiscoとOpenAIが提携し、AIエージェント「Codex」をエンタープライズ規模のソフトウェア開発に本格導入したという、非常にエキサイティングなニュースです。これまでの「コード補完ツール」としてのAIから一歩進み、「自律的にタスクを遂行するチームの一員」としてAIを活用するフェーズに入ったことを示しています。
新人エンジニアの皆さんが注目すべきポイントは、以下の3点に集約されます。
1. 「補助」ではなく「自律(エージェント)」への進化
従来のAIは、エンジニアが書いているコードの続きを提案する「補完」が主流でした。しかし、今回Ciscoが導入したCodexは「エージェンシー(自律性)」を備えています。
- 複数のリポジトリを跨いでコードの依存関係を理解する。
- CLI(コマンドライン)を操作し、「コンパイル→テスト→エラー修正」というループを自律的に回す。
- 既存のセキュリティやガバナンスのルールに従って行動する。 このように、エンジニアが日常的に行う「一連のワークフロー」を肩代わりできるのが大きな特徴です。
2. 驚異的な実務成果
Ciscoの複雑な大規模システム(特にC/C++主体のコードベース)において、具体的な成果が出ています。
- ビルドの最適化: 15以上のリポジトリを分析し、ビルド時間を約20%削減。月間1,500時間もの工数を削減しました。
- バグ修正の自動化: 「CodeWatch」という仕組みにより、数週間かかっていた修正作業を数時間に短縮。バグ修正の処理能力は10〜15倍に向上しました。
- 大規模移行: UIフレームワーク(React)のバージョン移行など、単調で膨大な作業をAIが代行し、数週間かかるはずの工程を数日で完了させました。
3. AIとの新しい働き方
現場のエンジニアは、「AIをツールではなくチームメイトとして扱うことで最大の利益が得られた」と語っています。AIに「計画書」を作成させ、人間がその計画と成果物をレビューするというスタイルです。
これからのエンジニアには、自分でコードを書く力に加え、「AIエージェントに的確な指示を出し、そのプロセスを監督・検証する能力」がますます求められるようになります。AIにルーチンワークを任せ、人間はよりクリエイティブな設計や、重要な判断を伴う業務に集中できる、ポジティブな未来が描かれています。
引用元: https://openai.com/index/cisco
本記事は、Anthropicが開発したCLIベースのAIエージェント「Claude Code」を10ヶ月間使い込み、ハッカソンでの優勝経験も持つエンジニアによる実践的なカスタマイズガイドです。新人エンジニアの方でも、これを読むことでClaude Codeを単なるチャットツールではなく、強力な「開発パートナー」へと進化させる方法が理解できます。
主な要点は以下の通りです。
-
効率化を支える「Skill」と「Slash Command」 特定の指示や定型ワークフロー(リファクタリング、テスト駆動開発など)をプロンプトの短縮形として登録できます。例えば、コードの整理を
/refactor-cleanというコマンド一つで実行できるようになり、何度も同じ指示を書く手間を省けます。 -
自動化を仕組み化する「Hooks」 「ファイル編集後」や「特定のコマンド実行前」といったイベントをトリガーに動作を自動化できます。例えば、編集後に自動でフォーマッタ(Prettier)を動かしたり、型チェック(tsc)を走らせたりすることで、ケアレスミスを防ぎながら開発の質を保てます。
-
精度を向上させる「Sub Agent」 全ての作業を一つのAIで行うのではなく、設計担当、レビュー担当、テスト担当といった「役割を絞った子エージェント」にタスクを委譲します。範囲を限定することで、AIの思考がより鋭くなり、より正確なアウトプットが得られます。
-
外部ツールと繋がる「MCP」と「Plugin」 GitHubやデータベース、ブラウザ操作などの外部サービスと連携するための仕組みです。また、LSP(Language Server Protocol)のプラグインを導入することで、AIがコードの文脈を深く理解し、型チェックや補完を強力にサポートしてくれます。
-
最重要ポイント:コンテキスト(記憶容量)の節約 AIが一度に扱える情報量には限りがあります。ツールを入れすぎるとAIの「記憶」を圧迫し、性能が低下します。未使用のMCPやプラグインはこまめに無効化し、AIがタスクに集中できる環境を整えることが上級者への第一歩です。
-
おすすめのエディタと運用 軽量かつ高速な「Zed」エディタが推奨されており、AIが編集した差分をリアルタイムで確認しながら開発を進める手法が紹介されています。また、複数のタスクを並列で進めるためにGitのworktreesを活用するなど、プロならではの運用ノウハウも詰まっています。
AIに指示を出すだけでなく、AIが働きやすい「仕組み」を自ら構築することで、開発生産性を劇的に向上させることができる一冊です。
引用元: https://zenn.dev/studypocket/articles/claude-code-complete-guide
本記事は、スパイスコード社が実施した「AIエージェントによるブラウザ操作自動化」の性能検証に関するレポートです。従来のAIエージェントが抱える「実行速度の遅さ」「高コスト」「不安定さ」という実運用上の課題を、高階関数的なツール設計とコンテキストエンジニアリングによって解決できることを定量的に示しています。
1. 実験の背景と目的
AIエージェント(LLM)にブラウザ操作を任せる際、毎回ゼロから画面を解析して操作を考える「逐次探索型」のアプローチは、トークン消費量が多く、推論時間の分だけ実行が遅くなる欠点があります。本実験では、初回の試行で操作手順を「学習」し、2回目以降は「決定的な処理」として実行する手法の有効性を検証しました。
2. 比較された3つの方式
実験では、Claude 3.5 Sonnetを用い、以下の3方式で計90回のブラウザ操作(発注書のダウンロード等)を試行しました。
- Method A (Baseline): 毎回LLMがUIを探索・推論して逐次実行する従来方式。
- Method B (Workflow): 操作ログからJSON形式のワークフローを生成し、内製ツールで再生する方式。
- Method C (Chain): 操作ログからPlaywrightコードを生成し、高階関数ツール(コードを引数に取るツール)で連鎖的に実行する方式。
3. 圧倒的な検証結果
最も優れたパフォーマンスを示したのはMethod Cでした。
- 速度: Method A(88.2秒)に対し、Method C(26.3秒)と約3.4倍高速化。
- コスト: 1回あたりのLLMコストを約1/5.5に削減($1.034 → $0.188)。
- 安定性: 実行時間のばらつき(標準偏差)がMethod Aの約1/6に抑制され、業務運用に耐えうる予測可能性を実現。
4. 実装のキモとなる設計思想
この成果を支えているのは、以下のエンジニアリング手法です。
- 「探索」と「実行」の分離: 初回のみLLMが苦労して手順を見つけ出し(学習)、以降は生成されたコードを機械的に動かすことで、LLMの役割を「判断」のみに集中させています。
- コンテキストの圧縮: 数万トークンに及ぶ操作ログを直接LLMに渡すのではなく、外部に保存した成果物を「Artifact ID」という短いIDのみで参照させることで、入力トークンを劇的に削減しています。
- 自己修復(Self-Healing): サイトのUI変更等で再生に失敗した場合、専用のサブエージェントがエラー箇所を自律的に特定・修正して手順を更新します。
5. 新人エンジニアへの示唆
本記事は、AIエージェントを「毎回考えさせる魔法の道具」として使うのではなく、「一度覚えたことはプログラムとして定着させ、再利用させる」という、ソフトウェアエンジニアリング的なアプローチの重要性を説いています。この「学習(初回投資)」と「高速な再生」の組み合わせは、実務でAIを活用する際の強力な武器となります。
引用元: https://tech-blog.localmet.com/entry/2026/01/19/172305
Gateboxと中古スマホ販売のBelongが協業し、スマホを本体に挿入して楽しむ「デジタルフィギュアボックス」向けに、安価で高品質な中古端末の提供を開始しました。ユーザーの「専用端末を安く用意したい」というニーズに応え、検品済みの推奨端末を割引価格で購入できる専用サイトも公開。古い機材を最新のエンタメ技術に再利用する、ハードウェア活用としても新人エンジニアに興味深い事例です。
引用元: https://prtimes.jp/main/html/rd/p/000000129.000026497.html
(株式会社ずんだもんは架空の登場組織です)