株式会社ずんだもん技術室AI放送局 podcast 20260603
内容紹介
Rethinking Search as Code Generation、Expanding Project Glasswing、Holo3.1: Fast & Local Computer Use Agents、ポルトガルの学会で、参加者に「普段何やってるの?」と訊かれたので「I play YU-GI-OH」と返したら、その後「何だこの学会は」と言いたくなる流れになった話
出演者
youtube版(スライド付き)
関連リンク
■ 背景と課題:なぜ今、検索の仕組みを見直すのか? 従来のAI向け検索システム(RAGなど)は、AIがクエリを送信し、検索エンジンが処理した固定の結果をAIがコンテキストとして受け取る「一括処理(モノリシック)」な仕組みでした。しかし、AIエージェントが複雑なタスクを自律的にこなす現代において、この方法には限界があります。不要な情報がコンテキストを圧迫してコストが膨らむ、柔軟な検索条件の変更が難しい、何度もやり取りが発生して処理が遅くなる、といった課題が生じていました。
■ 解決策:「Search as Code (SaC)」の提案 Perplexityが開発した「Search as Code (SaC)」は、検索プロセスそのものをコードで制御する新しいアーキテクチャです。検索エンジンの各機能(情報の取得、順位付け、フィルタリング、並列処理など)を、細分化された「SDK(ソフトウェア開発キット)」の部品としてAIに提供します。AIは、提示されたタスクに合わせて自らPythonコードを生成・実行し、その場で最適な「特製検索パイプライン」を動的に組み立てます。
■ SaCを支える3つのコアレイヤー
- モデル(Models):タスクを分解し、SDKを用いて最適な検索手順を実行するPythonコードを生成する司令塔です。
- サンドボックス(Sandboxes):生成されたコードを安全かつ確実に実行する環境です。処理中の状態(中間データ)をファイル保存することで、長時間のタスクでも破綻せずに次の処理へ引き継げます。
- Agentic Search SDK:検索プロセスをアトミック(最小単位)に制御できるPythonの部品集です。AIモデルが最もコードを書きやすい形になるよう、自動で継続的に最適化されています。
■ 圧倒的な実績と効果 実際のセキュリティ情報(CVE)の調査タスクにおいて、SaCは精度100%を達成しながら、消費トークン数を従来比で85.1%も削減することに成功しました。また、難関ベンチマーク(WANDR等)において他社の最先端AIシステムを最大2.5倍上回るスコアを記録し、高いコストパフォーマンスを実証しています。
■ まとめ SaCは、「検索APIをただ呼び出すだけ」の時代から、「検索自体をプログラムとして制御する」時代へのシフトを意味します。AIの柔軟な推論力と、決定論的なコード実行の強みを融合させたこの仕組みは、これからのAIシステム開発における重要な設計パラダイムとなるでしょう。
引用元: https://research.perplexity.ai/articles/rethinking-search-as-code-generation
本記事は、AIスタートアップのAnthropic社が推進する、AIを活用したソフトウェアセキュリティ強化プロジェクト「Project Glasswing」の拡大について解説したものです。これからの開発現場やセキュリティ対策のあり方を大きく変える、エンジニア必読のトレンドとなっています。
1. 「Project Glasswing」の概要と実績 Project Glasswingは、世界中の重要なソフトウェアの安全性を確保するための共同取り組みです。初期フェーズでは、約50のパートナー組織がサイバーセキュリティに特化したモデル「Claude Mythos Preview」を利用し、自社のコードベースをスキャンしました。その結果、すでに1万件以上の「深刻(High)」または「致命的(Critical)」なセキュリティ脆弱性が発見されるという大きな成果を上げています。
2. パートナーシップの大幅な拡大 Anthropic社は、この取り組みをさらに約150の新たな組織へと拡大します。対象は15カ国以上に及び、電力、水道、医療、通信、ハードウェアといった社会の重要インフラを担う企業や、世界中の開発者が依存するオープンソースソフトウェア(OSS)のメンテナー(管理者)が含まれます。これらの組織のコードベースが攻撃された場合、1億人以上に影響が及ぶ可能性があるため、事前の防御策が急務となっています。
3. 防御側(エンジニア)の変革と支援策 強力なサイバー能力を持つAIが身近になる未来を見据え、防御側もAIを活用して対策を加速させる必要があります。Anthropic社は単に脆弱性を探すだけでなく、以下の支援を展開しています。
- 実用ツールの提供: 最新モデル(Claude Opus 4.8など)を用いてコードをスキャンし、修正パッチを提案する製品「Claude Security」をリリースしました。
- パッチ適用の高速化: 「Claude Mythos Preview」自体を活用し、脆弱性の発見から修正パッチの自動生成、さらにはメモリ安全な言語へのコード書き換えやリリース前チェックなどを進めています。
4. 今後の展望 最終的なゴールは、AIの力で「すべてのソフトウェアをより安全にすること」です。Anthropic社は、悪用を防ぐ強固なセーフガードを開発した上で、この強力なセキュリティ機能を一般公開することを目指しています。今後もパートナーを増やし、AI時代において「防御側が常に有利に立てる世界」の構築を目指します。
引用元: https://www.anthropic.com/news/expanding-project-glasswing
「Holo3.1」は、PCやスマートフォンなどの画面を認識して人間のように操作(Computer Use)できる、最先端のAIエージェントモデルの最新ファミリーです。前バージョン「Holo3」の成功を受け、本バージョンでは「実運用(プロダクション)」を見据え、対応環境の拡大、他システムとの連携力、そしてローカルデバイスでの実行性能が大幅に強化されました。
新人エンジニアの方向けに、Holo3.1の主な進化ポイントを分かりやすく4つに分けて解説します。
1. モバイルを含むあらゆる環境への適応(マルチ環境対応) 従来のWebブラウザやデスクトップ操作に加え、Androidなどのモバイル環境の自動化が大幅に強化されました。モバイル環境の評価指標である「AndroidWorld」において、最大モデル(35B-A3B)のタスク成功率が67%から79.3%へと大きく向上し、より実用的なモバイル操作が可能になりました。
2. 他システムとのスムーズな連携(関数呼び出しのサポート) 開発者が既存のエージェントフレームワークにHoloを組み込みやすくするため、従来のJSON形式での出力に加え、新しく「Function-calling(関数呼び出し)」プロトコルにネイティブ対応しました。これにより、外部ツールやAPIの呼び出しを伴う高度な自動化システムとの連携が非常にスムーズになります。
3. ローカル環境で「高速・プライベート」に動く量子化対応 本バージョン最大の目玉は、モデルのデータサイズを削減する「量子化」に本格対応した点です。「FP8」「Q4 GGUF」「NVFP4」という軽量化されたモデルが提供されています。 特にNVIDIAの技術を活用した「NVFP4」形式では、AIの賢さ(精度)をほぼ落とすことなく、標準的なBF16形式と比べて最大1.74倍の処理高速化(スループット向上)を達成しています。これにより、一般的なWindowsやMac(Apple Silicon)などのローカルPC、あるいは社内の安全なネットワーク環境だけで、データを外部に送信することなく安全かつ高速にAIエージェントを動かせます。
4. 開発要件に合わせて選べる4つのモデルサイズ 超軽量な「0.8B(極小サイズ)」から、コスト効率に優れた「4B」、速度と性能のバランスが良い「9B」、そして最も賢い「35B-A3B」まで、用途やマシンスペックに合わせて柔軟に使い分けられるラインナップが揃っています。
Holo3.1の登場により、セキュリティの観点からクラウドAIを使えなかった業務でも、ローカルPC上で安全かつ実用的な速度で動作する「自動化AIアシスタント」の開発が一気に現実的になりました。
引用元: https://huggingface.co/blog/Hcompany/holo31
ポルトガルの学会に参加した投稿者が、周囲から「普段何をやっているのか」と尋ねられ「遊戯王をやっている」と答えたところ、現地のアカデミアたちから「バクラ」や「ネクロバレー」といったディープな遊戯王用語が次々と飛び出し、一気に盛り上がったというユーモラスな体験談です。海外の研究者の間でも日本のホビー文化が深く浸透しており、意外な共通の趣味が国境を越えて親睦を深める強力なツールになることを示しています。
引用元: https://togetter.com/li/2704474
(株式会社ずんだもんは架空の登場組織です)