株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

私立ずんだもん女学園放送部 podcast 20250822

2025年08月22日

MP3ファイルをダウンロード

内容紹介

AI Mode in Search gets new agentic features and expands globally、Weaponizing image scaling against production AI systems、GPT-5、開発に使うための基礎知識  ——ワンショットでのフロントエンド開発の各モデル比較も gihyo.jp、ペーパードライバー向けのVR運転ゲームの開発者、早期アクセス版の勢いに弱気になって絶叫する「こういうゲームがずっとやりたかった」

出演者

お嬢様ずんだもん
お嬢様ずんだもん

関連リンク

Google検索のAI Modeが、ユーザーの作業をより深く支援する「エージェント機能」と、一人ひとりに合わせた「パーソナライゼーション機能」を強化し、提供地域を大幅に拡大することを発表しました。

今回のアップデートで最も注目すべきは、AI Modeがまるでアシスタントのようにタスクを遂行する「エージェント機能」です。例えば、友人とのディナー予約を探す際、「〇人、〇日、〇時、〇〇エリアで和食」といった複雑な条件を指定するだけで、AI Modeが複数の予約サイトを横断的に検索し、リアルタイムの空き状況を確認します。その上で、条件に合うレストランの候補と、直接予約ページへ繋がるリンクを提示してくれるため、ユーザーは最後の決定と予約の確定をするだけで済みます。将来的には、地域のサービス予約やイベントチケットの取得にもこの機能が拡張される予定です。この裏側では、ウェブをリアルタイムでブラウジングする「Project Mariner」や、GoogleのKnowledge Graph、Google Mapsといった技術が活用されています。このエージェント機能は、まず米国のGoogle AI Ultra契約者向けに、Labsの実験として提供が始まります。

また、米国でAI ModeのLabs実験に参加しているユーザー向けには、個人の好みや興味に合わせて検索結果を調整する「パーソナライゼーション機能」が導入されます。例えば、「1時間で手早くランチできる場所」と検索すると、過去の検索履歴やマップでの行動履歴からユーザーの好みを推測し、「イタリア料理が好きならこんなお店はどうか」「屋外席があるところが良いか」といった、より関連性の高い候補を提案してくれます。もちろん、共有される情報の管理はユーザー自身が行え、Googleアカウントの設定でいつでも調整可能です。

さらに、AI Modeで得られた情報を友人や家族と簡単に共有できる機能も追加されました。例えば旅行計画を立てる際など、AI Modeの応答結果をそのまま共有し、受け取った人もそこからさらに質問を続けたり、共同で検討を進めたりすることが可能になります。

Googleは、AI Modeが特に複雑な質問への対応力で非常に高い評価を得ているとし、この強力なAI検索体験をさらに広げます。現在、米国、インド、英国で提供されていますが、新たに180以上の国と地域に英語でのAI Modeの提供を開始しました。これにより、世界中でより多くの人々が、複雑なタスクや質問に対してAIの支援を受けられるようになります。今後は、さらに多くの言語と地域への拡大が予定されています。

新人エンジニアの皆さんにとって、この進化はAIが単なる情報検索を超え、私たちの日常的な「行動」をどう支援していくかを示す具体的な事例です。AIエージェントが様々なサービスと連携し、ユーザーの意図を汲み取ってタスクを自動化する動きは、今後のAI開発の大きな方向性を示すものと言えるでしょう。

引用元: https://blog.google/products/search/ai-mode-agentic-personalized/

このブログ記事は、AIシステムにおける新たなセキュリティ上の脆弱性、「画像スケーリング攻撃」について解説しています。これは、ユーザーがAIに画像を送信する際に、一見無害に見える画像に隠された悪意ある指示(プロンプトインジェクション)が、AIシステムが画像を縮小処理する段階で露見し、結果としてデータ窃取などの攻撃を可能にするものです。

具体的には、AIシステムは通常、大きな画像を処理する前に小さく縮小(スケーリング)します。この縮小の過程で、元の画像ではほとんど見えなかったり、全く認識できなかったりする悪意のあるプロンプトが、まるで「ゴースト」のように現れてAIモデルに実行されてしまうのです。この攻撃は、Google Gemini CLI、Vertex AI Studio、Googleアシスタントなど、多くの実稼働中のAIシステムで成功が確認されています。

例えば、Google Gemini CLIへの攻撃では、ユーザーが良性の画像をアップロードすると、システムが自動的に画像を縮小します。この縮小された画像に含まれる隠されたプロンプトが、Googleカレンダーに保存されたユーザーデータを攻撃者のメールアドレスに送信する、といった不正な動作を引き起こします。ユーザー側には、モデルが処理する前の画像プレビューがないため、何が起きているか気づくことができません。

この攻撃は、画像縮小に使われるアルゴリズム(例:ニアレストネイバー、バイリニア、バイキュービック補間)の特性を悪用しています。これらのアルゴリズムは、元の高解像度画像から低解像度画像を作成する際に、特定のパターンを歪ませたり強調したりする性質があり、これを利用して攻撃者は悪意のあるプロンプトを隠します。

このような脅威からシステムを守るためには、いくつかの対策が提案されています。まず、画像を縮小する処理自体を行わない、またはアップロード可能な画像の最大サイズを制限することが有効です。次に、もし画像縮小が必要な場合は、AIモデルが実際に処理する画像のプレビューを必ずユーザーに表示するべきです。CLIやAPIを使ったシステムでも同様です。

最も重要な防御策は、マルチモーダルなプロンプトインジェクションだけでなく、あらゆるプロンプトインジェクション攻撃に対応できるような、安全な設計パターンと体系的な防御を導入することです。特に、画像内のテキストなどの入力が、ユーザーの明確な確認なしに機密性の高いツール(例えばデータ送信やファイル操作)を呼び出すことがないようにするべきです。

記事では、この攻撃を探索し、生成するためのオープンソースツール「Anamorpher(アナモルファー)」も紹介されています。このツールは、様々な画像縮小アルゴリズムに対して、攻撃用の画像を生成する機能を提供し、研究者が脆弱性を理解し、防御策を開発するのに役立つでしょう。

引用元: https://blog.trailofbits.com/2025/08/21/weaponizing-image-scaling-against-production-ai-systems/

最新のOpenAIモデル「GPT-5」について、開発者が知っておくべき基本的な知識や、日々の業務に役立つ効果的な使い方を、新人エンジニアの皆さんにも分かりやすく解説します。

GPT-5は、これまでのモデルよりも「温かく、親しみやすい」対話ができるようになり、AIとのコミュニケーションがより自然になりました。特に、AIエージェントが指示されたタスクをこなす能力、複雑な問題を論理的に解決する力、そしてプログラミング作業(計画→実装→テスト)の安定性が大幅に向上しています。

開発者にとって特に注目すべきは、AIの応答を効率化する「Responses API」の強化です。これにより、AIは過去の思考プロセスを覚えて再利用できるようになりました。たくさんのツールを呼び出すような長い対話フローでも、毎回ゼロから考え直す必要がなくなるため、処理の速さ(レイテンシ)と費用(コスト)が抑えられ、より高い性能でタスクをこなせるようになります。

AIへの指示(プロンプト)の設計では、AIが次に何をするかを報告する「tool preamble」や、タスクをどこまで自律的に進めるかを制御する「persistence」といった機能が役立ちます。また、出力する文章の量を調整する「verbosity」や、AIの思考の深さを変える「reasoning_effort」といった新しい設定を使うことで、AIの振る舞いを細かくコントロールできるようになりました。

他の有名モデル(Google Gemini、Anthropic Claudeなど)と比較すると、一度に扱える情報量(Context Window)はやや小さいものの、実際に開発現場でよく使う範囲(約5万トークン)では非常に優れた推論能力を発揮します。プログラミング関連のベンチマークテストでも高い評価を得ており、特にWeb開発のタスクで強みを見せています。

GPT-5をコーディングに最大限活用するためのヒントは以下の6点です。

  1. AIに明確で矛盾のない指示を与える。
  2. タスクの複雑さに応じて「reasoning_effort」(思考の深さ)を適切に設定する。
  3. XMLのような構造を使って指示を整理する。
  4. 「徹底的に」といった過度に断定的な言葉遣いを避ける。
  5. AIに事前に計画を立てさせ、作業後に自己評価させる余地を与える。
  6. AIエージェントの積極性を(「persistence」などの機能で)適切に制御する。

フロントエンド開発の具体例では、GPT-5が簡単なWebサイトの作成において、複雑な要件にも対応し、他のモデルと比較して質の高いコードを生成できることが示されました。

GPT-5は、コーディングをはじめとする様々な開発タスクにおいて、あなたの強力なパートナーとなるでしょう。これらの新しい機能や使い方を理解し、適切に活用することで、日々の開発作業をよりスムーズに進めることができます。

引用元: https://gihyo.jp/article/2025/08/programming-with-chatgpt-05

ペーパードライバー向けVRゲーム「PaperDrive」の開発者が、早期アクセス版の予想以上の反響に動揺し「期待しないで!買わないで!」とSNSで弱気な発言を連発し、話題になっています。月1本程度の販売を想定していたのが、5本以上売れそうだと焦る開発者の人間らしい反応が「可愛い」「面白い」と共感を呼び、シンプルな運転シミュレーターへの需要も浮き彫りになりました。

引用元: https://togetter.com/li/2592352

VOICEVOX:ずんだもん