株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260601

2026年06月01日

MP3ファイルをダウンロード

内容紹介

Zero Trust for AI agents、Gemma 4が4種類もあって混乱したので整理してみた!、Introducing 1-bit and Ternary Bonsai Image 4B: Image Generation for Local Devices、拙者、『型は欲しいが型は書きたくない』者たちとの和睦を結び、るびぃにおける型の領地安堵を実現せんと欲す者也 #sekigahara01/sekigahara01

出演者

春日部つむぎ
春日部つむぎ

youtube版(スライド付き)

関連リンク

本書は、企業において自律型AIエージェントを安全に導入・運用するための新しいセキュリティフレームワークについて解説したドキュメントです。

1. 背景:AIの進化がもたらす「超高速な脅威」

近年のAI技術の急速な進化により、システムの脆弱性が発見されてから、それが実際に攻撃(悪用)されるまでの時間が「数ヶ月単位」から「わずか数時間」へと劇的に短縮されています。防御側がAIを使って素早くバグを修正できる一方で、攻撃側もAIを利用してあっという間に脆弱性を突く攻撃コードを作成できるようになっています。

特に、自ら考えてツールを使いこなす「AIエージェント」を導入する場合、従来のアクセス制御(IP制限やIDパスワードなど)だけでは防げません。正規の権限を与えられたAIエージェントが、悪意あるデータに騙されて、許可されたツールを予期せぬ形で「誤用」してしまうリスクがあるためです。

2. AIエージェントを狙う新たな脅威

AIエージェントの運用には、以下のような特有のセキュリティリスクが伴います。

  • プロンプトインジェクション: 外部からの入力データに悪意ある指示を混ぜ込み、AIを意図通りに操る攻撃。
  • ツールやメモリの汚染: エージェントが参照するツールや過去の会話履歴(記憶)に嘘の情報を仕込み、AIに誤った判断をさせる攻撃。
  • 権限の不正利用: エージェントが必要以上の権限を持つことで、意図しないデータ削除や操作が行われてしまうリスク。

3. 解決策:AIのための「ゼロトラスト」

これらの脅威に対抗するため、「何も信頼せず、すべてを検証する」というセキュリティの基本思想「ゼロトラスト」をAI向けに再定義したフレームワークを提案しています。

  • 暗号による厳格な身元確認: エージェント自身のアイデンティティ(ID)を暗号技術で強固に管理・検証します。
  • タスクごとの最小権限割り当て: エージェントに広範な権限を持たせるのではなく、実行するタスクごとに必要な最小限の権限のみをその都度与えます。
  • 実行環境のサンドボックス化: 万が一エージェントが乗っ取られても他のシステムに影響が及ばないよう、安全に隔離された環境(サンドボックス)で動作させます。
  • メモリと入出力の保護: 過去の対話履歴が改ざんされないよう保護し、エージェントに入るデータと出るデータを厳しくチェック・フィルタリングします。
  • AIによる自律的な防御運用(Agentic SOAR): AIのスピードで仕掛けられる攻撃に対抗するため、防御側も自動で脅威を検知し対処する高速なセキュリティ体制を整えます。

4. まとめ(新人エンジニアの皆様へ)

これからのAIエージェント開発においては、便利な機能を作るだけでなく、設計の初期段階から「システムはいつか突破されるものである」という前提(Assume Breach)に立ち、多層防御のアーキテクチャを意識してシステムを構築することが非常に重要になります。

引用元: https://claude.com/blog/zero-trust-for-ai-agents

本記事は、Googleが2026年4月にリリースしたオープンウェイト(ローカルや自社サーバーで動かせる)LLM「Gemma 4」の4つのモデルについて、新人エンジニア向けにその違いと実務でのユースケースを分かりやすく整理したものです。

Gemma 4には、モデルの構造(アーキテクチャ)やパラメータ数が異なる4つのモデルが存在します。それぞれの特徴は以下の通りです。

1. Gemma 4 31B (高品質・高スペック向け)

  • 特徴: 全パラメータを毎トークン使用する最も標準的な構造(Dense)です。
  • 注意点: 実行には非常に高いマシンスペックが要求され、メモリ(VRAM/RAM)が最低でも約31GB必要になります。
  • ユースケース: リクエスト数は少ないものの、AIの「出力品質」を最優先したい業務。

2. Gemma 4 26B A4B (Active 4B) (高速かつ賢いMoEモデル)

  • 特徴: 複数の専門家モデルを切り替える「MoE」技術を採用。全体の重みは26Bですが、実行時は約4Bのパラメータのみを使うため、26Bクラスの賢さを保ちつつ4Bモデル並みの超高速な推論が可能です。
  • 注意点: 起動(ロード)用に26GB以上のメモリが必要です。
  • ユースケース: 自社サーバーにホストし、AIベンダーのAPIと同じように高速かつ多目的で使いたい場合。

3. Gemma 4 E4B (Effective 4B) (高効率・コスパ最強候補)

  • 特徴: 省メモリ技術「PLE」を採用し、モデル自体は8Bですが、実行時は実質4B相当の計算負荷に抑えられています。スマホでも高速に動作する軽さです。
  • ユースケース: 特定のタスクに特化させてファインチューニング(微調整)を行い、本番環境で安価かつ高速に動かす実用的な運用。

4. Gemma 4 E2B (Effective 2B) (超軽量・エッジ向け)

  • 特徴: PLEを採用し、モデルは5B、実行時は2B相当で動作します。ラズパイなどでも動く軽さです。
  • ユースケース: ネットワーク接続のない環境や、応答速度(レイテンシー)が最優先されるシンプルなタスク。

■ 開発時に選ぶべき「it」モデルとは? モデル名に「it」というサフィックス(接尾辞)がついているものは、Instruction-Tuned(指示チューニング済み)を意味します。これがないモデルは事前学習のみで会話には不向きなため、自らファインチューニングをしない場合は必ず「it」付きモデルを選びましょう。

まとめ Gemma 4をセルフホストして使う際は、汎用的な賢さを求めるなら「26B A4B」、特定のタスクを低コスト・ハイスピードで処理させたいなら「E4B」をカスタマイズして使うのが、実務において非常に強力な選択肢となります。

引用元: https://zenn.dev/tasshi441/articles/8a80daffac2556

PrismMLは、スマートフォンやノートPCなどのローカルデバイス上で、高品質な画像生成(拡散モデルの推論)を可能にする軽量モデルファミリー「Bonsai Image 4B」をリリースしました。ベースモデル「FLUX.2 Klein 4B」のアーキテクチャを維持しつつ、モデルの大部分を占めるDiffusion Transformerの重みを極限まで圧縮した2つのバリアントが提供されます。

1. 2つのバリアントと特徴

新人エンジニア向けに解説すると、本モデルは「量子化(データの精度を意図的に落として軽量化する技術)」を究極まで突き詰めています。これにより、これまでメモリ不足でスマホでは起動すらできなかった巨大な画像生成モデルを、スマホの限られたメモリ内で高速に動かせるようにしています。

  • 1-bit Bonsai Image 4B(極限の圧縮モデル)
    • 特徴: 重みを「-1」と「+1」の2つの値(実質1.125ビット)だけで表現。
    • サイズ: 拡散Transformerのサイズが 0.93 GB(元の7.75 GBから 8.3倍削減)。
    • 用途: メモリや通信帯域、デバイス容量が極めて厳しい環境に最適です。
  • Ternary Bonsai Image 4B(バランス重視モデル)
    • 特徴: 重みを「-1」「0」「+1」の3値(実質1.71ビット)で表現。「0」の表現が加わることでモデルの表現力が格段に向上。
    • サイズ: 拡散Transformerのサイズが 1.21 GB(元の7.75 GBから 6.4倍削減)。
    • 性能: 元のモデルの約95%の画質とプロンプト忠実度を維持しています。

2. ローカル実行時の圧倒的なメモリ削減

通常、512x512ピクセルの画像を生成する場合、元のモデルは11.74 GBものメモリ(RAM)を必要としますが、今回の1-bit版は1.5 GB、Ternary版は1.96 GBのメモリ消費に抑えられます。 これにより、iPhone 17 Pro Max上で約9.4秒、Mac M4 Pro上では約6秒で画像生成が可能です。

3. なぜ「ローカル画像生成」が重要なのか?

従来のクラウド型API(サーバー側での生成)には、1回ごとの通信遅延、サーバー代、プロンプトのプライバシー保護といった課題がありました。 画像生成は、ユーザーが何度もプロンプトを微調整しながら繰り返す「試行錯誤(イテレーション)」が基本です。モデルがユーザーのデバイス(ローカル)で直接動くようになれば、サーバーコストを気にせず、オフラインでもプライバシーを完全に守りながら、高速で快適な画像生成体験を提供できるようになります。

4. ライセンスと公開情報

Bonsai Image 4Bは、オープンな重み(モデルデータ)とコードが Apache 2.0ライセンス で公開されており、商用利用やカスタマイズが可能です。iPhoneで手軽に試せる「Bonsai Studio」アプリもあわせてリリースされています。

引用元: https://prismml.com/news/bonsai-image-4b

「型は欲しいが型は書きたくない」というRubyistの葛藤に対し、型検査とドキュメントとしての役割を分けて考えることを提案するスライドです。型シグネチャを「人のためのドキュメント」と捉え、AIを活用して保守コストを下げるアプローチを紹介しています。さらに、型関連ツールの導入やアップデートを自動化・統合する自作のgem「sigsa」の開発についても触れており、型を意識しない快適な開発体験の実現を目指しています。

引用元: https://speakerdeck.com/sanfrecce_osaka/sekigahara01

VOICEVOX:春日部つむぎ