株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20251014

2025年10月14日

MP3ファイルをダウンロード

内容紹介

The Tiny Teams Playbook、Every LLM Is Its Own Media Channel AIVO Journal、Huawei、LLMの精度を保持したまま最大70%メモリ削減できる新手法を発表──コンシューマーGPUでの高精度生成AI実行も視野に Ledge.ai、カイジの絵が下手だと思っていた時期があったが、いざ模写してみると圧倒的な上手さに気づいた話「ピカソの絵を下手だと評することと同じ」

出演者

ずんだもん
ずんだもん

youtube版(スライド付き)

関連リンク

この記事は、AIエージェントの進化が加速する現代において、少人数ながらも高い生産性を誇る「Tiny Teams」の成功戦略をまとめたものです。日本の新人エンジニアの皆さんが、これからのチームでの働き方やAIとの協業を考える上で、貴重なヒントとなるでしょう。

「Tiny Teams」とは、従業員数よりも多くの年間経常収益(ARR)を生み出す、極めて効率的なチームのことです。AIが知識労働を自動化・拡張できるようになった今、AIを最大限に活用し、スピードと効率性で大きな成果を出す新しい組織の形として注目されています。

AI Engineer Summitで共有された、成功しているTiny Teamsからの普遍的なアドバイスは以下の通りです。

  1. 採用 (Hiring)
    • 厳選された優秀人材: 真に期待できる候補者のみ採用。
    • 有給ワークトライアル: 短期間のプロジェクトで適性を見極める。
    • 製品からの採用: サービスに熱意ある顧客をチームに招く。
    • 高水準の報酬: 優秀な人材には、相応の給与で高いモチベーションを維持。
    • 少人数のベテラン「ジェネラリスト」: 幅広いスキルを持つ経験豊富なメンバーで構成。
  2. 文化と価値観 (Culture & Value)
    • 「低エゴ、高信頼」: 信頼に基づき、迅速な意思決定を促進。
    • 自立心、粘り強さ、レジリエンス: 困難に屈せず、解決策を探す姿勢。
    • 徹底した透明性と責任: 進捗や課題を共有し、各自が責任を持つ。
    • ユーザー中心: 顧客のフィードバックを重視し、喜ばれる製品開発。
    • 連帯感とスピード: 楽しみながら素早く行動し、チームの活力を維持。
  3. 運営 (Operations)
    • 会議を最小限に: 「深い集中」の時間を確保し、生産的な作業を優先。
    • AIを「Chief of Staff」として活用: リサーチやマーケティングをAIで自動化。
    • AIによるカスタマーサポート: 顧客対応の効率化と品質向上。
    • 優先順位付け(Let Fires Burn): 重要な課題に集中し、全てを解決しようとしない。
    • 「二度と学ばない」知識共有: 再利用可能なテンプレートで効率的な学習と活用。
    • 対面での交流: オフィスや合宿でチームの結束を強化。
  4. 技術と製品 (Tech and Product)
    • シンプルで堅実な技術スタック: メンテナンスしやすく信頼性の高い技術を選択。
    • シンプルな製品から開始: 核となる機能に絞り、迅速にリリース。
    • フィーチャーフラグによる実験: 新機能を段階的に導入し、ユーザーの反応を確認。
    • 独自のベンチマーク作成: LLMの性能評価など、製品改善のための評価システムを構築。

これらの戦略は、AIを活用し大きな成果を出しているチームから学んだ知見です。新人エンジニアの皆さんも、効率的なチームのあり方やAIとの協業について考える上で、ぜひこれらのヒントを活用してください。

引用元: https://www.latent.space/p/tiny

LLMは全部同じじゃない!それぞれのAIで「情報の見つけ方」が違う理由

多くのエンジニアやマーケターは、ChatGPT、Gemini、ClaudeのようなLLM(大規模言語モデル)を「AI」として一括りに見てしまいがちです。しかし、この記事は、これらのLLMがそれぞれ独自の「情報の収集方法」や「評価基準」を持つ、全く異なる情報チャネルであると警鐘を鳴らしています。まるでGoogle、Meta、TikTokを同じものとして扱うのが間違いであるように、LLMも個別に戦略を立てる必要があるというのです。

なぜLLMごとに情報の見つけ方が違うのでしょうか?

  1. ChatGPT-4o/o1:
    • 特徴: 「最新の情報」と「信頼できる情報源」を非常に重視します。タイムスタンプが新しく、人間がレビューした情報や、公式なライセンスを持つメディアのコンテンツが優先されます。
    • ポイント: 情報の「鮮度」と「出どころの信頼性」が鍵です。
  2. Gemini 1.5 Pro:
    • 特徴: Googleの知識グラフ(Knowledge Graph)と深く連携し、「具体的な『モノ』や『概念』と結びついたデータ(エンティティリンクされたデータ)」を重視します。情報が決められたデータ形式(スキーマ)で構造化されていると、見つけてもらいやすくなります。
    • ポイント: 情報が「何について」のもので、その構造が「明確である」ことが重要です。
  3. Claude 3.5 Sonnet/Opus:
    • 特徴: 「情報の信頼性」と「倫理的な価値観との整合性」を厳しく評価します。過度に最適化されたり、推測に基づいたりするコンテンツは評価が低く、専門家が監修し、中立的な表現で、安全性が確認された情報を好みます。
    • ポイント: 情報の「客観性」と「質の高さ」が求められます。

これらのLLMが今後も統合される可能性は低いと筆者は指摘します。それは、データ収集のライセンスや各国・地域の法律(ガバナンス)が異なるため、各LLMが独自のエコシステムとして進化していくからです。

新人エンジニアが意識すべきこと LLMを活用したサービスやアプリケーションを開発する際、この違いを理解することが非常に重要です。

  • データの準備: 各LLMが重視するポイントに合わせて、データの鮮度、構造化、信頼性を考慮して準備しましょう。
  • プロンプト設計: 例えば、ChatGPTには最新情報へのアクセスを促すプロンプト、Geminiには構造化されたデータの参照を促すプロンプト、Claudeには中立的で信頼できる情報源を求めるプロンプトなど、LLMの特性を活かした設計が求められます。
  • コンテンツ作成: LLMに生成させるコンテンツや、LLMが参照する外部コンテンツを作成する際も、それぞれのLLMの評価基準に合致するように工夫が必要です。

まとめると、LLMは「単一のAI」ではなく、「個別の特性を持つ情報収集・評価システム」です。それぞれのLLMの個性を見極め、それに合わせたアプローチを取ることが、これからのAI時代で成功するための重要な視点となるでしょう。

引用元: https://www.aivojournal.org/every-llm-is-its-own-media-channel/

Huaweiが、大規模言語モデル(LLM)をもっと手軽に、そして高性能なGPUがなくても利用できるようにする画期的な新技術「SINQ(Sinkhorn-Normalized Quantization)」を発表しました。これは、AIの精度を保ったまま、AIが動くコンピューターのメモリ使用量を大幅に削減できる技術です。

最近注目されているChatGPTのようなLLMは非常に賢いですが、動かすためには膨大なメモリ(VRAM)を積んだ高性能なグラフィックボード(GPU)が必要です。そのため、多くの人が手元のPCで気軽に試したり、スマートフォンなどの小さなデバイスにAIを組み込んだりするのは難しいという課題がありました。

SINQは、AIモデルのデータ(重み)を「量子化」という技術で圧縮し、メモリ消費を抑える手法です。従来の量子化では、データを圧縮するとAIの精度が落ちてしまいがちで、その精度を元に戻すために「再調整(キャリブレーション)」という手間のかかる追加作業が必要でした。しかし、SINQの最大の特徴は、この再調整が一切不要になる点です。

この技術の核となるのは、「Sinkhorn-Knoppアルゴリズム」という数学的な手法の応用です。AIモデルの重みデータに存在する「外れ値」(極端に大きい・小さい値)が特定の場所に偏るのを防ぎ、データ全体が均一に分散されるように調整します。これにより、データを大幅に圧縮しても、AIの予測精度をほとんど損なうことなく維持できるのです。

具体的な成果としては、AIの精度を高く保ったまま、メモリ使用量を最大70%も削減できます。これは非常に大きな進歩で、例えば、私たちが普段使うような8GB程度の一般的なグラフィックボードでも、これまで専門的な高性能GPUでしか動かせなかったような大規模なLLM(Qwen3-7Bモデルなど)を動かせるようになることを意味します。さらに、データ圧縮の処理自体も非常に高速で、従来の再調整が必要な手法と比べて最大30倍も速いと報告されています。

SINQは、HuaweiのQwenシリーズだけでなく、Llama 2やLlama 3など、様々なLLMに適用できる汎用性の高さも魅力です。これにより、高性能なGPUに頼らずにLLMを運用する道が開かれ、手元のPCやエッジデバイス(小型の端末)でも高品質な生成AIが使える未来が近づきます。この技術のコードはGitHubで公開されており、世界中のエンジニアが自由に試したり、さらに応用したりすることが期待されています。

この技術は、将来皆さんが少ないリソースでAIアプリを開発したり、AIを様々な製品に組み込んだりする際に、とても役立つ基礎技術になるでしょう。AIの可能性を広げる、重要な一歩と言えます。

引用元: https://ledge.ai/articles/huawei_sinq_quantization_llm

漫画『カイジ』の絵は、独特なタッチのため『下手』と思われがちですが、実はプロも認める『圧倒的な巧みさ』を持つと話題です。実際に模写すると、キャラクターの個性、読者を惹き込む視線誘導、コマ割り、心理描写といった『漫画としての総合力』の高さに気づかされます。これは表面的な印象で判断せず、奥にある本質や技術を見抜く大切さを教えてくれます。新人エンジニアの皆さんも、一見シンプルなものに隠された深い工夫を探求する視点を持つ良いきっかけとなるでしょう。

引用元: https://togetter.com/li/2615004

(株式会社ずんだもんは架空の登場組織です)