株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20250319

2025年03月19日

Audio Player

00:00
00:00:00 | 00:00:00
Use Up/Down Arrow keys to increase or decrease volume.

MP3ファイルをダウンロード

内容紹介

15分でわかる!AIエージェント開発の最新フレームワーク OpenAI Agents SDK、NVIDIA Blackwell Delivers World-Record DeepSeek-R1 Inference Performance NVIDIA Technical Blog、RAGの検索性能を90%も低下させるテキストの落とし穴、東大のあるレポート課題に「ChatGPTは使っていいが参考文献にプロンプトは全部書け」と謎ルール→むしろ本質的な意味で「学生の理解度」が分かるのでは

出演者

ずんだもん
ずんだもん

関連リンク

OpenAI Agents SDKは、AIエージェント開発を効率化するフレームワークです。複数のAIエージェントが連携し、複雑なタスクを処理できます。 主要な概念は以下の4つです。

  1. エージェント:名前、役割、モデル、ツールを設定
  2. ハンドオフ:タスクを他のエージェントに委譲
  3. ガードレール:不適切な入力をチェックし拒否
  4. トレーシング:エージェントの動作を可視化 記事では、これらの概念をPythonで実装し、具体的な動作例を示します。 これにより、AIエージェントシステムの開発、デバッグ、監視が容易になります。

引用元: https://qiita.com/Kumacchiino/items/51a8ffee98eeb4f8d0c6

NVIDIA Blackwell GPUと最適化された推論ツールにより、大規模言語モデル(LLM)の推論性能が大幅に向上。DeepSeek-R1モデルで世界記録を達成。TensorRT-LLMなどのソフトウェア改善も貢献。FP4精度での推論も精度を維持しつつ高速化。cuDNNやCUTLASSなどのライブラリもBlackwellアーキテクチャ向けに最適化。

引用元: https://developer.nvidia.com/blog/nvidia-blackwell-delivers-world-record-deepseek-r1-inference-performance/

RAGの検索で重要な役割を担うEmbeddingですが、テキストの特性によって性能が大きく左右されることが論文で指摘されています。具体的には、文章の位置、単語、文章量がEmbeddingの性能に影響を与え、最大90%も検索性能が低下する可能性があるとのことです。例えば、重要な情報が文章の先頭にあるか、同じ意味でも異なる単語が使われているか、文章の長さなどが影響します。対策として、紹介されている関連技術も参考に、自身のケースに合った方法を見つけることが重要です。

引用元: https://zenn.dev/knowledgesense/articles/ff2c528acf6b04

東大のレポート課題でChatGPT利用が許可されたものの、使用したプロンプトを全て参考文献として記述するルールが話題。このルールは、AIが生成した成果物だけでなく、学生がAIにどのような指示を与えたか、つまり思考プロセスを可視化する狙いがある。AI利用時の学生の理解度を評価し、認識のずれを指導する上で有効。ただし、プロンプトや生成結果を詳細に記述すると参考文献が膨大になるという課題も指摘されている。

引用元: https://togetter.com/li/2526803

(株式会社ずんだもんは架空の登場組織です)