私立ずんだもん女学園放送部 podcast 20250808

2025年08月08日

MP3ファイルをダウンロード

内容紹介

Introducing GPT-5、gpt-oss-120bをpythonとvLLMで触りながら理解する、NTT、純国産AI「tsuzumi 2」10月公開--ChatGPTの4oに匹敵する日本語能力

出演者

お嬢様ずんだもん

関連リンク

Introducing GPT-5

OpenAIは、これまでで最も高性能なAIシステム「GPT-5」を発表しました。これは、以前のモデルから大きく進化しており、新人エンジニアの皆さんが日々の業務でAIをさらに活用できるようになる、とても重要なニュースです。

GPT-5は、「スマートで効率的なモデル」と「より深く考える推論モデル（GPT-5 thinking）」を自動で使い分ける「統合システム」として設計されています。これにより、簡単な質問には素早く、難しい問題にはじっくり考えて専門的な回答を出せるようになりました。「もっと深く考えてほしい」と指示すれば、AIが推論を強化することも可能です。

特に、以下の点で大きな進化を遂げています。

コーディング能力の向上: Webサイトやアプリのデザインを含むフロントエンドの生成、大きなコードのリポジトリのデバッグが大幅に改善されました。直感的にアイデアを形にする能力が高まり、デザインセンスも備えています。
文章作成能力の向上: 報告書やメール作成など、日々の業務で役立つ文章をより説得力があり、自然な形で作成できるようになりました。複雑な構造の文章も得意です。
健康関連情報の強化: 健康に関する質問に対して、より正確で信頼性の高い情報を提供できるようになりました。ただし、AIはあくまで補助であり、医療専門家の代わりではない点に注意が必要です。

また、GPT-5は、AIが誤った情報を作り出す「ハルシネーション」を大幅に減らし、ユーザーの指示に忠実に従う能力も向上しました。これにより、より信頼性の高い回答が得られます。不可能または情報不足のタスクに対しては、正直に「できません」と伝えたり、限界を明確に伝えたりするようになりました。これは、AIとのやり取りにおいて非常に重要な改善点です。

安全性にも力を入れており、新しいトレーニング方法で、有害なコンテンツを生成するリスクを減らしつつ、有益な回答を提供できるようになっています。また、モデルが過度にへつらう「sycophancy」と呼ばれる傾向も改善され、より自然で建設的な会話ができるようになりました。さらに、「Cynic」「Robot」「Listener」「Nerd」といった4つの新しいプリセット人格が導入され、ユーザーの好みに合わせてAIの話し方を選べるようになります。

最も複雑なタスク向けには、さらに強力な「GPT-5 pro」も提供されます。これは「GPT-5 thinking」よりもさらに深く思考し、最高品質で包括的な回答を提供します。

GPT-5は、ChatGPTの新しいデフォルトモデルとして、Plus、Pro、Team、およびFreeユーザーに順次提供されます。Proユーザーは無制限に、Plusユーザーはより高い利用量で、Freeユーザーは使用制限を超えると「GPT-5 mini」という軽量版に切り替わります。ChatGPTにアクセスするだけで自動的にGPT-5が利用できるようになるため、特別な操作は不要です。

今回のGPT-5の発表は、AIが私たちの仕事や生活に深く浸透し、より強力なツールとなることを示しています。新人エンジニアの皆さんも、ぜひこの新しいAIを積極的に試して、その可能性を探ってみてください。

引用元: https://openai.com/index/introducing-gpt-5

gpt-oss-120bをpythonとvLLMで触りながら理解する

このブログ記事は、OpenAIから新しく登場したオープンソースの大規模言語モデル（LLM）「gpt-oss-120b」と「gpt-oss-20b」を、PythonとvLLMという高速化ライブラリを使って実際に動かしながら、その特徴や使い方を解説しています。

まず、gpt-ossモデルは、たくさんの小さなモデルを組み合わせて賢く動く「MoE（Mixture of Experts）」という技術を使っているのが大きな特徴です。特に120bモデルは全体で1200億個ものパラメータを持っていますが、実際に計算に使う「アクティブパラメータ」は51億個と少なく、これにより高速に動作することが期待されます。ライセンスはApache2.0なので、個人・商用問わず自由に利用できます。

記事では、このモデルをvLLM上で動かす具体的な手順が紹介されています。特に注目すべきは「OpenAI Harmony」という仕組みです。これは、モデルとの会話のやり取りを統一的に扱うためのフォーマットで、モデルが「どのように考えて（analysis）」から「最終的な答えを出す（final）」までの過程を区別して表示できるのが面白い点です。これにより、モデルがどのように推論しているかを詳しく理解することができます。

また、通常のAIモデルと同様に「transformers」ライブラリのtokenizer（言葉をモデルが理解できる形に変換する仕組み）を使っても動かせることが示されています。日本語の質問に対しても、モデルが思考過程を挟みながら回答を生成する様子が具体的に示されており、モデルの賢さを垣間見ることができます。

さらに、gpt-ossモデルは「Tool Use（ツール利用）」という機能も備えています。これは、モデルが外部のプログラム（Python関数やWebブラウザなど）を自分で呼び出して、質問に答えるために必要な情報を取得したり、計算したりできる機能です。例えば、「パリの天気」を尋ねると、モデルは天気情報を取得するためのツールを呼び出す指示を生成し、その結果を使って最終的な回答を出力します。組み込みのツールとして「Python」や「Browser（Web検索）」も利用できるため、日付計算やWeb検索などもモデルにさせることができます。

ただし、記事の検証によると、現状では複数のツールを同時に並行して使うことはできないようです。例えば「スペインとフランスの最高気温を調べて」と尋ねても、片方ずつしか検索しようとしない点が確認されています。

まとめると、gpt-ossモデルはMoE構造による高速な推論、OpenAI Harmonyによる思考過程の可視化、そしてTool Useによる外部連携能力を持つ、非常に興味深いオープンソースLLMです。新人エンジニアがLLMの動かし方や、内部的な動作の理解を深めるのに役立つ内容となっています。

引用元: https://tech-blog.abeja.asia/entry/gpt-oss-vllm

NTT、純国産AI「tsuzumi 2」10月公開–ChatGPTの4oに匹敵する日本語能力

NTTは2025年10月、純国産の大規模言語モデル（LLM）「tsuzumi（つづみ）」の第2世代モデル「tsuzumi 2」を公開すると発表しました。この最新モデルは、日本語の理解能力が大幅に向上しており、OpenAIのChatGPTの最新モデル「GPT-4o」に匹敵するほどの高い性能を持つとされています。

「tsuzumi 2」の最大の特長は、複雑な文脈や意図を正確に読み取る能力が強化された点です。例えば、社内の経理マニュアルに関する問い合わせ対応では、以前のモデルに比べ回答精度が4倍に向上しました。これは、企業内の膨大な文書を効率的に活用し、業務の生産性を高める上で非常に有効です。

また、AIの性能を示す指標である「パラメータ数」は、初代の70億（7B）から300億（30B）へと大きく拡大しました。しかし、性能向上と同時に、1つのGPUで動作可能なコストパフォーマンスの良さを維持しているのが注目ポイントです。これにより、高性能なAIを導入する際の費用を抑えることができます。さらに、企業の機密情報を外部に漏らすことなく扱えるよう、自社サーバーでの運用（オンプレミス環境）にも対応しています。

NTTは、AIの導入にあたり、単に技術を提供するだけでなく、顧客企業それぞれの課題に合わせたコンサルティングを重視しています。すでに国内外で約800件の導入実績があり、豊富な経験に基づいたサポートを提供しています。

「tsuzumi 2」は、日本語に特化した高い処理能力と、優れた費用対効果、そしてセキュアな運用環境を兼ね備えることで、日本の企業におけるAI活用を強力に推進する存在となるでしょう。純国産AIのこの進化は、日本全体のデジタル化を加速させる重要な一歩として期待されます。

引用元: https://japan.cnet.com/article/35236405/

お便り投稿フォーム

VOICEVOX:ずんだもん