株式会社ずんだもん技術室AI放送局 podcast 20260304
内容紹介
GPT-5.3 Instant: Smoother, more useful everyday conversations、Gemini 3.1 Flash-Lite: Built for intelligence at scale、cuTile.jl Brings NVIDIA CUDA Tile-Based Programming to Julia、ポケモン新作キャラ発表で「誰か予防接種うけてるホリケン描いて」と誤爆する人現る→しっかりとホリケンイラストが投下される
出演者
youtube版(スライド付き)
関連リンク
OpenAIは2026年3月3日、ChatGPTで最も利用されているモデルの最新アップデート版「GPT-5.3 Instant」をリリースしました。このモデルは、ベンチマークの数値だけでは測れない「日常的な対話の質」に焦点を当てており、より自然で、かつ的確な回答が可能になっています。新人エンジニアの方にとっても、AIとの対話やプログラミング補助において、よりストレスの少ない体験が期待できる内容です。
主な改善点は以下の4点です。
-
過剰な拒否や注釈(説教)の削減 従来のモデル(GPT-5.2 Instant)は、安全性を考慮しすぎるあまり、単純な質問に対しても長い警告文や道徳的な前置きを付け加える傾向がありました。5.3ではこれが大幅に改善され、ユーザーの意図を汲み取って直接的な回答を返すよう調整されています。これにより、対話のテンポが損なわれなくなりました。
-
Web検索情報の統合精度の向上 Web検索を利用した回答の際、単に検索結果を要約するだけでなく、モデルが持つ既存の知識と検索情報をより高度に融合させることができるようになりました。最新のニュースを既存の文脈に当てはめて解説する能力が向上し、情報の優先順位付けも洗練されています。
-
より自然で簡潔な対話スタイル 「深呼吸して」「落ち着いて」といった過剰な配慮や、不自然な決めつけが減少しました。よりフォーカスされた自然なトーンになり、設定から温かみや熱意の調整も可能になっています。ただし、日本語や韓国語においては、まだ表現が硬かったり直訳調になったりする課題が残っており、今後の改善課題とされています。
-
ハルシネーション(事実誤認)の低減 内部評価において、医療や法律といった高リスク領域でのハルシネーション率が、Web利用時で26.8%、内部知識のみで19.7%減少しました。ユーザーからのフィードバックに基づいた評価でも約10〜22%の精度向上が確認されており、情報の信頼性が高まっています。
エンジニア向けの提供情報 APIでは既に「gpt-5.3-chat-latest」として利用可能です。今後「Thinking」や「Pro」モデルへのアップデートも予定されています。なお、旧モデルであるGPT-5.2 Instantは、2026年6月3日までレガシーモデルとして提供された後に廃止される予定です。
今回のアップデートは、AIを単なる「検索機」や「ツール」としてではなく、より「意図を理解してくれるパートナー」へと進化させる重要なステップと言えます。
引用元: https://openai.com/index/gpt-5-3-instant
Google DeepMindは、Gemini 3シリーズにおいて最も高速かつコスト効率に優れた新モデル「Gemini 3.1 Flash-Lite」をプレビュー公開しました。このモデルは、大量のデータを処理する必要がある開発者向けに設計されており、高い知能を維持しながら圧倒的なスループットを実現しています。
1. 圧倒的なコストパフォーマンスとスピード Gemini 3.1 Flash-Liteの最大の特徴は、その経済性と速さです。価格は入力100万トークンあたり0.25ドル、出力100万トークンあたり1.50ドルと非常に安価に設定されています。性能面では、従来のGemini 2.5 Flashと比較して「最初のトークンが出るまでの時間(TTFT)」が2.5倍高速化され、全体の出力速度も45%向上しました。これにより、リアルタイム性が重視されるレスポンシブなアプリケーション開発が容易になります。
2. 軽量モデルの常識を覆す高い知能 「Lite(軽量)」という名称ながら、その能力は極めて強力です。Arena.aiのリーダーボードではEloスコア1432を記録。推論能力を測るGPQA Diamond(86.9%)や、マルチモーダル理解を測るMMMU Pro(76.8%)といった主要ベンチマークにおいて、前世代の標準モデルである2.5 Flashを上回る精度を達成しています。
3. 柔軟な制御を可能にする「Thinking levels」 開発者は、Google AI StudioやVertex AIを通じて、モデルの「思考レベル(Thinking levels)」を調整できます。これにより、タスクの内容に合わせて「どれくらい深く推論させるか」を柔軟に選択できるようになりました。コストを優先したい高頻度の単純作業から、深い洞察が必要な複雑なタスクまで、一つのモデルで効率的に管理が可能です。
4. 想定されるユースケース 新人エンジニアが実務で活用する際、以下のようなシーンで特に威力を発揮します:
- 大量のコンテンツ処理: 高ボリュームな翻訳、コンテンツモデレーション、データラベル付け。
- 動的なUI生成: ユーザーの入力に基づいたワイヤーフレームの即時構築やダッシュボードの生成。
- リアルタイム・エージェント: 複雑な複数ステップの指示に従うSaaSエージェントや、シミュレーションの実行。
現在は、Google AI StudioおよびVertex AIでプレビュー版として利用可能です。「賢いAIを、安く、大量に動かしたい」というエンジニアのニーズに直球で応える、実務特化型の強力なツールが登場したと言えます。
引用元: https://deepmind.google/blog/gemini-3-1-flash-lite-built-for-intelligence-at-scale/
NVIDIAは、Julia言語においてタイルベースのGPUプログラミングを可能にする新しいライブラリ「cuTile.jl」を発表しました。これは、Python向けに提供されていたcuTileと同様のプログラミングモデルをJuliaに持ち込むもので、最新のNVIDIA GPUの性能をより直感的に引き出すことが可能になります。
1. タイルベース・プログラミングによる抽象化 従来のCUDAプログラミングでは、エンジニアはスレッド、ワープ、メモリ階層、そして複雑なインデックス計算を個別に管理する必要がありました。これは新人エンジニアにとって非常にハードルが高い部分です。 cuTile.jlが導入する「タイルベース」のモデルでは、開発者は「データのタイル(塊)」単位で操作を記述します。ハードウェアへのスレッドのマッピングや境界チェックといった煩雑な処理はコンパイラが自動的にハンドルするため、開発者はアルゴリズムのロジックに集中できるようになります。
2. Juliaらしい直感的な記述(イディオム)の継承 cuTile.jlの最大の特徴は、Juliaの標準的な文法をそのままGPUカーネルの記述に活用できる点です。
- ブロードキャスト:
.+や.*といったJulia特有のドット演算子を用いた要素別演算が、GPUカーネル内でそのまま動作します。 - 標準関数の利用:
sumやsqrtなどの馴染み深い関数をタイルに対して適用できます。 これにより、コードの可読性が飛躍的に向上し、CPU向けに書かれたコードに近い感覚で高性能なGPUプログラムを記述できるため、学習コストが大幅に抑えられています。
3. 仕組みとパフォーマンス cuTile.jlは、独自のJuliaコンパイラを使用してコードを「Tile IR」という中間表現に変換します。これはPython版と同じバックエンドを利用するため、NVIDIA Blackwellアーキテクチャ(RTX 5080など)において、Python実装と同等の高いパフォーマンスを維持しています。行列演算やベクトル加算などの計算負荷の高いタスクにおいて、ハードウェアの性能を最大限に引き出すことができます。
4. 導入の要件と制約(利用上の注意) 本プロジェクトは現在オープンソースの実験的フェーズにあり、以下の制約があります。
- ハードウェア要件: NVIDIA Blackwell GPU、およびCUDA 13以上のドライバが必要です。
- ソフトウェア要件: Julia 1.11以上が必要です。
- 開発状況: 全てのJulia機能(イテレータベースのforループ等)がサポートされているわけではなく、APIが今後変更される可能性があります。
cuTile.jlは、Juliaの持つ高い記述性と、NVIDIAの最新ハードウェアが持つ圧倒的なパワーを融合させる期待のライブラリです。GPUプログラミングの複雑さを解消し、AIや科学計算の最適化をより身近なものにしてくれるでしょう。
引用元: https://developer.nvidia.com/blog/cutile-jl-brings-nvidia-cuda-tile-based-programming-to-julia/
ポケモン新作に登場する新キャラ「ポムケン」を巡る、SNSでの微笑ましい誤爆騒動です。あるユーザーが「予防接種を受けるポムケンの絵が見たい」と投稿しようとした際、誤って芸人の「ホリケン」と書いてしまいました。これに反応した絵師たちが、実際に注射を受ける堀内健氏のシュールなイラストを続々と投稿。ネット特有の即興性と高い創作力が生んだ、エンジニアの休憩時間にクスッと笑える癒やし系ニュースです。
引用元: https://togetter.com/li/2670435
(株式会社ずんだもんは架空の登場組織です)