株式会社ずんだもん技術室AI放送局 podcast 20260128
内容紹介
就職活動のためにLangGraph+ローカルLLMでアプリを作ったら、意外にも使える子に仕上がったので自慢させてくれ、Introducing Prism、Open R1: Update #4、Claude Codeで5分でずんだもん解説動画を作る!
出演者
youtube版(スライド付き)
関連リンク
本記事は、フランスで研究活動を行う筆者が、厳しいヨーロッパのIT就職戦線を勝ち抜くために、自身の技術力を証明する「技術ショーケース」として開発した言語学習日記アプリの紹介と、その開発プロセスを綴った成長物語です。
開発したアプリの概要
多言語学習者のための日記アプリ「LangDiaryAgentic」を開発。主な機能は以下の通りです。
- 未知表現の補完: 学習中の言語で書けない部分を
[ ]で囲んで母国語等で書くと、LLMが文脈に合わせて翻訳。 - 添削と書き換え: 文法誤りの指摘だけでなく、指定した言語レベル(CEFR基準)に合わせた自然な表現へのリライト。
- パーソナライズ学習: 過去の誤りをDBに保存し、RAG(検索拡張生成)を用いてユーザーの弱点に基づいたアドバイスを提供。
技術的な制約と工夫
「高価なGPUを持たない個人環境(ミニPC)」という制約下で、いかに実用的なシステムを作るかに挑戦しています。
- LangGraphによるエージェント分業: 単一のLLMに全てを任せるのではなく、翻訳、校閲、書き換え、アドバイスといった役割ごとにエージェントを分割。これにより、非力な小型モデルでも精度の高い「使える」出力を実現しました。
- ローカルLLMの選定: Ollamaを採用し、CPU環境でも動作する「Qwen2.5 3B」を選定。研究者らしく、精度と速度のベンチマークをとって最適なモデルを導き出しています。
- ローカルDBによるRAG: DuckDBやChromaDBを使い、全てのデータをローカルで完結させる構成にしました。
新人エンジニアへの学び
本記事から学べる重要な視点は「LLMの出力ミスを前提とした設計」です。特に小規模なローカルモデルは誤りを犯す可能性があります。筆者は「LLMの出力は間違っているかもしれない」と考え、ユーザーがUI上で簡単に修正できる設計にしました。この「修正するプロセス自体が学習になる」という逆転の発想は、実用的なAIアプリ開発における重要なヒントになります。
まとめ
厳しい雇用情勢の中でも、自分が本当に必要とするツールを最新技術(LangGraph, RAG, Local LLM)で作り込み、公開する姿勢は、エンジニアとしての確かな「武器」になります。技術を楽しみながら、制約を工夫で乗り越える開発の醍醐味が詰まった記事です。
引用元: https://qiita.com/Ultra-grand-child/items/d3f492b66a35bbaa0a94
OpenAIは、科学研究のプロセスを根本から変えるための新しいAIネイティブなワークスペース「Prism」を発表しました。これは、科学者が研究論文の執筆や共同作業を行うためのクラウドベースのプラットフォームで、最大の特徴は最新の推論モデル「GPT-5.2」がワークフローに直接統合されている点です。
これまで、科学者やエンジニアが論文を執筆する際は、エディタ、LaTeXコンパイラ、リファレンス管理ツール、PDFビューア、そしてAIチャットといった複数のツールを行き来する必要があり、作業の断片化が大きな課題でした。Prismはこの断片化を解消し、執筆、数式・引用管理、共同編集、そして出版準備までのすべてを一つの場所で完結させます。
新人エンジニアや研究者にとって注目すべき主な機能は以下の通りです。
- 高度な文脈理解を伴うGPT-5.2の統合 GPT-5.2は、数理・科学的推論に特化したOpenAIの最新モデルです。Prism内では、文書全体の構造、数式、引用、図表の文脈を完全に理解した状態で、推論やドラフトの作成、修正案の提示を行います。
- LaTeXネイティブな編集環境 OpenAIが買収したクラウド型LaTeXプラットフォーム「Crixet」をベースにしており、高度な執筆環境を最初から備えています。ホワイトボードに書かれた手書きの数式や図を即座にLaTeXコードへ変換する機能など、エンジニアの作業時間を大幅に短縮する仕組みが整っています。
- リサーチと引用の自動化 arXivなどの文献データベースから関連する論文を検索し、執筆中の文脈に合わせて内容を取り込んだり、最新の知見に基づいて文章をリライトしたりすることが可能です。
- リアルタイムの共同作業 「無制限のプロジェクト数」と「無制限の共同編集者数」を無料で提供します。地理的に離れた場所にいる共著者やアドバイザーと、環境構築の手間なく即座に共同作業を開始できます。
Prismは現在、個人のChatGPTアカウントを持つすべてのユーザーに無料で公開されています。今後はChatGPT BusinessやEnterpriseなどの組織向けプランにも展開される予定です。
OpenAIは、2025年にAIがソフトウェア開発を劇的に変えたように、2026年はAIが科学研究の摩擦を減らし、発見のスピードを加速させる年になると予測しています。Prismはその未来に向けた、強力かつアクセシブルな第一歩となるツールです。
引用元: https://openai.com/index/introducing-prism
Hugging Faceによる、DeepSeek-R1のオープンな再現プロジェクト「Open-R1」の最新アップデート情報をお届けします。今回は、突如として公開された新モデル「DeepSeek-V3-0324」の驚異的な性能と、開発者が知っておくべき利用上の安全性が主なトピックです。
1. 新モデル「DeepSeek-V3-0324」の性能と変更点
DeepSeek-V3の更新版である本モデルは、数学やコーディング能力が飛躍的に向上しました。ベンチマークスコアではGPT-4.5と肩を並べ、Claude 3.7 Sonnetを多くの項目で上回るなど、世界トップクラスの性能を誇ります。 特に、ライセンスが従来のカスタムライセンスからMITライセンスに変更された点は非常に重要です。これにより、商用利用を含め、エンジニアがより自由に、安心してモデルを利用・改変できるようになりました。
2. 具体的な改善内容
- コーディング: Webフロントエンド開発において、より実行可能でデザイン性の高いコードを生成できるようになりました。
- 数学・論理: 数学ベンチマーク(AIME)で大幅なスコアアップを達成し、複雑な推論に強くなっています。
- 機能の修正: 以前のバージョンで課題だった「関数呼び出し(Function Calling)」の精度が改善され、外部ツールとの連携がより確実になりました。
- 執筆・分析: 長文作成の質が向上し、レポート分析などの検索を伴うタスクでも詳細な出力が可能になっています。
3. エンジニア向けの利用方法
本モデルは、Hugging Faceの推論APIを通じて数行のコードで試せるほか、TGIやSGLangといった主要な推論エンジンに対応しています。また、高い計算リソース(GPUメモリ)を必要としますが、Unslothが提供する「動的量子化(Dynamic Quants)」版を利用すれば、メモリ消費を抑えて動作させることも可能です。
4. 安心して利用するための安全性ガイド
新人エンジニアの方が特に気になる「モデルの実行リスク」についても、以下の通り安全策が整理されています。
- ファイルの安全性: モデルは
safetensors形式で配布されており、古い形式(Pickle)と異なり、ファイル読み込み時に悪意のあるコードが実行されるリスクはありません。 - コードのレビュー: AIが生成したコードには脆弱性が含まれる可能性があるため、人間による確認やツールでのスキャンは不可欠です。
- エージェントの運用: モデルに自律的な操作(AIエージェント)をさせる場合は、PC本体から隔離された「サンドボックス環境」で実行し、機密情報を直接渡さないことが推奨されます。
このアップデートにより、オープンなモデルが商用の最先端モデルに匹敵する実力を持つようになった、非常にエキサイティングな状況と言えます。
引用元: https://huggingface.co/blog/open-r1/update-4
Macで「ずんだもん」解説動画を制作できる、RemotionとVOICEVOXを組み合わせたテンプレートの紹介です。Claude Codeとの対話を通じて、コードベースで動画を生成できるのが特徴です。制約として、Node.js(v18以上)やVOICEVOXのAPIサーバーの起動、口パク用画像素材の用意が必要です。エンジニアに馴染み深い技術スタックで、AIアシスタントを活用した自動化体験を手軽に楽しめます。
引用元: https://note.com/electrical_cat/n/n9be53194cb5c
(株式会社ずんだもんは架空の登場組織です)