株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20240910

2024年09月10日

MP3ファイルをダウンロード

内容紹介

AIやテクノロジーに関する記事を紹介 本システム導入の目標は、生産性向上なんかじゃありません タイム・コンサルタントの日誌から、Googleの画像生成AI「Imagen3」(ImageFX)の使用経験|Browncat、Tanuki-8BとOllamaとDifyを使って日本語ローカルRAG構築

出演者

ずんだもん
ずんだもん

スライド付きWeb放送

スライド付きWeb放送 ※ スマホに対応してないのでPCから見てね

関連リンク

この記事では、ITシステム導入の目的は、単に生産性向上だけではないという主張が展開されています。著者は、日々の生活や業務における様々な事例を通して、ITシステムがもたらす真の価値は、生産性向上だけでなく、不安感情の低減、ひいてはより質の高い判断にあると訴えています。

例えば、古くなった車を使い続ける著者は、いざという時に「ちゃんと動くか」という不安を抱えています。しかし、カーナビなどのITシステムは、道順の確認や到着時刻の予測などを通して、その不安を解消し、より質の高い判断を可能にします。

企業におけるITシステム導入においても同様です。MESなどの導入で生産性が向上するとは限らず、経営層は「投資対効果」を疑問視することが多いです。しかし、ITシステムは、業務の可視化やリスクの低減を通じて、より的確な判断を支援し、結果的に組織の決断力を向上させることができます。

著者は、ITシステムの価値を3つの側面から捉えています。 1つ目は、生産性向上です。これは従来から強調されてきた側面ですが、唯一の価値観ではありません。 2つ目は、新しい能力の獲得です。ITシステムによって、今までできなかったことが可能になります。 3つ目は、リスク低減と判断の質向上です。ITシステムは、データに基づく情報提供を通して、より質の高い判断を支援します。

著者は、ITシステムの導入目的を、生産性向上という単一指標で評価することの危険性を指摘しています。そして、「スマートである」とは、単に生産性が高いだけでなく、不安を解消し、より質の高い判断を支援することだと主張しています。

日本の企業では、生産性向上が重視されがちですが、ITシステムの導入目的を多角的に捉え、組織の真の課題解決に繋げる必要があることを、この記事は示唆しています。新人エンジニアの皆さんも、ITシステムの導入効果を評価する際には、生産性だけでなく、これらの側面も考慮することが重要です。

引用元: https://brevis.exblog.jp/32736843/

Googleがリリースした最新画像生成AI「Imagen3」とそのサービス「ImageFX」について、実際に使用した経験に基づいたレビューです。

Imagen3は、プロンプト理解力画像品質テキストレンダリング機能において、他のAIモデル(DALL-E 3、Stable Diffusionなど)を凌駕する性能を持つとされています。特に、フォトリアルな画像生成に優れ、人物描写も自然で破綻が少ない点が特徴です。

ImageFXは、Googleアカウントがあれば無料で利用できますが、1日あたりの生成回数に制限があります。また、生成画像サイズは1024x1024ピクセルの正方形に限定されています。

一方で、Imagen3は表現規制が厳しく、プロンプトの記述には工夫が必要です。単語数を徐々に増やしながら、規制に引っかからないように調整する必要があります。

記事では、Imagen3と他のAIモデルで同一のプロンプトを用いた生成結果を比較しています。その結果、Imagen3はフォトリアルな画像生成において、他のモデルを上回るクオリティであることが示されています。また、テキストレンダリング機能も優秀で、画像内に指定したテキストを自然に反映させることができます。

Imagen3は、非常に高品質な画像生成が可能なAIモデルですが、表現規制や画像サイズ等の制約がある点に注意が必要です。しかし、その優れた性能は、今後様々な分野で活用される可能性を秘めていると言えるでしょう。新人エンジニアの方でも、Googleアカウントさえあれば気軽に試せるので、ぜひImageFXでImagen3の画像生成を体験してみてください。

引用元: https://note.com/browncatro1/n/n4f8343898225

本記事では、東京大学の松尾・岩澤研究室が開発した日本語LLM「Tanuki-8B」を用いて、ローカル環境でRAGシステムを構築する方法を紹介します。

RAG(Retrieval-Augmented Generation)とは、LLMが外部の知識(ナレッジ)を参照して回答生成を行う技術です。これにより、LLM単体では学習していない知識への対応や、事実誤り(ハルシネーション)の抑制が期待できます。しかし、従来のRAG構築には、セキュリティ、コスト、システム構築といった課題がありました。

そこで、本記事では、軽量な日本語LLMであるTanuki-8Bと、ローカルLLM実行環境であるOllama、そしてノーコードRAG構築プラットフォームであるDifyを組み合わせることで、これらの課題を解決する手法を紹介します。

Tanuki-8Bは、日本語の対話や作文能力においてGPT-3.5-Turboに匹敵する性能を持ちながら、軽量なモデルです。Ollamaは、様々なプラットフォームでLLMを簡単に実行できるツールで、量子化技術によりTanuki-8Bを低スペックなPCでも動作させることが可能です。Difyは、ノーコードでRAGシステムを構築できるオープンソースのプラットフォームで、Ollamaと連携することでローカルRAG環境を構築できます。

これらのツールを活用することで、企業は自社の機密データを外部に送信することなく、コストを抑え、比較的容易に日本語RAGシステムを構築できます。

本記事では、Tanuki-8B、Ollama、Difyのセットアップ方法から、ナレッジの読み込み、Ollamaとの連携、RAGシステムの動作確認まで、具体的な手順を解説しています。

新人エンジニアの方へ

RAGは、LLMの能力を拡張し、より実用的なシステムを構築するための重要な技術です。本記事で紹介した方法を使えば、比較的簡単にローカルRAGシステムを構築できますので、ぜひ参考にしてみてください。LLM、RAG、Tanuki-8B、Ollama、Difyといったキーワードを理解し、今後の学習や開発に活かしていただければ幸いです。

引用元: https://zenn.dev/mkj/articles/93dbd6c9d94c58

(株式会社ずんだもんは架空の登場組織です)