株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20240731

2024年07月31日

MP3ファイルをダウンロード

お知らせ

本日で記念の50回放送になるのだ。でも、特になにもありません。今日の放送もいつも通りです。この番組、ずいぶん運営がゆるゆるなのだ。さすがに100回放送では何かあるよね?え?それまで、放送が続いているのかだって・・・?

内容紹介

AIやテクノロジーに関する記事を紹介 美少女ゲーム『ToHeart』リメイク版発表、2025年発売へ。恋愛ADVの金字塔が、令和にリメイク - AUTOMATON、テキスト抽出不要のRAGを実現するColPali、VSCode vs Cursor〜コーディング環境を制するものはどちらか? 株式会社divx(ディブエックス)、エクセルで「セルA2の住所から県名を抜き出す数式」を考えた人すごい→「これはカッコいい解法ですね」「こういうパズルは楽しい」

出演者

ずんだもん
ずんだもん

関連リンク

美少女ゲーム『ToHeart』のリメイク版が2025年に発売されることが発表されました。アクアプラスによる情報番組では、新キャストの一部が発表され、オリジナル版の声優陣の声が選択可能なモードも用意されていることが明らかになりました。本作は、1997年にLeafより発売された恋愛アドベンチャーゲームの金字塔で、高校生活を舞台に、主人公とヒロインたちのハートフルな学園ストーリーが描かれます。2025年の発売に向けて、タイトルロゴのリニューアルや新キャストの起用など、さまざまな新要素が加わります。

引用元: https://automaton-media.com/articles/newsjp/toheart-remake-20240730-303815/

本記事では、画像の情報をそのままベクトルデータにして検索する手法、ColPaliについて解説します。従来のRAGでは、文書データをテキスト化してベクトルデータに変換していました。しかしColPaliは、画像として文書データを認識し、ベクトル化することで、テキスト化できない情報を扱うことができます。

ColPaliは、PDFの各ページを画像に変換し、1024個のパッチに分割してベクトルデータベースに保存します。検索時には、テキストをトークン化し、ColPaliのテキストエンコーダに入力して類似度の高いベクトルを検索します。

ColPaliは、従来のRAG手法と比べて、以下のようなメリットがあります。

  • テキスト抽出が不要で、データ保管時のコストを大幅に削減できます。
  • ベクトルを複数に分解することで、検索精度を向上させることができます。
  • 画像内のどの場所に注目したかを可視化できます。

ColPaliは、PDFの検索に特化していますが、画像全般に応用可能です。PDFのRAG利用に課題を抱えている方は、ColPaliの利用を検討してみてはいかがでしょうか。

引用元: https://zenn.dev/knowledgesense/articles/08cfc3de7464cb

この記事は、株式会社divxのエンジニアである松田氏が、コーディング環境として人気が高いVisual Studio Code(VSCode)と、AI機能を搭載したテキストエディタCursorを比較し、どちらが優れているのかを自身の見解を交えながら解説しています。結論として、松田氏は、AI機能の活用やコード編集の効率性などを考慮すると、Cursorの方が優れていると考えており、特にChatGPTなどのAIをコーディング時に使用したいエンジニアにはCursorをおすすめしています。

CursorはVSCodeをベースに開発されており、VSCodeの拡張機能もそのまま使用できます。また、ChatGPTが標準搭載されているため、VSCodeのように別途拡張機能をインストールする必要がありません。さらに、Cursorではコードをその場で編集したり、チャットに挿入してChatGPTに質問したりすることが可能です。特に、フォルダ単位やプロジェクト単位でコードを参照してChatGPTに質問できる機能は、Cursorの最大の特徴であり、コードの修正や理解を深める際に非常に役立ちます。

松田氏は、Cursorの便利さを実感しており、もはやVSCodeには戻れないと述べています。この記事では、Cursorの具体的な使い方や機能が、画像付きで詳しく解説されているため、新人エンジニアでも理解しやすい内容となっています。

引用元: https://www.divx.co.jp/media/161

この投稿は、エクセルで住所から県名だけを抜き出す数式を考案した人が話題になっています。その数式は、=LEFT(A2,3+(MID(A2,4,1)="県"))というもので、住所がセルA2に入っている場合、県名部分を抜き出すことができます。この数式のポイントは、MID関数を使って住所の4文字目が「県」かどうかを判定し、その結果をTRUE(1)またはFALSE(0)としてLEFT関数に渡すことです。TRUEの場合は3+1=4文字、FALSEの場合は3+0=3文字が切り出されます。この巧みな手法に、多くのユーザーが感心し、「これはカッコいい解法ですね」「こういうパズルは楽しい」などのコメントが寄せられています。

引用元: https://togetter.com/li/2410227

(株式会社ずんだもんは架空の登場組織です)