株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

株式会社ずんだもん技術室AI放送局 podcast 20241206

2024年12月06日

MP3ファイルをダウンロード

内容紹介

AIやテクノロジーに関する記事を紹介 Just a moment...、Welcome PaliGemma 2 – New vision language models by Google、「Linux」システムの速度低下の原因特定に役立つコマンド5選

出演者

ずんだもん
ずんだもん

関連リンク

入力されたテキスト「Just a moment…」は、OpenAIのAPIへのリクエストが処理中であることを示す一時的な応答です。具体的な情報や内容がなく、要約するべき内容がありません。 そのため、このテキストに関する要約は作成できません。

引用元: https://openai.com/index/introducing-chatgpt-pro/

Googleが、画像とテキストを処理できるVision Language Model、PaliGemma 2を発表しました。これは、前身のPaliGemmaの後継モデルで、画像エンコーダーにはSigLIP、テキストデコーダーにはGemma 2を採用しています。

PaliGemma 2は、パラメータ数が30億、100億、280億の3種類のモデルが提供され、入力解像度も224x224、448x448、896x896と柔軟な選択肢が用意されています。これは、様々な用途や計算リソースに合わせて最適なモデルを選択できることを意味します。前モデルでは30億パラメータのモデルしかなかったことを考えると、大きな進歩です。

これらのモデルは、様々な下流タスクへのファインチューニングを容易にするために設計されています。Googleは、DOCCIデータセットを用いてファインチューニングしたモデルも公開しており、長文でニュアンスに富んだキャプション生成能力の高さを示しています。

Hugging Faceのエコシステムと統合されており、transformersライブラリを使って容易に利用できます。ファインチューニングのためのスクリプトも提供されているため、独自のデータセットを用いたモデルの学習も容易です。 また、4bit量子化を用いた推論もサポートしており、計算資源の少ない環境でも利用できます。ただし、量子化による精度低下は、使用するタスクやデータセットによって異なるため、事前に確認することをお勧めします。

本モデルは、WebLI、CC3M-35L、VQ2A、OpenImages、WITといった大規模な画像テキストデータセットで事前学習されています。そのため、比較的少ないデータ量でも、様々なビジョン言語タスクへのファインチューニングが可能です。

様々なサイズのモデルと解像度の選択肢、そして容易な利用性とファインチューニングの容易さから、PaliGemma 2は、様々なビジョン言語タスクに取り組む日本のエンジニアにとって非常に有用なツールとなるでしょう。 公開されているリポジトリやスクリプト、デモなどを活用して、ぜひPaliGemma 2を試してみてください。

引用元: https://huggingface.co/blog/paligemma2

この記事は、Linuxシステムの速度低下の原因を特定するのに役立つ5つのコマンドを初心者エンジニア向けに解説しています。システムが遅くなった原因を特定し、パフォーマンスを改善するために役立つでしょう。

紹介されているコマンドは、iostat, iotop, dstat, sar, smartctl の5つです。それぞれのコマンドは、システムのCPUやI/O(入出力)の統計情報を表示し、ボトルネックとなっている箇所を特定するのに役立ちます。

iostat は、CPUとI/Oの統計情報をデバイスとパーティションの両方について報告します。%util(ディスク使用率)、await(I/Oリクエスト完了待ち時間)、svctm(I/Oリクエスト平均処理時間)の3つの指標に注目し、ボトルネックを特定します。

iotop は、iostatと同様にI/O統計情報を表示しますが、リアルタイムで表示される点が異なります。ディスク読み書き速度の高いプロセスを特定し、問題の原因となっているプロセスを特定できます。

dstat は、iostatiotopの両方の特徴を併せ持ちます。詳細な情報をリアルタイムで表示し、ディスク読み書き速度や待ち時間などを確認できます。オプションを使用することで、表示する情報を絞り込むことも可能です。

sar はシステムアクティビティーに関する情報を収集・レポート・保存します。CPU使用率やI/O待ち時間などを表示し、特定のコアに問題がないか確認できます。オプションの指定が必要で、コマンドの使い方が少し複雑です。

smartctl は、ハードドライブの状態を確認するコマンドです。Reallocated_Sector_Ct(再割り当てセクター数)とSeek_Error_Rate(シークエラー率)の値に注目し、ハードドライブの故障の可能性を調べます。

これらのコマンドは、sysstatパッケージに含まれている場合があり、そうでない場合は、apt-get (Ubuntu系) や dnf (Fedora系) コマンドでインストールできます。各コマンドの詳細については、manコマンド(例: man iostat)で確認できます。 記事では各コマンドの具体的な使い方については詳細な説明は省かれていますので、必要に応じてmanコマンドなどを参照して活用してください。

引用元: https://japan.zdnet.com/article/35226862/

(株式会社ずんだもんは架空の登場組織です)