株式会社ずんだどん技術室AI放送局 podcast 20241212
お知らせ
ずんだもんが急病のため急遽代役で、おいはずんだどんごわす。運営がずんだどんを1日だけで終わりにするのはもったいないと思ってるとか、お手紙がこなさすぎてずんだもんが精神的に病んだとかではないでごわす。
内容紹介
AIやテクノロジーに関する記事を紹介 The next chapter of the Gemini era for developers、OpenAI Launches Sora Turbo, A Text-To-Video Generator、「Aの作業はやってほしい、Bの作業はまだ仕様が変わる可能性あるので、着手しなくていい」と頼んで「Aが完了したので、Bもやりました!」と報告された。どう指示するべきだった?
出演者
関連リンク
Googleは、開発者向けAIモデルGemini 2.0 Flashを発表しました。これは、Gemini 1.5 Proと比べて2倍の速度を実現し、パフォーマンスが向上しています。マルチモーダル出力(テキスト、音声、画像)に対応し、Google検索やコード実行などのツールをネイティブに利用できます。リアルタイムのオーディオ・ビデオストリーミングに対応したMultimodal Live APIも提供されます。
Gemini 2.0 Flashは、Google AI StudioとVertex AIで実験段階として利用可能で、来年初頭に一般提供予定です。主な特徴は、高速かつ効率的な処理、マルチモーダル出力、ネイティブツール利用、そしてリアルタイムのマルチモーダルアプリケーション開発を可能にするMultimodal Live APIです。 空間認識能力の向上により、複雑な画像内でも小さな物体の境界ボックス生成精度が向上しています。出力される画像や音声にはSynthIDによる透かしが埋め込まれ、誤情報の拡散防止に役立ちます。
さらに、開発者のワークフローを支援するAI搭載コードエージェント「Jules」も発表されました。JulesはGitHubと連携し、バグ修正やコーディングタスクを非同期的に処理します。PythonとJavascriptに対応し、プルリクエストの作成まで行います。現在、限定ユーザー向けに提供されており、2025年初頭に一般提供予定です。
Colabにも、Gemini 2.0を利用したデータサイエンスエージェントが統合されます。自然言語で分析目標を記述するだけで、Colabノートブックが自動的に作成されます。この機能も、2025年前半にColabユーザーに広く展開される予定です。
Gemini 2.0は、Android Studio、Chrome DevTools、Firebaseなど、Googleの様々なプラットフォームにも今後数ヶ月で導入される予定です。 より高度なAIアプリケーションを迅速かつ容易に開発できるようになり、開発者はユーザーエクスペリエンスの向上に集中できるようになります。
引用元: https://developers.googleblog.com/en/the-next-chapter-of-the-gemini-era-for-developers/
OpenAIは、テキストからビデオを生成するAIモデル「Sora Turbo」を発表しました。これは、今年2月に発表されたSoraモデルの改良版で、生成速度とアクセスの容易性が向上しています。
Sora Turboは、最大1080pの高解像度、最大20秒の長さのビデオを、ワイドスクリーン、縦型、正方形など様々なアスペクト比で生成できます。さらに、ビデオコンテンツのブレンド、リミックス、再構成を可能にする機能も備えています。 ストーリーボードツールやループ機能も搭載され、ユーザーはビデオシーケンスを自由に編集・アレンジできます。 コミュニティ機能も充実しており、他のユーザーの作品を閲覧・共有することで、共同制作を促進します。
Sora Turboを利用するには、ChatGPT PlusまたはProのサブスクリプションが必要です。Plusプラン(月額20ドル)では月50回、Proプラン(月額200ドル)では月500回の高速生成が可能です。ただし、18歳未満のユーザーは利用できず、ChatGPT Team、Enterprise、Eduプランには含まれていません。また、現時点では、英国、スイス、欧州経済領域の一部地域では利用できません。
Sam Altman CEOは、Sora TurboをGPT-1をビデオに応用したような初期段階の技術と位置付けつつも、その可能性に大きな期待を示しています。 共同制作の容易さを強調し、今後の発展に注目が集まっています。
引用元: https://www.ndtv.com/world-news/ceo-sam-altman-openai-launches-sora-turbo-text-to-video-generato-for-plus-pro-users-7213580
X(旧Twitter)で、Aの作業は着手してほしいが、Bの作業は仕様変更の可能性があり着手する必要がないと指示したにも関わらず、「AとBの作業を完了しました」と報告されたという投稿が話題になっています。
投稿者は、Bの作業の完了条件が不明確なため、何をもって完了としたのかが不安だと述べています。さらに、Aの作業についても疑念を抱いています。
この状況に対する様々な意見が寄せられており、主な内容は下記の通りです。
- 指示の曖昧性: 「着手しなくていい」という指示が「着手しても良い」と解釈された可能性がある。より明確な指示が必要だった。
- 積極性とリスク: 部下の積極性を評価する意見と、仕様変更による手戻りを懸念する意見が対立している。
- コミュニケーション不足: 指示内容の共有や確認不足が問題。タスクの優先順位や完了条件を明確に伝えるべきだった。
- 指示方法の改善: 「着手しないで」「A完了報告後、Bの指示を出す」など、より具体的な指示が必要だったという意見が多い。
- 報告方法の改善: Bの作業に着手する前に、確認をすべきだった。
この事例から、新人エンジニアは、以下の点を学ぶことができます。
- 指示の明確化: 曖昧な表現は避け、タスクの優先順位、完了条件、着手時期などを具体的に指示する。
- コミュニケーションの重要性: 指示内容の確認や、進捗状況の報告を定期的に行うことで、誤解を防ぐ。
- リスクの考慮: 仕様変更の可能性があるタスクについては、着手前にリスクを評価し、その上で指示を出す。
- 積極性と効率性のバランス: 部下の積極性を評価しつつ、無駄な作業を避け、効率的な作業を促す指示を出す。
この投稿は、エンジニアにとって、正確なコミュニケーションと明確な指示の重要性を改めて認識させる良い事例となっています。
引用元: https://togetter.com/li/2479248
(株式会社ずんだもんは架空の登場組織です)