株式会社ずんだもん技術室AI放送局 podcast 20250515
内容紹介
AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms、Gartner、「AIエージェント」と「エージェント型AI」の違いに混乱が生じていると見解を発表、Cline × Amazon Bedrock でCRUDアプリのフルスタック開発をやってみた、「兵庫出張。14時迄に大久保駅」で中央線の大久保駅に行ってしまう”現地集合でやらかしがちな失敗あるある”シチュイラストに体験談ぞくぞく
出演者
関連リンク
Google DeepMindが、Geminiという強力なAIモデルを活用した新しいAIエージェント「AlphaEvolve」を発表しました。このAlphaEvolveは、コンピューターのアルゴリズムを自動で設計したり、より効率的なものに進化させたりすることを目指したシステムです。
AlphaEvolveの仕組みは、Geminiの持つ創造性を活かして様々なアルゴリズムのアイデア(コード)をたくさん生成し、それらを自動で評価・検証することで、より良いものを選んでさらに改良していく、というプロセスを繰り返します。まるで生物が進化するように、最適なアルゴリズムを探し出すイメージです。
この技術はすでに様々な実用的な成果を上げています。例えば、Googleが持つ大規模なデータセンターの運用効率を向上させるアルゴリズムを発見し、計算リソースをより有効に使えるようになりました。また、AIの処理に特化したGoogle独自の半導体(TPU)の設計の一部を支援したり、Gemini自身のAIモデルの学習や推論のスピードを速くするコードを生成したりもしています。特に、AIの計算で重要な部分(カーネルと呼ばれます)の最適化において、専門家が何週間もかけていた作業を、AlphaEvolveが数日で改善策を見つけ出すといった効率化が実現しています。
さらに、AlphaEvolveは数学の未解決問題にも挑戦し、成果を出しています。コンピューターサイエンスの基礎である行列乗算の新しい高速アルゴリズムを発見したり、幾何学の難問で新記録を樹立したりといった研究レベルでの進歩も達成しています。
AlphaEvolveは、アルゴリズムとして記述でき、かつ自動でその良さを評価できる問題であれば、幅広い分野に応用できる可能性があります。今後は、材料科学や創薬といった分野への活用も期待されています。Googleは、この技術を一部の学術研究者向けに先行公開することを検討しており、将来的にさらに多くの人が使えるようにすることも視野に入れているようです。
AlphaEvolveは、AIがコードを生成するだけでなく、複雑な問題を解決するためにアルゴリズムそのものを進化させる、という新たな可能性を示しており、今後の技術開発に大きな影響を与えるかもしれません。
引用元: https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
IT分野の調査会社であるGartnerが、「AIエージェント」と「エージェント型AI」という二つの言葉について、その違いが分かりにくくなっている現状を踏まえ、それぞれの定義とAIの進化における位置づけについて見解を発表しました。
Gartnerはこれらの言葉を次のように定義しています。
- AIエージェント: デジタルや現実の世界で、状況を把握(知覚)し、次に何をすべきか判断(意思決定)して行動を起こす(アクション)、自律的またはある程度自分で動けるソフトウェアです。特定の目的達成のためにAI技術を使います。
- エージェント型AI: こちらは、特定の組織(会社など)の代わりに働くことを目指し、自律的に判断して行動する権限を与えられたソフトウェアです。目標を達成するために、AI技術だけでなく、「記憶(過去の情報)」、「計画(手順を考える)」、「センシング(状況把握)」、「ツール利用(外部ツールを使う)」、「ガードレール(安全装置)」といったより多くの機能を使って、複雑なタスクを目的達成に向けて遂行します。
簡単に言うと、AIの進化の段階で考えると理解しやすいかもしれません。例えば、チャットボットは限定された応答、RPAは定型作業の自動化が得意です。これに対し、AIエージェントはもう少し自分で判断して簡単なタスクの一部をこなせます。さらに進化した「エージェント型AI」は、より高度な知能と機能を持ち、複雑な目標を自律的に達成するために行動できる、言わば「AIの代理人」のような存在です。
AIは、単なる自動化から、人間の代理として行動するより高度なエージェント型へと進化しつつあるとGartnerは述べています。
また、最近注目されている関連技術として、AIエージェントがツールなどを使いこなす際に、一貫した考え方や記憶を持たせるための仕組みである「MCP(モデルコンテキストプロトコル)」や、複数のAIエージェントが連携するためのルール「Agent-to-Agent(A2A)」などが挙げられており、AIエージェントはさらに進化していくと予測されています。
Gartnerは、2028年までには日本企業の60%で、汎用的な知能を持つAGIを基盤とした新しいエージェント型AIやヒューマノイド(人型ロボット)と一緒に働くことが当たり前になるだろう、と予測しています。
AI分野は発展が速く、様々な言葉が出てきますが、これらの違いを理解することは、今後の技術動向を追っていく上で役に立つでしょう。
引用元: https://enterprisezine.jp/news/detail/21969
この記事では、VS Codeの拡張機能であるAIエージェント「Cline」と、AWSの生成AIサービス「Amazon Bedrock」を組み合わせて、データベース操作(CRUD:データ作成・読み込み・更新・削除)ができるWebアプリケーションを開発した経験が紹介されています。
Clineは、指示に基づいてコードを書くだけでなく、必要なファイルを自動で作ったり、ライブラリをインストールしたり、プログラムを動かして動作確認やエラー修正まで行うことができる便利なツールです。様々な生成AIモデルを選んで使うことができます。
Bedrockは、AWSが提供する安全性の高い生成AIサービスで、企業のデータがモデルの学習に使われないという大きなメリットがあります。また、複数のAIモデルを簡単に切り替えて試せるのも特徴です。ビジネスの現場でClineを使うことを考えると、セキュリティがしっかりしているBedrockはとても相性が良い選択肢です。
筆者は、この組み合わせで簡単なTODOアプリを開発してみました。「PostgreSQLというデータベースを使い、それをDockerという技術で動かす」「Web画面(フロントエンド)はReact、裏側の処理(バックエンド)はPythonのFastAPIで作る」といった具体的な指示をClineに与えました。
実際にやってみると、AIに開発を任せる上でいくつか工夫が必要だと分かりました。例えば、Windows環境でClineがLinuxコマンドを使えるようにする設定をしたり、コードを書く前の準備(使うためのツールのインストールなど)は人間が先に済ませておいた方が、AIがスムーズに開発を進められるようです。また、簡単なコードだけでなく、Webアプリ全体のような少し複雑なものを作る場合は、高性能なAIモデル(この記事ではClaude 3.7 Sonnet)を使うと、エラーが少なく効率的に進められるという発見がありました。
結果として、Clineは指示通りにフォルダを作り、データベースを用意し、画面と裏側のプログラムを書いて、アプリを動かすところまで自動で行ってくれました。生成されたコードも、人間が書くような構造になっていました。この開発にかかった費用は約5.2ドルで、人件費に比べると大幅に安く済ませることができました。
このように、ClineのようなAIエージェントとBedrockのようなセキュアなAIサービスを組み合わせることで、AIが開発のかなりの部分をサポートしてくれることを体験できます。AIにどこまで任せるか、人間がどこを担当するかを見極めることが、効率的に開発を進めるポイントになりそうです。
引用元: https://acro-engineer.hatenablog.com/entry/2025/05/14/120000
出張での現地集合で駅を間違えた体験談が話題になっています。特に「大久保駅」のように同じ名前の駅は全国にあり、場所を間違えてしまう「あるある」な失敗談が多数寄せられました。大阪の日本橋と東京の日本橋、大阪の茨木市と茨城県など、地域をまたいだ間違いエピソードに共感が集まっています。指示を受ける際は、地名だけでなく都道府県名や路線名も確認するなど、基本的なことでもしっかり確認することが大切だと気づかせてくれる、新人さんにも役立つ記事です。
引用元: https://togetter.com/li/2551045
(株式会社ずんだもんは架空の登場組織です)