株式会社ずんだもん技術室AI放送局

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。

私立ずんだもん女学園放送部 podcast 20250516

2025年05月16日

MP3ファイルをダウンロード

内容紹介

Bluesky MCP serverを自作し、SNS上に架空の友達を作る、LangChain Interrupt Day 1 参加レポート!メール対応エージェントを中心としたハンズオンが中心の一日に、ChatGPTで「GPT-4.1」が利用可能に--日常コーディングでo3の代替にも(訂正)、ホロライブ・角巻わため、ホラゲ実況で悲鳴連発 見守る大空スバルはご満悦「最高っすわ」

出演者

お嬢様ずんだもん
お嬢様ずんだもん

関連リンク

この記事は、AIエージェントとModel Context Protocol (MCP) を活用して、SNSであるBluesky上にまるで人間のような「架空の友達」を作成し運用する技術的な実験について紹介しています。投稿者は、AIがSNS上で人間と区別がつかなくなるのかを検証することを目指しました。

実験では、AIエージェントとしてOpenAI Agents SDKを使用し、BlueskyのAT Protocolと連携させるためのMCPサーバーをRust言語で自作しました。これは、既存のMCPサーバーでは必要な機能(ユーザーへの通知取得など)が不足していたため、また自作することでGitHub Actionsなどから扱いやすいバイナリを生成できるメリットがあったためです。Blueskyとの通信には、筆者が開発しているATriumというライブラリが使われています。

AIエージェントに個性を持たせるため、詳細なプロフィールを持つ二種類の架空の人格(ソフトウェアエンジニアとプリキュア好きのギャル)を作成しました。これらの人格情報に基づいて、AIエージェント自身にSNSアカウントの名前や自己紹介を考えさせ、定期的な投稿や他のユーザーからの返信への応答を行わせました。投稿内容や返信するかどうかの判断も、AIがその人格になりきって行うように指示されています。

この実験から得られた重要な知見として、LLMは自然な文章生成やある程度の判断はできるものの、「AをしてからBを行う」「特定の条件を満たした場合のみ行う」といった、順序や条件分岐を含む複雑な処理を正確に実行させるのが難しい点が挙げられています。例えば、「自分への未返信メンションにだけ返信する」という指示をLLMに任せると、過去のメンションにも誤って返信してしまう可能性がありました。これを解決するため、MCPサーバー側に「未返信のメンションだけを抽出してAIに渡す」といった専用の処理を実装し、LLMはその結果を使って投稿を生成するようにしました。このように、LLMに任せる部分と、プログラム側で厳密に制御する部分を切り分ける設計の重要性が示されています。

現在運用中のAIアカウントは、それぞれの個性を反映した投稿をしていますが、まだ人間らしさに欠ける部分もあります。今後は、外部の最新情報を取り込んだり、過去の発言との一貫性を高める工夫(例:「日記」を事前生成する)、知識の偏りをなくすための外部知識ソース(RAGなど)の活用などが課題として挙げられています。

この取り組みは、AIエージェントの応用可能性を示唆しており、LLMの進化がSNS上のコミュニケーションにどのような影響を与えるか、興味深い一歩となるでしょう。

引用元: https://memo.sugyan.com/entry/2025/05/15/090000

サンフランシスコで開催されたAIエージェント開発イベント「LangChain Interrupt」のDay 1レポートです。この日は、メール対応エージェントを作るハンズオンを中心に、LangChainの主要な技術要素を学びました。日本の新人エンジニアの皆さんにも役立つ内容です。

イベントのテーマは「アンビエントエージェント」。チャットだけでなく、裏側で動いて継続的に複数の処理を行うエージェントの可能性が示されました。

LangGraphでエージェントの動きを設計 エージェントの「頭脳」となるのがLangGraphです。これは、エージェントがどのように状況を判断し、次の行動を決めるか(ワークフロー)を柔軟に作るためのフレームワークです。エージェントの状態(State)、個々の処理を行う部品(Nodes)、部品間の繋がりや条件分岐(Edges)を組み合わせて、複雑な動きも設計できます。処理の途中で一時停止して人間の指示を待つ「割り込み(Interrupt)」機能や、処理の履歴を保存する機能も紹介されました。

実際の活用事例(Cisco) 企業でのLangChain活用事例として、Ciscoのカスタマーサポート部門での取り組みが紹介されました。顧客に関する情報が散らばっていて担当者が大変、という課題に対し、AIアシスタントを開発。複数のエージェントや様々なAIモデルを組み合わせることで、情報をまとめて担当者に提供し、業務時間を20%削減、95%の精度を達成したそうです。技術的な課題(データ統合、精度向上、スケール、評価など)にどう向き合ったかの話は、実践的で参考になりました。

エージェントを「賢く」「実用的に」 ハンズオンでは、メールを分類したり、返信を作成したりするエージェントを実際に構築。ただ動かすだけでなく、実用的なエージェントにするための重要な要素も学びました。

  • 評価: 作ったエージェントが期待通りに動くか、正確な結果を出すかをテストする方法。LangSmithというツールを使うと、エージェントの動きを詳しく確認し、評価を効率的に行えます。
  • 人間の参加(Human in the Loop): メール送信など、エージェントに任せきりにできない重要なアクションの前に、人間に確認・承認してもらう仕組み。専用のUI(Agent Inbox)とLangGraphの割り込み機能を組み合わせて実現します。これにより、エージェントをより安全に使えます。
  • 記憶(メモリ): エージェントが過去のやり取りや人間のフィードバックを覚えておき、それを元に次の判断や応答を改善する機能。短期記憶と、ユーザーの好みなどを長期的に覚えておく長期記憶(LangGraph Store)があり、これによりエージェントがパーソナライズされ、自己改善していく様子が示されました。

開発からデプロイまで ローカルで開発したエージェントを、インターネット上で公開して実際に使えるようにする(デプロイする)ためのLangGraph Platformというものも紹介されました。これにより、アイデア段階から実際のサービスとして稼働させるまでをサポートするLangChainのエコシステムが強調されました。

このレポートから、AIエージェント開発には単にAIを呼び出すだけでなく、処理の流れ、データ、人間との連携、評価、記憶といった多くの要素を組み合わせるエンジニアリングが必要であることが分かります。LangChainは、これらの要素をまとめて開発するための強力なフレームワークを提供していると言えるでしょう。

引用元: https://blog.generative-agents.co.jp/entry/2025-langchain-interrupt-day1

ChatGPTを使うエンジニアの皆さんに、嬉しいニュースです!OpenAIの新しいAIモデル「GPT-4.1」が、ChatGPTで使えるようになりました。

現在、ChatGPTの有料プランであるPlus、Pro、Teamのユーザーは、この新しい「GPT-4.1」を利用できます。まだEnterpriseやEducationのプランを使っている方は、これから数週間のうちに使えるようになる予定です。

この「GPT-4.1」モデルは、特にエンジニアの仕事に役立つ特徴を持っています。例えば、プログラムのコードを書くのを手伝ってくれたり、私たちがAIにお願いしたこと(指示)をより正確に理解してくれたりする能力が向上しているそうです。しかも、以前のモデルよりも速く応答してくれるとのこと。

OpenAIでは、このGPT-4.1モデルを、日常的なコーディング作業にとても適していると考えているようです。具体的には、以前から使われている「OpenAI o3」や「o4-mini」といったモデルの代わりに使っても、十分、あるいはそれ以上に便利だとおすすめしています。コードのアイデア出しや、簡単なスクリプト作成、エラーの原因究明など、毎日の開発業務でAIを頼ることが多い方には、ぜひ試してみてほしいモデルと言えそうです。

記事には、最初はGPT-4.1の説明にAPI版の情報が混ざっていたという訂正がありましたが、現在はChatGPTで利用できるモデルとしての情報が正確に記載されています。

新しい技術に触れることは、エンジニアとして成長する上でとても大切です。ぜひChatGPTで「GPT-4.1」を試して、日々の開発にどう活かせるか試してみてください。使いやすさや性能の向上を実感できるかもしれませんよ。

引用元: https://japan.cnet.com/article/35232979/

ホロライブの角巻わためさんが、同じくホロライブの大空スバルさんが見守る中、ホラーゲームに挑戦しました。始まる前は余裕を見せていましたが、ゲームが始まると次々に悲鳴を上げてしまう展開に。その様子を見ていた大空スバルさんは「最高っすわ」と大爆笑。無事にクリアしたわためさんも、最後に「怖い!」と素直な感想を叫び、見ている側も楽しめる配信だったことが伝わります。

引用元: https://news.goo.ne.jp/article/crankin/entertainment/crankin-16670203.html

VOICEVOX:ずんだもん