【"Generative Agents"】スタンフォード大学のAI研究をまとめてみた

先日の４月７日に、スタンフォード大学はAIに関する研究論文「“Generative Agents: Interactive Simulacra of Human Behavior”」（生成エージェント：人間行動の相互関連模像）を発表した。

この研究論文は、スタンフォード大学やGoogleのAI研究者が、ChatGPTを用いて人間の行動に関するシミュレーション実験について書かれている。

「生成エージェント」と呼ばれるAIが、本物の人間の行動をシミュレートできることから、画期的だとして主に欧米圏で話題になった。

Stanford just released a groundbreaking AI study.

"Generative agents" can simulate authentic human behaviour.

Here's the breakdown (and the potentially devastating consequences): pic.twitter.com/27KMX4vp0l
— Alex Banks (@thealexbanks) April 13, 2023

そこで今回は、この実験がどのように行われて、どのようなことが分かったのかを説明したい。
世界最先端のAI研究現場での実験なので、ぜひ読んでみてもらいたい。

実験内容
実験の前提条件
生成エージェントの社会的行動
生成エージェントの社会への影響
実験の今後の課題と方向性
1. 今後の課題
2. 今後の方向性
まとめ：生成エージェントは今後検証が必要だが期待も大きい

実験内容

実験は人間観察ゲーム「ザ・シムズ（The Sims）」に着想を得て、Smallville（スモールヴィル）という村を仮想空間に作り、そこで行われた。

Smallvilleと家の中。普通に暮らしてみたいw

Smallvilleには、人間を模した25人の生成エージェント（以下「エージェント」）がおり、彼らがそこで２日間を過ごす。
その中で、朝目が覚めて朝食を作って食べて、仕事に向かうなど、人間のように生活をする。

エージェントがそれぞれの生活をしている

エージェントは自分の意見を持ち、互いを認識し、会話を始める。
具体的には、1日の予定を立てたり、ニュースを共有したり、関係を築いたり、活動を調整したりする。
また、過去の日々を思い出し、反省して、次の日の計画を立てる時にその反省を活かす。

エージェントたちの様子。和んでいる雰囲気を感じるのは自分だけだろうかw

なお実験がどんな雰囲気かは、あらかじめ設定されたエージェントの行動シミレーションが公開されているので、興味があれば以下のリンクから見ることができる。

Reverie

実験の前提条件

ユーザーは自然言語を使ってエージェントと対話ができる。
エージェントは人間のように以下のことができる。

・他の人や環境とコミュニケーションを取る
・行ったことや観察したことを覚えておき、思い出す
・それらの観察を振り返る
・毎日の計画を立てる

生成エージェントはどのように設計されているか？

人間らしい行動を生成するために、関連する記憶を保存、合成、適用するアーキテクチャが必要。
これは大規模な言語モデル、ChatGPTを使用して行われた。
3つの主要なコンポーネントがある。
•メモリストリーム – エージェントの経験の記録
•反省 – 記憶を合成して結論を引き出すのに役立ちます
•計画 – 結論を行動計画に変換する

生成エージェントのアーキテクチャ

また、２５人のエージェントには、人間と人間社会のように、それぞれに個性や関係性が条件付けられている。

・名前、職業、優先順位
・他のキャラクターに関する情報
・他のキャラクターとの関係
・その日を過ごす方法に関する意図

２５人の生成エージェント。キャラがありかわいいww

生成エージェントの社会的行動

この実験で、生成エージェントはSmallvilleの2日間で、人間が取るような行動を取った。

1）彼らはお互いに情報を共有する

サムは市長に立候補することを決め、それをトムに伝える。ジョンもそのニュースを聞く。
その日の後半に、トムとジョンは別々にサムの勝算について話し合う。

他には、イザベラはバレンタインデーのパーティーを開く計画を立てて、一日を始める。
イザベラは村の中のHobbsカフェでパーティーを開くことを他のエージェントに宣伝し、シミュレーションの終わりまでに12人のエージェントがパーティーのことを知る。

なおパーティーのことを知ったエージェントは、自主的に他のエージェントと関係を築いて、パーティーについて広めた。
つまり、予めプログラムされたものでもユーザーの介入もなく、エージェントの自発的なものだ。
以下が、イザベラのパーティーの拡散経路だ。

イザベラのバレンタインデーパーティー拡散経路

結果は、人間社会で見られるのと同じように、１２人中５人がHobbsカフェに来て、７人が来なかった。この７人のうち、3人は「他の予定」があり、残りの4人は「ドタキャン」した。

2）彼らは新しい関係を築いて認知する

最初、サムとラトーヤはお互いを知らない。
彼らは公園で出会い、ラトーヤは写真プロジェクトに取り組んでいると言う。
サムとラトーヤがその後に再び会うと、サムは「こんにちは、ラトーヤ。あなたのプロジェクトはどう進んでいますか？」と言う。

3）彼らはお互いに調整する

研究者はイザベラ（バレンタインデーのパーティー主催者）とマリアに、2つの情報を与えた。

１、イザベラに対しては、パーティーを開くことになること
２、マリアに対しては、マリアがクラウスに好意を持っていること

これ以上の指示はなく、2つの情報をもとに、イザベラは見かけた人たちをパーティーに招待し、会場を装飾し、マリアにパーティーの準備を手伝ってもらうことを頼む。
マリアもクラウスと一緒にパーティーに行くために、クラウスをパーティーに誘う。

エージェントのこれら一連の行動のキーとなる要素は、記憶と検索だ。
エージェントは、他のエージェントとのやり取りや観察記録をデータとして持っている。
そして、最近性、重要性、関連性に基づいて最近の記憶を引き出すことができる。

エージェントは、行動を反省することができる。
彼らは定期的に「記憶」として保存されているデータのログを見直し、このログから新しい洞察を形成する。また、人間が前回学んで得た教訓をその後の行動や経験から反省し直すように、エージェントも以前の反省についても反省し直すことができる。

最後に、エージェントは計画を立てることと、立てた計画の修正をすることができる。
彼らは１日を５〜8のパートに分けて、そのパート毎に大まかな計画を立てる。
例えば以下のような感じだ。

1)、朝８時に目が覚めて、朝のルーティーンをする
2)、１０時にオークヒル・カレッジに行き、授業を受ける
（中略　※論文内に書かれていなかった）
5)、１３時から１７時まで、新作の作曲に取りかかる
6）、１７時３０分に夕食をとる
7）２３時までに、学校の課題を終わらせて、就寝する

午前中のエージェントのスケジュール例

そして、これらの計画を１時間単位に分割し、さらに5〜15分の時間枠に細分化する。
例えば「5)、１３時から１７時まで、新作の作曲に取りかかる」だと以下のような感じだ。

・１時間単位
１３時：作曲についてのアイディアのブレスと
（中略　※論文内に書かれていなかった）
１６時：軽く休憩を取ってクリエイティビティを取り戻し、作曲の見直しと修正を行う

・５〜１５分単位（１６時〜１７時）
１６時：フルーツ、グラノーラバー、ナッツなどの軽いスナックを取る
１６時０５分：作業場の周りを軽く歩く
（中略　※論文内に書かれていなかった）
１６時５０分：数分時間を取って、作業場を片付けてきれいにする

人間も頻繁に計画を変更するが、エージェントも同様だ。
新しい観察や環境の変化、他のエージェントの存在や行動などが、計画を変更するきっかけとなる。
そして、計画の変更も、彼らの記憶と反省をもとに行われる。

生成エージェントの社会への影響

生成エージェントから、社会に対して有害な結果が生じるリスクも指摘されている。

・擬人化 – 人間はエージェントに感情を抱く
・エラーの影響 – エージェントが誤った推論を行い、害を引き起こす
・生成AIリスク – 説得力のあるディープフェイクや恣意的にカスタマイズされた説得力

このようなリスクもあるため、生成エージェントが見せてくれた、人間とコンピュータの新たな連携の世界を追求すると同時に、倫理的懸念にも真正面から取り組むことが重要である。

実験の今後の課題と方向性

今回の実験を経て、実験の今後の課題と方向性について、それぞれ研究論文内で書かれている。

今後の課題

”今回の研究では、25人のエージェントを2日間にわたってシミュレートするために、かなりの時間とリソースを要した。
トークン・クレジットに数千ドルのコストがかかり、完了までに数日を要した。
今後は、リアルタイムのインタラクティブ性を高めるために、将来的にはエージェントの並列化を検討することができる。さらに、基礎となるモデルの進歩により、エージェントの性能も向上することが期待される。

今後の研究では、生成エージェントの能力と限界をより包括的に理解するために、長期間にわたってその動作を観察することを目指すべきである。今後のシミュレーションで、基礎となるモデルやエージェントに使用するハイパーパラメータを変化させ、対比させることで、これらの要因がエージェントの挙動に与える影響について貴重な知見を得ることができるだろう。
また、言語モデルの偏りが知られていることから、生成エージェントが偏りを反映した行動やステレオタイプを出力する可能性がある。これを軽減するためには、価値観のすり合わせに関するさらなる研究が必要であろう。
さらに、多くの大規模言語モデルと同様に、生成エージェントは、データ砂漠のために、一部の集団、特に疎外された集団に対して人間らしい行動を生成できない可能性がある。
生成エージェントのセキュリティについても、現時点では限られた知識しか持っていない。特に、プロンプトハッキング、メモリーハッキング（注意深く作られた会話によって、発生しなかった過去の出来事の存在をエージェントに確信させること）、幻覚などに対して脆弱な可能性がある。
今後の研究により、これらの堅牢性の問題をより包括的に検証し、大規模な言語モデルがこのような攻撃に対してより強くなるにつれて、生成エージェントも同様の緩和策を採用することができるようになるだろう。”

今後の方向性

”生成エージェントをシムズスタイルのゲーム世界のノンプレイヤーキャラクターとして出現させ、その中での生活をシミュレートすることで、生成エージェントの可能性を示している。
評価の結果、我々のアーキテクチャは信じられる行動を生み出すことが示唆された。今後、デザインツール、ソーシャルコンピューティングシステム、没入型環境など、多くのインタラクティブなアプリケーションにおいて、ジェネレーティブエージェントが役割を果たすことができると考えている。”

まとめ：生成エージェントは今後検証が必要だが期待も大きい

この実験は、「ザ・シムズ（The Sims）」のゲームをもとにSmallevilleという小さな村を仮想空間上に再現して行われたが、実際の実験内容としては「ウエストワールド（West World）」の世界だ。

ウエストワールドはゲーム・オブ・スローンズなどを制作したHBOのドラマで、ロボットが今回の実験のようにシミュレーション実験をする話だ。
ちなみに興味があれば、アマプラで見ることができる。

アメリカで大ヒットしたこともあり、今回の実験がウエストワールドになぞらえて説明されたりもしている。

今後生成エージェントがウエストワールドのような世界観を持つかは分からないけれど、ウエストワールドは現実世界で実験が行われたのに対して、生成エージェントの実験は仮想空間上で行われた。

今後の課題と方向性で研究者が書いているように、生成エージェントの利用シーンは仮想空間が主になるかもしれないし、まだまだ実験での検証が必要だ。
一方で、AIの新たな可能性を見せてくれて期待感も高いので、またアップデートがあれば共有したい。

最後まで読んでくれて、ありがとう！

ではまた！