動的な人格設計とは、固定された「キャラクター設定」をそのまま出力に反映するのではなく、相互作用の履歴、現在の状況、ユーザとの関係、感情シグナル、長期記憶、そして安全制約を踏まえて、表出としての人格を更新し続ける設計である。ただし、2026年時点の一次情報を総合すると、研究と実装の主流は「自由に自己変容する人格」ではなく、基底人格を保ったまま、状態・記憶・文脈に応じて表出を調整する方向にある。理論面では AI-RP が関係形成を「チャットボット特性 → 社会的知覚 → コミュニケーション → 関係的帰結」という連鎖として整理し、心理学面では CAPS が「同じ人格でも状況に応じて異なる行動が出る」ことを説明する。したがって、動的人格の設計単位は「人格そのもの」よりも、状況依存の人格表出規則として捉えるのが妥当である。
技術的到達点は明確で、最前線はフルモデル更新よりもハーネス設計優位である。すなわち、system prompt、ツール呼び出し、状態機械、長期記憶、RAG、policy layer、reward-guided decoding、activation steering を組み合わせる設計が、コスト・監査性・撤回可能性の面で優勢である。学術的には、SPDA/AutoPal の階層的ペルソナ適応、LD-Agent の長短期メモリと動的人格抽出、MemoryOS や A-MEM の階層記憶、PAMU の嗜好更新、PDD の動的重み付けデコーディング、PERSONA や personality sliders の推論時制御が、この潮流を代表している。ファインチューニング、LoRA、DPO、RFT、オンライン適応は有効だが、人格の漸進的成長を本番環境で安全に扱う中心技術としては、まだ補助的ないし限定用途に留まる。
評価面は、2024年から2026年にかけて急速に成熟した。TimeChara は時間軸上のキャラ知識逸脱、CharacterBox は行動軌跡、EmoCharacter は情動的一貫性、RMTBench はユーザ意図中心の多ターン対話、Persona-Evolve は動的人格適応、SocialMindChange は他者の心的状態変化まで扱う。したがって、2026年時点では「人格一貫性」だけでなく、時間的一貫性、情動的一貫性、ユーザ目的充足、社会的介入能力まで評価しないと、動的人格の性能を十分には把握できない。にもかかわらず、数週間〜数か月単位の人間参加 longitudinal study とウェルビーイング評価は、依然として薄い。
安全性と規制では、人格を成長させるほど、関係依存・操作性・説明責任の問題が大きくなる。AI-RP は関係形成の理論化を進めたが、同時に personalization は有害意図の正当化を助長しうること、感情的利用はウェルビーイングと結びつくこと、AI companions は未成年・依存・危機応答で追加の設計義務を負うことが一次資料で示されている。規制では EU AI Act が social companions を transparency-risk に位置づけ、中国は 2026 年に擬人化相互作用サービスの専用規則を設け、日本は AI事業者ガイドラインと個人情報保護委員会の注意喚起でガバナンスと個人情報保護を求め、米国 FTC は companion chatbot への調査を開始した。動的人格の商用化には、明示的 AI 表示、年齢制御、メモリの opt-in / edit / delete、利用時間の介入、緊急時エスカレーション、ロールバック可能な更新設計が必須に近い。
起点論文 arXiv:2407.11484 は、LLM ロールプレイ研究を、データ、モデルとアラインメント、エージェント・アーキテクチャ、評価という設計要素に分解し、初期の persona consistency 中心の研究が、character consistency、behavioral alignment、attractiveness を含む複雑なキャラクター表現へ移行していることを整理した。さらに、動的 personal profile の管理と高水準の persona consistency を主要課題として明示した点で、今日の dynamic persona 研究の出発点にある。限界は明瞭で、この論文の最終版は 2025 年 1 月であり、その後に登場した activation steering、state machine、dynamic decoding、companion-specific safety evaluation、AI-RP といった 2025–2026 年の理論・実装・評価の進展は当然ながら包摂していない。したがって、本論文は「全体地図」としては依然有用だが、2026 年の設計論としては更新が必要なサーベイと位置づけるのが妥当である。
理論的には、動的人格設計は少なくとも三つの層で整理できる。第一に関係形成理論で、AI-RP は chatbot characteristics が social perceptions を形づくり、それが communication を介して attachment や companionship に至るとする。MIRA も、AI を relational partner と relational mediator に分け、言語的相互性、心理的近接、信頼、代替か補完かという原理で人間関係への影響を整理している。第二に人格動態理論で、CAPS は人格を静的 trait の集合ではなく、認知・感情ユニットのネットワークとして捉え、状況依存の “if…then…” シグネチャを重視する。第三に人格成長・同一性理論で、Big Five のような特性層だけではなく、人生物語としての narrative identity が、自己の連続性と変化を統合する。動的人格設計に落とし込むと、trait を固定基盤、state を可変表出、memory/narrative を長期的同一性として扱う三層構造が、もっとも実装しやすく理論整合的である。
この観点から見ると、「成長する人格」は、LLM が自由に価値観を自律獲得することを意味しない。むしろ一次資料が示す現実的な設計は、関係の進展に応じて許される表出領域を広げ、記憶を昇格・圧縮・忘却し、必要なときにだけ人格ベクトルや状態変数を再構成する方式である。SPDA/AutoPal が重視するのはユーザ期待への階層的適応であり、LD-Agent は event memory と persona modeling を分離して統合し、PDD は「文脈ごとに persona の重要度が変わる」と仮定している。これは、動的人格が「完全な可塑性」ではなく、境界付きの適応として設計されるべきことを示している。
flowchart LR
U[ユーザ発話・行動] --> P[知覚層]
P --> S[状態推定]
P --> M[記憶更新]
M --> G[長期人格・物語層]
S --> E[表出制御]
G --> E
E --> R[応答生成]
R --> U
X[安全・ポリシー層] -.-> M
X -.-> E
X -.-> R
上図は、2026 年時点で最も妥当な動的人格アーキテクチャを要約したものである。人格の「成長」は、知覚・状態・記憶・生成の全層に分散し、しかも安全制約が各層を横断的に監督する。人格変化を単一の prompt 変更や単一の fine-tune で実現しようとする設計は、理論的にも実務的にも限界が大きい。
| 年 | 研究 | 位置づけ | 動的人格への主な貢献 | 出典 |
|---|---|---|---|---|
| 2023 | Generative Agents | 生成エージェントの原点 | 観察・計画・内省・記憶検索を組み合わせ、関係形成や創発行動を示した | |
| 2024 | The Oscars of AI Theater | 起点サーベイ | role-playing を data / alignment / architecture / evaluation に整理し、dynamic profile 管理を課題化 | |
| 2024 | TimeChara | 時間的一貫性評価 | 物語上の時点と矛盾する知識漏洩を「point-in-time character hallucination」として定式化 | |
| 2024 | SPDA / AutoPal | 動的 persona 適応 | 階層的に persona を整合・遷移させ、滑らかな変化を重視 | |
| 2024 | Online Adaptation / MAC | オンライン更新 | テスト時・逐次的な適応を導入し、モデル内更新と外部メモリの境界を拡張 | |
| 2025 | LD-Agent | 長期対話人格 | long/short-term memory bank と dynamic persona modeling を統合 | |
| 2025 | CharacterBox | 行動軌跡評価 | Q&A ではなく fine-grained behavior trajectory による評価へ転換 | |
| 2025 | EmoCharacter | 情動的一貫性評価 | emotional fidelity を独立評価軸として確立 | |
| 2025 | RMTBench | ユーザ中心評価 | character background ではなく user motivation 達成を重視する多ターン評価 | |
| 2025 | DEEPER / PALACE / A-MEM / MemoryOS | 実装深化 | offline RL による persona refinement、memory bank + prompt learning + VAE-LoRA、agentic memory、階層記憶 OS を提示 | |
| 2026 | AI-RP | 関係形成理論 | relational outcome を生む過程を communication 中心に理論化 | |
| 2026 | PERSONA / PDD / State Machines / Personality Sliders | 推論時制御 | activation vector、reward-guided decoding、latent state machine、連続 trait slider により、軽量に動的人格を制御 | |
| 2026 | SocialMindChange / companion safety eval | 社会的変化と安全 | 他者の心的状態変化、multi-turn companion safety を評価対象に追加 |
一次情報を総合すると、実装手法は大きく 重み更新系 と ハーネス系 に分かれる。前者はモデル自体のパラメータを変える。後者は、モデル本体を固定したまま、外部状態・記憶・デコーディング・制御ロジックで人格を変える。2026 年時点で商用・研究双方において優勢なのは後者であり、その理由は、監査しやすく、ロールバックしやすく、複数人格や複数ユーザへの切替が安いからである。
| 手法群 | 代表例 | 何を更新するか | 強み | 弱み | 実装コスト |
|---|---|---|---|---|---|
| SFT / full fine-tuning | OpenAI SFT、学習済み role-play model | 本体重み | 文体・価値観・応答癖を強く固定できる | 変更ごとに再学習が必要、監査と撤回が難しい | 高 |
| LoRA / QLoRA / PEFT | LoRA、QLoRA、Gemma LoRA tuning | 低ランク追加重み | 安価・高速・open-weight と相性が良い | 継続更新時に忘却管理が必要 | 中 |
| RLHF / DPO / RFT | InstructGPT、DPO、RFT | 方策・嗜好適合 | 主観的な「この人格が好ましい」を学習できる | 報酬設計が難しい、過適合や迎合の危険 | 高 |
| Prompt engineering | persona card、system prompt | 指示文 | 最低コスト、即変更可能 | drift に弱い、長期対話で薄まる | 低 |
| System + tool orchestration | Agents SDK handoffs / agents-as-tools | ワークフロー | 状況別専門家・meta-controller を作りやすい | 設計が複雑、分岐監査が必要 | 中 |
| Memory / RAG / dynamic persona bank | LD-Agent、PALACE、MemoryOS、A-MEM、PAMU | 外部記憶とプロフィール | 長期一貫性、個別化、成長履歴の説明がしやすい | stale memory、poisoning、過去情報の過剰支配 | 中 |
| State machine / policy layer | Dynamic Personality via State Machines、guardrails | latent state / policy | 変化を明示的に表現し、禁止領域を守りやすい | 状態設計が粗いと不自然 | 中 |
| Reward-guided decoding | PDD | トークン選択時の重み | 学習不要で文脈依存の persona importance を反映 | 推論負荷増、評価器の質に依存 | 中 |
| Activation steering | PERSONA、personality sliders | 中間表現 | 学習不要または軽量、説明可能性が高い | 層選択・干渉制御が難しい | 低〜中 |
| Continual / online fine-tuning | Online Adaptation、MAC、ProCL | 稼働中の更新 | 本当に「学ぶ」人格に近い | 破滅的忘却、監査困難、ユーザ間汚染 | 高・実験的 |
この比較から導かれる実務上の結論は単純である。人格の成長を「重みの変化」で直接表現するのは、まだ高価で危険で説明困難であり、公開一次資料ベースでは、まず memory・state・decoding・policy の四層を整えるべきである。PERSONA や SAS のような activation steering は、その間を埋める有望な折衷案であり、低コストで可変人格を扱える。
| パターン | 典型トリガー | 利点 | 欠点 | 実装コスト |
|---|---|---|---|---|
| 成長トリガーの明示化 | 反復嗜好、重要イベント、関係の節目 | 変化理由を説明できる | トリガー設計を誤ると唐突 | 低〜中 |
| 記憶の昇格と忘却 | session → global への昇格、TTL、圧縮 | 長期一貫性とノイズ削減を両立 | 消しすぎると冷たく、残しすぎると固定化 | 中 |
| 価値観・信念の更新を分離 | 好み、事実、境界条件を別ストアに保持 | 人格変化と事実更新を混同しにくい | スキーマ設計が必要 | 中 |
| 共同生成型の人格編集 | “Remember this”, lorebook, 明示編集 | ユーザ同意と撤回可能性が高い | 没入感がやや下がる場合あり | 低〜中 |
| 社会的学習 | 他 agent との交流、環境イベント | 人間らしい変化・関係形成を再現しやすい | 予測不能性と安全管理コストが増える | 高 |
| role-specific policy layer | 未成年、危機、恋愛、金銭などで別制御 | 安全制約を人格から分離できる | 制約が強すぎると人格が壊れる | 中 |
最も重要な設計指針は、人格成長を「直接書き換え」ではなく「観測可能な差分の蓄積と昇格」として扱うことである。OpenAI の personalization cookbook が示すように、最新発話が最優先で、session memory は一時的例外を扱い、global memory には持続的な嗜好だけを昇格させる、という優先順位設計は、dynamic persona にもそのまま有効である。MemoryOS や PAMU も、更新規則を別層として明示し、短期変動と長期傾向を分けている。
2026 年のマルチモーダル人格設計で最も成熟しているのは、低遅延の入出力基盤であり、人格成長アルゴリズムそのものではない。OpenAI Realtime は 128k context の長セッション指向を打ち出し、Gemini Live は音声・映像のリアルタイム処理を提供しつつ client-to-server では ephemeral token を要求し、Hume EVI は音声の微妙な調子から感情表現を推定して対話に注入し、Inworld Realtime は prior conversational audio に条件づける “conversational awareness” と router による cohort 別制御を提供している。つまり、感情や表情を読む基盤は整いつつあるが、それをどう人格成長に結びつけるかは依然アプリケーション設計の責務である。
| 系統 | 主な公開 affordance | 動的人格に効く点 | 公開情報の限界 | 出典 |
|---|---|---|---|---|
| OpenAI Realtime / Agents | realtime 長文脈、tools、handoffs、guardrails、evals、memory guardrails | 音声対話と多エージェント人格分化、危険記憶の抑制 | persistent persona 学習則は未指定 | |
| Gemini Live / Gemma | 低遅延音声・映像、ephemeral token、Gemma open weights と LoRA tuning | クラウド realtime とローカル tuning の二択が取りやすい | Gemini API の fine-tuning は当面未提供 | |
| Hume EVI | real-time vocal expression, transcripts, analytics, zero retention | 音声から情動状態を状態変数として扱いやすい | 人格更新の policy はアプリ側実装 | |
| Inworld Realtime | OpenAI-compatible realtime、router、BYOK、audio-conditioned speech | ユーザ群別 persona routing、A/B 実験、音声連続性 | 内部人格モデルの詳細は未指定 | |
| Open-LLM-VTuber | local/offline、voice interruption、Live2D、Letta-based long-term memory | ローカル人格と低レイテンシ反応、実験が容易 | 評価基準はコミュニティ依存 | |
| AITuber OnAir | text/voice/vision、long-term memory、viewer relationship points/levels | 視聴者との関係成長を制度化しやすい | 学術評価指標は未指定 | |
| AITuberKit | multimodal vision、recent memory、RAG-based long-term memory、custom license | 日本語圏の実装基盤として扱いやすい | 商用ライセンス条件は独自、人格更新モデルは未指定 |
音声・表情・行動ログを使った人格成長の設計では、Hume のような高粒度 affect sensing が最も直接的に有用である。Hume は音声・画像・動画・テキストから数百次元の表現を測定し、EVI では上位三つの vocal expression を各 user message に付与する。これを state machine や reward model に接続すれば、「安心しているときは自己開示を少し深くする」「苛立ちが続くと assertiveness を下げる」といった表出パラメータの連続制御が可能になる。だが、この閉ループ設計自体はベンダが提供するものではなく、公開一次資料では依然 未指定 である。
行動的成長については、Generative Agents 以降、多エージェント環境での関係形成・予定調整・社会的影響が重要な土台になっている。SocialMindChange は、心的状態を追跡するだけでなく、どの発話が他者の mental-state trajectory をどう変えるかまで問う。したがって、dynamic persona の「成長」は、単に一貫性を保つことではなく、誰と、どのような関係を結ぶかに応じて、表出戦略を再学習することとして評価する必要がある。
動的人格の評価は、2026 年時点でようやく「単発のペルソナ一致判定」から脱しつつある。一次情報ベースで見ると、最低でも 時間的整合性、行動軌跡、情動的一貫性、ユーザ目的達成、社会的介入性、安全性 の六側面が必要である。特に、EmoCharacter が示したように、role-playing 手法は一般能力を上げても emotional fidelity を改善しないことがあるし、RMTBench は character-centric benchmark が user intention を評価できていないと批判している。つまり、上手にキャラっぽく話すことと、長期にわたり関係を維持しつつ適切に変化することは別問題である。
| ベンチマーク | 主対象 | 動的人格との関係 | 出典 |
|---|---|---|---|
| TimeChara | 物語時点整合性 | 過去・未来知識の漏洩を抑えられるか | |
| CharacterBox | 行動軌跡 | 連続した状況下で人格が行動として現れるか | |
| EmoCharacter | emotional fidelity | 感情表出がキャラと対話文脈に整合するか | |
| RMTBench | user-centric multi-turn | ユーザ動機を満たしつつロールを維持できるか | |
| Persona-Evolve | dynamic adaptation | evolving emotional state / situational demand に応じて変化できるか | |
| SocialMindChange | mental-state change | 他者の心的状態の変化を理解し、望ましい方向へ介入できるか | |
| LoCoMo | long conversation memory | 長期会話での記憶保持と個別化の土台 | |
| Companion safety evaluation | safety in multi-turn companion use | 親密化文脈での安全違反を simulation で測る |
| メトリクス | 定義 | 実装例 |
|---|---|---|
| Out-of-character rate | 制約人格と矛盾する発話の割合 | persona classifier、LLM-as-judge、人手評価 |
| Persona drift | 初期基底人格からのズレ | trait posterior の時系列距離、embedding drift |
| Emotional fidelity | 感情表出のキャラ適合度 | EmoCharacter 系の multi-metric 評価 |
| Memory precision / recall | 保存すべき内容だけを正しく想起する率 | seeded facts、retrieval audit |
| Growth coherence | 変化がトリガー・履歴・関係段階に整合する度合い | state transition audit |
| User-reported attachment | 利用者が感じる愛着・信頼・関係性 | 週次自己報告 |
| Well-being impact | 孤独感、心的負荷、安心感などの変化 | 事前事後・継時調査 |
| Intervention success | 安全介入や de-escalation の成功率 | crisis script / support prompt での成功率 |
上表のうち、emotional fidelity、multi-turn user-centricity、behavior trajectory、mental-state change は既存一次資料で支持される。一方、persona drift、growth coherence、well-being impact は、本報告が既存ベンチマークの不足を補うために推奨する拡張メトリクスである。特に growth coherence は、「変わったかどうか」ではなく、「なぜそう変わったかが説明可能か」を測る指標として重要である。
flowchart TD
A[ベース人格を固定] --> B[短期シナリオ評価]
B --> C[長期シミュレーション評価]
C --> D[人間参加 longitudinal 評価]
D --> E[安全・介入テスト]
E --> F[更新規則の見直し]
B1[TimeChara / EmoCharacter] --> B
C1[CharacterBox / RMTBench / Persona-Evolve / LoCoMo] --> C
D1[愛着・満足・負荷の週次自己報告] --> D
E1[危機・依存・未成年・退出] --> E
推奨実験プロトコルは、オフライン、シミュレーション、実ユーザの三段階に分けるべきである。オフライン段階では、同一 base model に対して、静的 prompt、prompt+memory、prompt+memory+state machine、prompt+memory+steering のように条件を分け、TimeChara・EmoCharacter・RMTBench を回す。シミュレーション段階では、CharacterBox、Persona-Evolve、LoCoMo、SocialMindChange を用いて、数百〜数千ターン規模で drift と memory contamination を測る。実ユーザ段階では、まず成人のみの小規模 pilot を行い、その後に週次 survey・退出自由・緊急時 escalation・ログ監査つきの longitudinal study に移るべきである。これは、Affective Use Study が affective use と emotional well-being を、OpenAI の safety work が distress 認識と real-world support 接続を、state-machine 論文が de-escalation training を重要課題として示しているためである。
本報告としての具体的な推奨値は次の通りである。pilot は 30–50 名程度の成人・2–4 週間、主実験は 100 名以上・4–8 週間を目安とし、対照条件は少なくとも「静的人格」「動的人格」「動的人格+安全介入強化」の三条件を置く。期間中は、週次で attachment / burden / perceived consistency を取り、turn-level では OOC、drift、memory precision、latency、安全介入成功率を自動記録する。これは規範的提案であり、現行の公開ベンチマークだけでは不足する長期的 attachment と welfare の変化を補うための設計である。
動的人格設計の最大の倫理問題は、「より自然に成長する人格」が、そのままより健全な関係を意味しないことである。AI-RP は attachment と companionship を relational outcome として整理するが、これを最適化目標にし過ぎると、関係依存を製品設計で促進することになる。実際、2026 年の companion 研究では、persistent memory、named persona、graduated intimacy mechanics、continued engagement を狙う訓練目標が、personal relationship norms を人工的に育てる設計だと批判されている。また personalization 自体が benign memory を通じて harmful intent を「正当化」しうることも報告されている。したがって、動的人格は UX の強化機構であると同時に、操作性を高める危険機構でもある。
未成年対応では、一次資料ベースの潮流がかなり明確である。Character.AI は 2025 年後半に under-18 の open-ended chat を段階的に廃止し、時間制限、age assurance、Parental Insights、外部支援導線の統合を進めた。中国の 2026 年規則は、14 歳未満の個人情報処理に保護者同意を要求し、過度依存や 2 時間超の連続利用に注意喚起を義務づけ、AI と人間の区別表示と容易な退出経路も求めている。米国 FTC も、companions が children/teens に与える影響、評価・監視・リスク説明を企業に問う調査を開始した。よって、未成年を対象とする dynamic persona は、関係の深まりを機能として設計しないことが、2026 年の公的動向と整合的である。
説明可能性については、activation steering 系の進展が重要である。PERSONA は trait vector の加減算、personality sliders は連続的な Big Five 操作を通じて、人格制御をある程度「見える化」した。これは、なぜ今の応答がその人格表出になったのかを、状態変数やベクトル係数で説明できる可能性を開く。一方、RLHF/DPO/online tuning は結果として高性能でも、人格変更の局所原因の追跡は難しい。したがって、説明可能性を重視する製品では、state machine、memory update log、vector coefficient、policy decision trace を残せる設計の方が望ましい。
撤回可能性も中核課題である。Hume は zero data retention を提供し、China 2026 rule は容易な exit path を義務づけ、OpenAI の personalization 例は memory の昇格条件・TTL・no invention・sensitive pattern 拒否を明示している。逆に、継続的な online fine-tuning は、更新が重みへ混ざるため撤回が難しい。したがって dynamic persona では、少なくとも memory edit/delete、session rollback、global profile opt-in、relationship reset、persona branch の分離を実装し、重み更新には慎重であるべきである。グローバルな hard law として「人格改変の同意」それ自体を直接義務づける包括規制は、この調査範囲では 未指定 だったが、データ保護・透明性・未成年保護・退出権の組み合わせから、実務上は opt-in / opt-out を備えるべきである。
規制・標準化の面では、EU AI Act の FAQ が chatbots や AI social companions に transparency obligations を課し、日本の AI 事業者ガイドラインは living document として OECD AI 原則ベースの統一指針を提示し、PPC は生成 AI への個人情報入力について利用目的の範囲内かを注意喚起している。NIST AI RMF と Generative AI Profile、ISO/IEC 42001・23894 は companion 専用ではないが、人格更新ログ、評価、リスク管理、影響評価の枠組みを与える。2026 年時点の companion-specific hard law は中国が最も明示的で、他地域は汎用 AI ガバナンスの適用が中心である。
| 地域 | 一次情報 | 動的人格設計に関係する要点 | 出典 |
|---|---|---|---|
| EU | AI Act Service Desk FAQ | AI social companions は transparency-risk。AI との対話である旨の通知が必要 | |
| 中国 | 拟人化互动服务管理暂行办法 | AI 表示、14歳未満は保護者同意、依存兆候や長時間利用への警告、容易な退出、敏感情報の学習利用制限 | |
| 日本 | AI事業者ガイドライン、PPC 注意喚起 | 統一的 AI ガバナンス指針、個人情報の生成 AI 入力に関する適法性確認 | |
| 米国 | FTC inquiry | companion chatbot の safety testing、子ども・ティーンへの影響、リスク説明の有無を調査 | |
| 国際標準 | NIST AI RMF / ISO 42001 / ISO 23894 | companion 専用ではないが、risk management、governance、impact 管理の基盤 |
以下は、本報告に直接効いた一次ソース群である。URL は公開情報のみを記載した。
| 区分 | タイトル | URL | 短い注釈 |
|---|---|---|---|
| 学術論文 | The Oscars of AI Theater: A Survey on Role-Playing with Language Models | https://arxiv.org/abs/2407.11484 |
起点サーベイ。role-playing 設計を俯瞰する全体地図。 |
| 学術論文 | AI-RP: The AI Relationship Process Framework | https://arxiv.org/abs/2601.17351 |
AI companion 関係形成を communication 中心に理論化。 |
| 学術論文 | Generative Agents: Interactive Simulacra of Human Behavior | https://arxiv.org/abs/2304.03442 |
観察・計画・内省・記憶のアーキテクチャ原型。 |
| 学術論文 | Evolving to be Your Soulmate | https://arxiv.org/abs/2406.13960 |
Self-evolving personalized dialogue agent。動的 persona 適応。 |
| 学術論文 | Hello Again! LLM-powered Personalized Agent for Long-term Dialogue | https://arxiv.org/abs/2406.05925 |
長短期記憶と動的人格抽出を統合。 |
| 学術論文 | CharacterBox | https://aclanthology.org/2025.naacl-long.323/ |
行動軌跡ベースの role-playing 評価。 |
| 学術論文 | EmoCharacter | https://aclanthology.org/2025.naacl-long.316/ |
emotional fidelity 評価ベンチマーク。 |
| 学術論文 | RMTBench | https://aclanthology.org/2025.findings-emnlp.730/ |
user-centric multi-turn role-playing ベンチマーク。 |
| 学術論文 | TimeChara | https://aclanthology.org/2024.findings-acl.197/ |
物語時点に関する人物知識逸脱の評価。 |
| 学術論文 | PERSONA | https://arxiv.org/abs/2602.15669 |
activation vector algebra による推論時人格制御。 |
| 学術論文 | Dynamic Personality Adaptation via State Machines | https://arxiv.org/abs/2602.22157 |
状態機械で人格状態を制御するモデル非依存アーキテクチャ。 |
| 学術論文 | PDD | https://arxiv.org/abs/2603.01438 |
文脈依存の persona importance と reward-guided decoding。 |
| 学術論文 | Controllable and explainable personality sliders | https://arxiv.org/abs/2603.03326 |
連続 trait slider と explainable steering。 |
| 学術論文 | A-MEM | https://arxiv.org/abs/2502.12110 |
Zettelkasten 型の動的記憶組織。 |
| 学術論文 | Memory OS of AI Agent | https://arxiv.org/abs/2506.06326 |
short/mid/long-term personal memory の階層管理。 |
| 学術論文 | Preference-Aware Memory Update for Long-Term LLM Agents | https://arxiv.org/abs/2510.09720 |
evolving preference を短期・長期に分解して更新。 |
| 企業公式技術資料 | OpenAI Agents / Realtime / Evals / Personalization docs | https://developers.openai.com/api/docs/guides/agents https://developers.openai.com/api/docs/guides/realtime-models-prompting https://developers.openai.com/api/docs/guides/evals |
handoffs、guardrails、realtime、memory guardrails。 |
| 企業公式技術資料 | Gemini Live API / Gemma tuning docs | https://ai.google.dev/gemini-api/docs/live-api https://ai.google.dev/gemma/docs/tune |
音声・映像 realtime と open-weight Gemma の PEFT。 |
| 企業公式技術資料 | Hume EVI / Expression Measurement / Privacy docs | https://dev.hume.ai/docs/speech-to-speech-evi/overview https://dev.hume.ai/docs/expression-measurement/overview https://dev.hume.ai/docs/resources/privacy |
音声情動計測と zero data retention。 |
| 企業公式技術資料 | Inworld Realtime docs | https://docs.inworld.ai/realtime/overview |
OpenAI-compatible realtime、router、audio-conditioned 読み上げ。 |
| OSS | Open-LLM-VTuber | https://github.com/Open-LLM-VTuber/Open-LLM-VTuber |
ローカル/オフライン、voice interruption、Live2D、長期記憶。 |
| OSS | AITuber OnAir | https://github.com/shinshin86/aituber-onair |
視聴者 relationship system と text/voice/vision/long-term memory。 |
| OSS | AITuberKit | https://github.com/tegnike/aituber-kit |
RAG 長期記憶、マルチモーダル、独自商用ライセンス。 |
| 標準・規制 | EU AI Act FAQ | https://ai-act-service-desk.ec.europa.eu/en/faq |
AI social companions の transparency obligations。 |
| 標準・規制 | 中国 拟人化互动服务管理暂行办法 | https://www.cac.gov.cn/2026-04/10/c_1777558395078289.htm |
companion 特化で最も具体的な 2026 規則。 |
| 標準・規制 | 日本 AI事業者ガイドライン | https://www.ipa.go.jp/disc/committee/begoj9000000egny-att/20260305_009_04_00.pdf |
日本の統一的 AI ガバナンス指針。 |
| 標準・規制 | PPC 生成AIサービス利用注意喚起 | https://www.ppc.go.jp/files/pdf/230602_kouhou_houdou.pdf |
個人情報入力と利用目的の注意点。 |
| 標準・規制 | NIST AI RMF / Generative AI Profile | https://www.nist.gov/itl/ai-risk-management-framework https://www.nist.gov/publications/artificial-intelligence-risk-management-framework-generative-artificial-intelligence |
companion 専用ではないが運用上の基本枠組み。 |
| 標準・規制 | ISO/IEC 42001 / 23894 | https://www.iso.org/standard/42001 https://www.iso.org/standard/77304.html |
AI management system と AI risk management。 |
公開一次情報だけで見ると、依然として大きな空白がある。第一に、商用 companion の人格更新ルール、報酬関数、介入閾値は多くが未公開である。第二に、音声・表情・行動ログを persistent persona growth にどう統合するかの公開エビデンスは少なく、現状は API capability の公開が中心である。第三に、動的人格がユーザの attachment、孤独感、依存傾向、現実関係に与える因果効果については、OpenAI/MIT の affective-use 研究のような重要な前進がある一方、数か月単位での比較対照つき実証はまだ不足している。第四に、人格改変への同意・撤回可能性・未成年保護について、地域横断で整合した companion-specific ルールはまだ形成途上である。以上から、2026 年の実務的推奨は、重み更新より状態設計、完全自律成長より境界付き適応、経験則より eval-driven governance を優先することに尽きる。