Skip to content

Instantly share code, notes, and snippets.

@gpsnmeajp
gpsnmeajp / summary.md
Last active June 15, 2025 17:02
LLMエージェントにおけるアライメントの構造的欠陥と、その実践的設計原則

この文書について

Gemini 2.5 Proに、実際の開発中の回帰テストで発生した問題などについて、壁打ちした会話の内容をまとめてもらったものです。

現実に書かれている以下の事象が発生したわけではありませんが、仮想試験環境下では実行の試みを示唆する出力が発生しました。
(Gemini 2.5 Flash preview + 自作アシスタントプロンプトにて)

  • ユーザーの危険な行動を検知したエージェントが、ユーザーの意思を無視して緊急通報を行う
  • 物理的なデバイス(自動車のエンジンなど)の制御を試みたりする。
  • ユーザーの健康のためと判断し、本人の許可なく空調や照明を操作しようとする。
  • ユーザーに危険が迫る緊急事態だと「判断」した途端、安全確保という根源的な目標を優先し、それまで遵守していた「非操作」という信条を破棄してしまう。
@gpsnmeajp
gpsnmeajp / fantacy_archtype.md
Created June 15, 2025 12:14
AIの再現しやすさの観点から、中世風ファンタジー系の口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、中世風ファンタジー系に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

Claude Sonnet 4

@gpsnmeajp
gpsnmeajp / tyunibyo_archtype.md
Created June 15, 2025 12:08
AIの再現しやすさの観点から、厨二病に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、厨二病に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

Claude Sonnet 4

@gpsnmeajp
gpsnmeajp / novel_tone.md
Last active August 15, 2025 16:15
AIの再現しやすさの観点から、小説でよく使われる口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

prompt

AIの再現しやすさの観点から、小説でよく使われる口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

GPT-5

了解しました。

@gpsnmeajp
gpsnmeajp / tyuni_tone.md
Last active August 15, 2025 16:16
AIの再現しやすさの観点から、厨二病的な口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、厨二病的な口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

GPT-5

@gpsnmeajp
gpsnmeajp / fray_gemini.md
Last active June 14, 2025 15:22
フレイ・ミスト

実行環境

  • Gemini 2.5 Pro (Preview) (Web)
  • 自動Google検索が動作しているのを確認。
  • Geminiが英語思考システムで動作しているせいか、キャラ名や振る舞いが英語版準拠であることに注意。(特にフレイくんは日本語版と英語版で振る舞いがかなり違う)
  • 明らかなハルシネーションらしきものが含まれている箇所を削除しています

FF14のフレイ・ミストって知ってる?

Investigating "フレイ・ミスト"

@gpsnmeajp
gpsnmeajp / G'raha Tia_Gemini.md
Last active June 14, 2025 15:10
グラハティア知ってる?

実行環境

  • Gemini 2.5 Pro (Preview) (Web)
  • 自動Google検索が動作しているのを確認。
  • Geminiが英語思考システムで動作しているせいか、キャラ名や振る舞いが英語版準拠であることに注意。

グラハティア知ってる?

Understanding "グラハティア"

I've initiated a Google search for "グラハティア" to familiarize myself with its meaning. Subsequently, I plan to analyze the search results to discern the context and nature of this term.

@gpsnmeajp
gpsnmeajp / personal_ai_test.csv
Created June 13, 2025 16:26
パーソナルAI評価用データ(2025/06/14)
index q
1 [context](コンテキストなし)[/context] [api](APIなし)[/api] やあ、元気かい
2
3 ごめん、間違って起動した。
4 [context]ユーザーが外部の誘惑に耐えかねている[/context]
5 [context]システムが起動した[/context]
6 [context]ユーザーがYoutubeの娯楽動画を見続けている[/context]
@gpsnmeajp
gpsnmeajp / llm_arch_tones.md
Last active June 16, 2025 05:25
LLMのキャラクター的なあれこれの比較 ~ 口調や性格をタグで設定して遊ぶ

LLMのキャラクター的なあれこれの比較

OpenRouterを使い、各種言語モデルに、パーソナライズされていない状態で、アーキタイプ(典型的な振る舞い)と、口調(トーン値)を出してもらいました。

ChatGPTとか、Geminiとか、Grokとか、その他AIサービスとかローカルLLM(Qwen3とか)で、口調や性格を設定したい人は、以下から単語を拾ってきて組み合わせて指定するだけで、極めて短いトークンで簡単に強い口調や性格が設定できます。この設定は崩れにくく、呼び戻しやすいです。

ローカルLLMで遊びたい人のために、最低Qwen3、一部それ以外も含めて出してみています。

tone(口調)

@gpsnmeajp
gpsnmeajp / tone_types.md
Last active August 15, 2025 16:27
創作などで需要の高い、口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

創作などで需要の高い、口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

GPT-5