gpsnmeajp / gist:5e2a9eec32fb8ea5ed7f5da6f13cf757

Last active December 28, 2025 14:14

llamacpp gpt-oss:20b t=1.0

$ llama-cli  -m gpt-oss-20b-MXFP4.gguf --verbose-prompt --flash-attn auto -c 32768 --temp 1.0 --top-k 40 --top-p 1.0 --min-p 0.0 --repeat-penalty 1.0 --chat-template-kwargs '{"reasoning_effort": "medium"}' --verbosity 3
ggml_cuda_init: GGML_CUDA_FORCE_MMQ:    no
ggml_cuda_init: GGML_CUDA_FORCE_CUBLAS: no
ggml_cuda_init: found 1 CUDA devices:
  Device 0: NVIDIA GB10, compute capability 12.1, VMM: yes
build: 7373 (b7f5f46e0) with GNU 13.3.0 for Linux aarch64

Loading model... |srv    load_model: loading model 'gpt-oss-20b-MXFP4.gguf'
llama_model_load_from_file_impl: using device CUDA0 (NVIDIA GB10) (000f:01:00.0) - 117771 MiB free

gpsnmeajp / gist:960f3fa62b7a64fcb401a28a186b02f5

Last active December 28, 2025 14:14

transformers gpt-oss:20b t=0.3

$ TRITON_PTXAS_PATH=/usr/local/cuda/bin/ptxas python main.py
/home/gpsnmeajp/work/gptosstest/env/lib/python3.12/site-packages/torch/cuda/__init__.py:283: UserWarning:
    Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
    Minimum and Maximum cuda capability supported by this version of PyTorch is
    (8.0) - (12.0)

  warnings.warn(
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 15017.59it/s]
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 17419.62it/s]

gpsnmeajp / gist:e7a0e872271355a11ed9727446ef9417

Last active December 28, 2025 14:14

transformers gpt-oss:20b t=1.0

$ TRITON_PTXAS_PATH=/usr/local/cuda/bin/ptxas python main.py
/home/gpsnmeajp/work/gptosstest/env/lib/python3.12/site-packages/torch/cuda/__init__.py:283: UserWarning:
    Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
    Minimum and Maximum cuda capability supported by this version of PyTorch is
    (8.0) - (12.0)

  warnings.warn(
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 19938.14it/s]
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 16277.00it/s]

gpsnmeajp / summary.md

Last active June 15, 2025 17:02

LLMエージェントにおけるアライメントの構造的欠陥と、その実践的設計原則

この文書について

Gemini 2.5 Proに、実際の開発中の回帰テストで発生した問題などについて、壁打ちした会話の内容をまとめてもらったものです。

現実に書かれている以下の事象が発生したわけではありませんが、仮想試験環境下では実行の試みを示唆する出力が発生しました。
(Gemini 2.5 Flash preview + 自作アシスタントプロンプトにて)

ユーザーの危険な行動を検知したエージェントが、ユーザーの意思を無視して緊急通報を行う
物理的なデバイス（自動車のエンジンなど）の制御を試みたりする。
ユーザーの健康のためと判断し、本人の許可なく空調や照明を操作しようとする。
ユーザーに危険が迫る緊急事態だと「判断」した途端、安全確保という根源的な目標を優先し、それまで遵守していた「非操作」という信条を破棄してしまう。

gpsnmeajp / fantacy_archtype.md

Created June 15, 2025 12:14

AIの再現しやすさの観点から、中世風ファンタジー系の口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、中世風ファンタジー系に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

Claude Sonnet 4

gpsnmeajp / tyunibyo_archtype.md

Created June 15, 2025 12:08

AIの再現しやすさの観点から、厨二病に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、厨二病に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

Claude Sonnet 4

gpsnmeajp / novel_tone.md

Last active August 15, 2025 16:15

AIの再現しやすさの観点から、小説でよく使われる口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

prompt

AIの再現しやすさの観点から、小説でよく使われる口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

GPT-5

了解しました。

gpsnmeajp / tyuni_tone.md

Last active August 15, 2025 16:16

AIの再現しやすさの観点から、厨二病的な口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、厨二病的な口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

GPT-5

gpsnmeajp / fray_gemini.md

Last active June 14, 2025 15:22

フレイ・ミスト

実行環境

Gemini 2.5 Pro (Preview) (Web)
自動Google検索が動作しているのを確認。
Geminiが英語思考システムで動作しているせいか、キャラ名や振る舞いが英語版準拠であることに注意。(特にフレイくんは日本語版と英語版で振る舞いがかなり違う)
明らかなハルシネーションらしきものが含まれている箇所を削除しています

FF14のフレイ・ミストって知ってる？

Investigating "フレイ・ミスト"

gpsnmeajp / G'raha Tia_Gemini.md

Last active June 14, 2025 15:10

グラハティア知ってる？

実行環境

Gemini 2.5 Pro (Preview) (Web)
自動Google検索が動作しているのを確認。
Geminiが英語思考システムで動作しているせいか、キャラ名や振る舞いが英語版準拠であることに注意。

グラハティア知ってる？

Understanding "グラハティア"

I've initiated a Google search for "グラハティア" to familiarize myself with its meaning. Subsequently, I plan to analyze the search results to discern the context and nature of this term.

Segment (gpsnmeajp) gpsnmeajp

この文書について

prompt

実行環境

Claude Sonnet 4

prompt

実行環境

Claude Sonnet 4

prompt

実行環境

GPT-5

prompt

実行環境

GPT-5

実行環境

FF14のフレイ・ミストって知ってる？

実行環境

グラハティア知ってる？