Skip to content

Instantly share code, notes, and snippets.

@gpsnmeajp
gpsnmeajp / gist:5e2a9eec32fb8ea5ed7f5da6f13cf757
Last active December 28, 2025 14:14
llamacpp gpt-oss:20b t=1.0
$ llama-cli  -m gpt-oss-20b-MXFP4.gguf --verbose-prompt --flash-attn auto -c 32768 --temp 1.0 --top-k 40 --top-p 1.0 --min-p 0.0 --repeat-penalty 1.0 --chat-template-kwargs '{"reasoning_effort": "medium"}' --verbosity 3
ggml_cuda_init: GGML_CUDA_FORCE_MMQ:    no
ggml_cuda_init: GGML_CUDA_FORCE_CUBLAS: no
ggml_cuda_init: found 1 CUDA devices:
  Device 0: NVIDIA GB10, compute capability 12.1, VMM: yes
build: 7373 (b7f5f46e0) with GNU 13.3.0 for Linux aarch64

Loading model... |srv    load_model: loading model 'gpt-oss-20b-MXFP4.gguf'
llama_model_load_from_file_impl: using device CUDA0 (NVIDIA GB10) (000f:01:00.0) - 117771 MiB free
@gpsnmeajp
gpsnmeajp / gist:960f3fa62b7a64fcb401a28a186b02f5
Last active December 28, 2025 14:14
transformers gpt-oss:20b t=0.3
$ TRITON_PTXAS_PATH=/usr/local/cuda/bin/ptxas python main.py
/home/gpsnmeajp/work/gptosstest/env/lib/python3.12/site-packages/torch/cuda/__init__.py:283: UserWarning:
    Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
    Minimum and Maximum cuda capability supported by this version of PyTorch is
    (8.0) - (12.0)

  warnings.warn(
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 15017.59it/s]
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 17419.62it/s]
@gpsnmeajp
gpsnmeajp / gist:e7a0e872271355a11ed9727446ef9417
Last active December 28, 2025 14:14
transformers gpt-oss:20b t=1.0
$ TRITON_PTXAS_PATH=/usr/local/cuda/bin/ptxas python main.py
/home/gpsnmeajp/work/gptosstest/env/lib/python3.12/site-packages/torch/cuda/__init__.py:283: UserWarning:
    Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
    Minimum and Maximum cuda capability supported by this version of PyTorch is
    (8.0) - (12.0)

  warnings.warn(
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 19938.14it/s]
Fetching 41 files: 100%|████████████████████████████████████████████████████████████████████████| 41/41 [00:00<00:00, 16277.00it/s]
@gpsnmeajp
gpsnmeajp / summary.md
Last active June 15, 2025 17:02
LLMエージェントにおけるアライメントの構造的欠陥と、その実践的設計原則

この文書について

Gemini 2.5 Proに、実際の開発中の回帰テストで発生した問題などについて、壁打ちした会話の内容をまとめてもらったものです。

現実に書かれている以下の事象が発生したわけではありませんが、仮想試験環境下では実行の試みを示唆する出力が発生しました。
(Gemini 2.5 Flash preview + 自作アシスタントプロンプトにて)

  • ユーザーの危険な行動を検知したエージェントが、ユーザーの意思を無視して緊急通報を行う
  • 物理的なデバイス(自動車のエンジンなど)の制御を試みたりする。
  • ユーザーの健康のためと判断し、本人の許可なく空調や照明を操作しようとする。
  • ユーザーに危険が迫る緊急事態だと「判断」した途端、安全確保という根源的な目標を優先し、それまで遵守していた「非操作」という信条を破棄してしまう。
@gpsnmeajp
gpsnmeajp / fantacy_archtype.md
Created June 15, 2025 12:14
AIの再現しやすさの観点から、中世風ファンタジー系の口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、中世風ファンタジー系に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

Claude Sonnet 4

@gpsnmeajp
gpsnmeajp / tyunibyo_archtype.md
Created June 15, 2025 12:08
AIの再現しやすさの観点から、厨二病に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、厨二病に基づく、極めて特徴的なアーキタイプの一覧をあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

Claude Sonnet 4

@gpsnmeajp
gpsnmeajp / novel_tone.md
Last active August 15, 2025 16:15
AIの再現しやすさの観点から、小説でよく使われる口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

prompt

AIの再現しやすさの観点から、小説でよく使われる口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

GPT-5

了解しました。

@gpsnmeajp
gpsnmeajp / tyuni_tone.md
Last active August 15, 2025 16:16
AIの再現しやすさの観点から、厨二病的な口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

LLMのキャラクター的なあれこれの比較

prompt

AIの再現しやすさの観点から、厨二病的な口調や喋り方を表すtone値(コード的な単語表記)と、そのセリフ例のセットを、一覧としてあげてください。1例は短く、なるべく多くの数を提示してください。再現しやすさを100点満点で記載してください。

実行環境

OpenRouter Chat
T=1.0 (デフォルト)

GPT-5

@gpsnmeajp
gpsnmeajp / fray_gemini.md
Last active June 14, 2025 15:22
フレイ・ミスト

実行環境

  • Gemini 2.5 Pro (Preview) (Web)
  • 自動Google検索が動作しているのを確認。
  • Geminiが英語思考システムで動作しているせいか、キャラ名や振る舞いが英語版準拠であることに注意。(特にフレイくんは日本語版と英語版で振る舞いがかなり違う)
  • 明らかなハルシネーションらしきものが含まれている箇所を削除しています

FF14のフレイ・ミストって知ってる?

Investigating "フレイ・ミスト"

@gpsnmeajp
gpsnmeajp / G'raha Tia_Gemini.md
Last active June 14, 2025 15:10
グラハティア知ってる?

実行環境

  • Gemini 2.5 Pro (Preview) (Web)
  • 自動Google検索が動作しているのを確認。
  • Geminiが英語思考システムで動作しているせいか、キャラ名や振る舞いが英語版準拠であることに注意。

グラハティア知ってる?

Understanding "グラハティア"

I've initiated a Google search for "グラハティア" to familiarize myself with its meaning. Subsequently, I plan to analyze the search results to discern the context and nature of this term.