Skip to content

Instantly share code, notes, and snippets.

モデル 向いている場面
Claude 文献知識/ファクト重視の用途
GPT-4o 高品質だがコスト高、万能型
Flash-Lite 安く大量に処理したいとき/テキスト生成
モデル 入力(/1Mtok) 出力(/1Mtok)
Pro $1.25〜2.50 $10〜15
Flash $0.30 $2.50
Flash-Lite $0.10 $0.40
モデル デフォルト設定
(思考予算が設定されていない)
範囲 思考を無効にする 動的思考をオンにする
2.5 Pro 動的思考
モデルが思考するタイミングと思考量を決定
128 ~ 32768 なし: 思考を無効にできない thinkingBudget = -1
2.5 Flash 動的思考
モデルが思考するタイミングと思考量を決定
0 ~ 24576 thinkingBudget = 0 thinkingBudget = -1
2.5 Flash Lite モデルは考えない 512 ~ 24576 thinkingBudget = 0 thinkingBudget = -1
モデル 目的 状態 主な用途
Pro 最高性能(深い思考力) GA 複雑なコード、戦略設計
Flash スピードと性能のバランス GA 要約、議事録、汎用タスク
Flash-Lite 最低コスト・最高スループット プレビュー バッチ処理、大量翻訳、集計系
フェーズ 使用ツール例 備考
台本生成 ChatGPT(Advanced) 音声スタイルに合わせた話し方も指定可能
音声生成 ChatGPT(Voiceモード) / OpenAI API 収録アプリで録音するか、API経由でMP3化
画像作成 Canva / Gamma.app / DALL·E 3 サムネ・挿絵・スライドなど
動画編集 CapCut / VN / Premiere Pro テロップ・BGM・SEでクオリティUP
音声編集 Audacity / Descript ノイズ除去やタイミング調整に便利
プラン ChatGPT音声 Advanced Voice Gemini Voice
無料 ◯(標準) △(短時間のみ) ×(音声はGemini Pro/AI Premium $19.99/月以上)
Plus($20/月) ◯(日次上限あり) ◯(Premium特典)
Team($30/月 ※年払いの場合は実質$25/月) ◯(上限緩和) ◯(Workspace)
Pro以上 ◯(制限なし) ◯(Enterprise対応)
比較軸 ChatGPT Google Gemini
知識応答・履歴管理 ◎:会話履歴・要約機能が優秀 △:リアルタイム性重視で履歴管理は弱め
雑談の自然さ ◯:音声は進化中 ◎:割り込み&テンポが抜群
声の個性 ◯:9種から選択可能 ◎:「ささやき声」「英国風」など指示できる
通訳・旅行対応 ◎:多言語&画像説明対応 ◎:多言語強いが日本語での指示はやや癖あり
項目 ChatGPT Standard ChatGPT Advanced Voice Google Gemini Voice
音声の自然さ やや棒読み 感情・間合い・抑揚が自然 ささやき・怒りなども再現
応答スピード やや遅延あり 低遅延(ほぼ即時) 即応(人間並み)
割り込み対応 × △(一部対応) ◎(スムーズに継続)
多言語対応 主要言語のみ 45言語以上対応・通訳可 45言語以上対応(I/O 2025時点)・同時翻訳OK
声の選択肢 固定ボイス 9種+話し方変更可能 自然言語で声の指示が可能
マルチモーダル × 画像・動画との会話OK カメラや画面共有にも対応
主な進化点 概要
感情表現の強化 共感・皮肉・笑いなど「人間らしい」抑揚が可能に
応答速度の改善 低遅延リアルタイム会話を実現
多言語・通訳対応 45言語以上に対応し、連続通訳も可
音声合成技術 最新TTSエンジンでナチュラルな声質を再現
音声認識の精度向上 雑音・方言・早口に強い最新STTモデル搭載
音声スタイルの多様化 9種類の声+話し方カスタマイズが可能
トピック名 概要 無料で試せる?
Gemini 2.5 Pro / Flash-Lite Googleの高速&低コストモデル登場 ❌(有料プラン)
ChatGPT Advanced Voice ChatGPTの音声モードが**“人間っぽく”進化** ⭕(日次プレビュー可)
Apple Intelligence / Liquid Glass iOSにプライベートAI&新UIが登場予定 ⭕(無料)
Perplexity vs BBC AIと著作権問題が再燃、BBCが法的措置検討 ⭕(無料プランあり)