最大トークン数
Max Tokens
AIが1回の応答で出力できるトークン数の上限。設定しないと長すぎる出力になったり、途中で切れたりする。
最大トークン数とは
最大トークン数(Max Tokens)は、AIが1回の応答で出力できるトークン数の上限です。この値を超えて生成はされず、途中で打ち切られます。
なぜ設定するのか
- コスト制御: 無限に長い出力が返ってきて料金が膨らむのを防ぐ
- 応答時間: 短い上限ならレスポンスが速い
- 想定範囲内に収める: UIレイアウトを崩さないために上限を決める
目安
日本語では 1文字 ≒ 1〜2トークン なので、以下が目安:
- 短い返答(チャット応答): 150〜300
- 標準的なメール・要約: 500〜1000
- 長めのレポート・分析: 2000〜4000
- 長文ドラフト: 8000〜
多くのAIにはモデルごとの上限があり(例: 4096〜8192)、長文を扱うモデルでは数万トークンまで対応します。
注意点
- 入力トークン + 出力トークン ≦ コンテキストウィンドウ の制約がある。入力が長いと出力可能量が減る
- 上限にぶつかると途中で切れる。「続きを書いて」と指示して継続させる方法もある
- API経由で指定することが多い。ChatGPT画面からは直接制御できない
