コンテキストウィンドウ
Context Window
LLMが一度に処理できるトークン数の上限。広いほど長い契約書や判例などを丸ごと渡せるため、士業業務と相性がよい。
コンテキストウィンドウとは
コンテキストウィンドウは、LLMが一度に処理できるトークン数の上限です。ユーザーが入力したプロンプト+AIが出力する文章、両方を合わせてこの枠内に収まる必要があります。
たとえば100Kトークンのコンテキストウィンドウを持つモデルなら、日本語で数万字〜10万字超の資料を一度に読み込ませることができます。
なぜ重要か
- 長文の資料解析: 契約書・判例・通達を丸ごと投入できる
- 一貫した文脈保持: 長い対話でも前の内容を忘れにくい
- 会議議事録: 長時間の音声をまとめて要約できる
コンテキストが狭いモデルでは、長文を分割する必要があり、文脈が分断されて精度が落ちやすくなります。
モデル別の上限の傾向
コンテキストウィンドウはモデルごとに異なり、世代を重ねるごとに拡大してきています。
- 世代を重ねるほど拡大傾向: 数Kトークン程度から始まり、現行の主要モデルでは数十万〜百万トークンクラスのものも登場
- ベンダー・モデル・プランで差: 同じベンダーでもモデル・利用形態(Web / API / ベータ機能)で上限が異なる
- ベータ扱いや条件付きのケース: 最大値は限定提供・追加条件付きで提供される場合もある
具体的な数値は頻繁に更新されるため、利用前に各ベンダーの公式ドキュメントで最新の対応トークン数と条件を確認するのが安全です。
士業業務との相性
士業は契約書・判例・通達・就業規則など長尺資料を扱う機会が多く、コンテキストウィンドウが広いモデルとの相性がよい業種です。複数資料をまとめて渡して横断チェックさせる、といった使い方が現実的になります。
注意点
- コンテキスト上限いっぱいまで入れると、前半の内容への注目度が下がる傾向がある
- 長ければ長いほど処理時間・料金も増える
- 大量の関連資料を扱うなら、全部入れるよりRAGで必要分だけ渡す方が効率的なこともある
