レートリミット
Rate Limit
一定時間内に呼び出せるAPI回数やトークン数の上限。超過するとエラーになり、一時的にリクエストが通らなくなる。
レートリミットとは
レートリミットは、一定時間内に呼び出せるAPIの回数やトークン数の上限です。サーバー負荷の保護や公平な利用配分のために設けられています。
AI APIでは一般に「1分あたりのリクエスト数(RPM)」と「1分あたりのトークン数(TPM)」の2系統で設定されます。
超過するとどうなるか
- 429 Too Many Requests エラーが返る
- 一時的にリクエストが通らなくなる
- 業務システムに組み込んでいる場合、処理が止まる
対処の基本
- リトライ: 指数バックオフ(間隔を徐々に広げて再送)
- キュー化: 同時呼び出しを平準化
- 上位プラン: 利用量が恒常的に多いならプラン引き上げ
- バッチAPI: 即時性不要な処理はまとめて送信
士業事務所での位置づけ
顧客数や案件数が多い時期(確定申告・決算期等)に突発的に利用が跳ね上がると上限に当たりやすくなります。
- 繁忙期に向けた枠の事前確認・引き上げ
- 業務停止リスクを避けるための代替手段の準備
- バッチ処理で夜間にまとめて走らせる運用も有効
注意点
- 1つのAPIキーを全員で共有すると、1人の大量利用で全員が止まる
- 部署・用途ごとにキーを分けると切り分けしやすい
