レートリミット

Rate Limit

一定時間内に呼び出せるAPI回数やトークン数の上限。超過するとエラーになり、一時的にリクエストが通らなくなる。

レートリミットとは

レートリミットは、一定時間内に呼び出せるAPIの回数やトークン数の上限です。サーバー負荷の保護や公平な利用配分のために設けられています。

AI APIでは一般に「1分あたりのリクエスト数(RPM)」と「1分あたりのトークン数(TPM)」の2系統で設定されます。

超過するとどうなるか

  • 429 Too Many Requests エラーが返る
  • 一時的にリクエストが通らなくなる
  • 業務システムに組み込んでいる場合、処理が止まる

対処の基本

  • リトライ: 指数バックオフ(間隔を徐々に広げて再送)
  • キュー化: 同時呼び出しを平準化
  • 上位プラン: 利用量が恒常的に多いならプラン引き上げ
  • バッチAPI: 即時性不要な処理はまとめて送信

士業事務所での位置づけ

顧客数や案件数が多い時期(確定申告・決算期等)に突発的に利用が跳ね上がると上限に当たりやすくなります。

  • 繁忙期に向けた枠の事前確認・引き上げ
  • 業務停止リスクを避けるための代替手段の準備
  • バッチ処理で夜間にまとめて走らせる運用も有効

注意点

  • 1つのAPIキーを全員で共有すると、1人の大量利用で全員が止まる
  • 部署・用途ごとにキーを分けると切り分けしやすい

士業AIで業務を効率化しませんか?

税務・会計・法務の専門AIが、日々の業務をサポートします。
まずは無料プランからお試しください。

無料で今すぐ試す