APIレートリミット

API Rate Limit

APIレートリミットとは

APIレートリミット(API Rate Limit)とは、AIのAPIサービスが一定時間内に受け付けるリクエスト数やトークン数に設定する上限のことです。サーバーの過負荷を防ぎ、全てのユーザーに公平なサービスを提供するために設けられています。OpenAI、Anthropic、Google Cloud AI Platformなど、ほぼ全てのAI APIプロバイダーがレートリミットを設定しています。

レートリミットの種類

レートリミットには複数の種類があります。RPM(Requests Per Minute:1分あたりのリクエスト数)、TPM(Tokens Per Minute:1分あたりのトークン数)、RPD(Requests Per Day:1日あたりのリクエスト数)などが一般的です。利用プランやTier(利用量に応じたレベル)によって上限値が異なり、高額プランや利用実績の多いユーザーにはより高い上限が設定されます。

レートリミット対策

レートリミットに達した場合、HTTP 429(Too Many Requests)エラーが返されます。対策としては、指数バックオフ(Exponential Backoff)によるリトライ、リクエストのバッチ処理、キューイングシステムの導入、複数のAPIキーの使い分け、キャッシュの活用によるリクエスト削減などが有効です。プロダクション環境では、レートリミットを考慮したアーキテクチャ設計が重要であり、リクエストの優先度管理やフォールバック戦略を事前に計画しておくことが推奨されます。