リランキング

Reranking

一次検索の結果を専用モデルで並べ直す処理。RAGの最終的な取得精度を底上げする。

リランキングとは

リランキング(Reranking)は、一次検索で取得した候補を、より精度の高い専用モデルで並べ直す処理です。RAGの最終段で使われ、取得精度を一段上に引き上げる役割を担います。

ベクトル検索やキーワード検索は「速いが粗い」傾向があり、一次検索だけでは上位に不適切な候補が紛れ込みがちです。リランキングはこれを後段で整えます。

仕組み

  1. 一次検索で上位50〜100件の候補を取得
  2. Cross-Encoderなどのリランキングモデルに、質問文と各候補をペアで入力
  3. ペアの関連度スコアを算出し、上位数件だけをLLMに渡す

ベクトル検索は質問と文書を別々にエンコードしますが、Cross-Encoderは同時に見て判定するため精度が上がります。

使いどころ

  • RAGの回答に不要な情報が紛れ込みやすい場面
  • 検索対象が大規模で、一次検索の上位がぶれやすい場合
  • 法務・税務のように、出典の正確さが求められるワークロード

注意点

  • Cross-Encoderは計算コストが高いため、全件ではなく一次検索の上位N件だけに適用するのが基本です。
  • リランキング用のモデル選定・日本語対応の有無は事前に検証が必要です。
  • 一次検索の候補にそもそも正解が含まれていないと、リランキングしても正解は上がってきません。一次検索の設計が先です。

士業AIで業務を効率化しませんか?

税務・会計・法務の専門AIが、日々の業務をサポートします。
まずは無料プランからお試しください。

無料で今すぐ試す