リランキング
Reranking
一次検索の結果を専用モデルで並べ直す処理。RAGの最終的な取得精度を底上げする。
リランキングとは
リランキング(Reranking)は、一次検索で取得した候補を、より精度の高い専用モデルで並べ直す処理です。RAGの最終段で使われ、取得精度を一段上に引き上げる役割を担います。
ベクトル検索やキーワード検索は「速いが粗い」傾向があり、一次検索だけでは上位に不適切な候補が紛れ込みがちです。リランキングはこれを後段で整えます。
仕組み
- 一次検索で上位50〜100件の候補を取得
- Cross-Encoderなどのリランキングモデルに、質問文と各候補をペアで入力
- ペアの関連度スコアを算出し、上位数件だけをLLMに渡す
ベクトル検索は質問と文書を別々にエンコードしますが、Cross-Encoderは同時に見て判定するため精度が上がります。
使いどころ
- RAGの回答に不要な情報が紛れ込みやすい場面
- 検索対象が大規模で、一次検索の上位がぶれやすい場合
- 法務・税務のように、出典の正確さが求められるワークロード
注意点
- Cross-Encoderは計算コストが高いため、全件ではなく一次検索の上位N件だけに適用するのが基本です。
- リランキング用のモデル選定・日本語対応の有無は事前に検証が必要です。
- 一次検索の候補にそもそも正解が含まれていないと、リランキングしても正解は上がってきません。一次検索の設計が先です。
