ハイブリッド検索
Hybrid Search
キーワード検索と意味検索を組み合わせた方式。固有名詞・条番号と言い換えの両方に強い。
ハイブリッド検索とは
ハイブリッド検索は、キーワード検索(BM25など)とセマンティック検索(ベクトル検索)を組み合わせた検索方式です。両者の得意分野が異なるため、片方だけでは拾えない資料を補い合える構成になります。
- キーワード検索: 固有名詞・条番号・型番に強い
- セマンティック検索: 言い換え・曖昧な表現に強い
仕組み
- 質問に対して両方の検索を並列実行
- それぞれのスコアを正規化して合算(RRFや重み付き和)
- 上位の結果を生成側(LLM)に渡す
- 必要に応じてリランキングで仕上げる
士業の実務での有効性
- 税理士: 「第28条の2」のような条番号はキーワードで確実に引きつつ、「役員退職給与の扱い」のような曖昧な表現は意味検索で拾う
- 弁護士: 判例番号・事件名はキーワード、争点の類似性は意味検索
- 社労士: 規程の正式名称と、顧問先が使う口語的な呼び方の両方に対応
- 行政書士: 許認可の法令名と、現場で使われる略称を同時にカバー
厳密な指定語と、曖昧な言い回しが同居する士業の問い合わせと、ハイブリッド検索の設計はよく噛み合います。
注意点
- スコアの正規化・重み付けの設計が品質を左右します。実データで調整が必要です。
- 構成が複雑になるため、運用コストとの見合いで採用可否を判断します。
