ハイブリッド検索

Hybrid Search

キーワード検索と意味検索を組み合わせた方式。固有名詞・条番号と言い換えの両方に強い。

ハイブリッド検索とは

ハイブリッド検索は、キーワード検索(BM25など)とセマンティック検索(ベクトル検索)を組み合わせた検索方式です。両者の得意分野が異なるため、片方だけでは拾えない資料を補い合える構成になります。

  • キーワード検索: 固有名詞・条番号・型番に強い
  • セマンティック検索: 言い換え・曖昧な表現に強い

仕組み

  1. 質問に対して両方の検索を並列実行
  2. それぞれのスコアを正規化して合算(RRFや重み付き和)
  3. 上位の結果を生成側(LLM)に渡す
  4. 必要に応じてリランキングで仕上げる

士業の実務での有効性

  • 税理士: 「第28条の2」のような条番号はキーワードで確実に引きつつ、「役員退職給与の扱い」のような曖昧な表現は意味検索で拾う
  • 弁護士: 判例番号・事件名はキーワード、争点の類似性は意味検索
  • 社労士: 規程の正式名称と、顧問先が使う口語的な呼び方の両方に対応
  • 行政書士: 許認可の法令名と、現場で使われる略称を同時にカバー

厳密な指定語と、曖昧な言い回しが同居する士業の問い合わせと、ハイブリッド検索の設計はよく噛み合います。

注意点

  • スコアの正規化・重み付けの設計が品質を左右します。実データで調整が必要です。
  • 構成が複雑になるため、運用コストとの見合いで採用可否を判断します。

士業AIで業務を効率化しませんか?

税務・会計・法務の専門AIが、日々の業務をサポートします。
まずは無料プランからお試しください。

無料で今すぐ試す