セマンティック検索(意味検索)
Semantic Search
キーワード一致ではなく意味の近さで検索する手法。言い回しが違っても主旨の近い資料を引ける。
セマンティック検索とは
セマンティック検索は、キーワードの一致ではなく「意味の近さ」で資料を探す検索手法です。質問文と文書を埋め込み(Embedding)でベクトル化し、ベクトル空間での距離が近いものを引いてきます。
従来のキーワード検索では「退職金」と「退職手当」のような言い換えを拾えませんでしたが、セマンティック検索なら同義語・類似表現を含む資料もまとめて取り出せます。
仕組み
- 社内文書をチャンクに分割し、埋め込みベクトルに変換
- ベクトルDBに保存
- 質問文もベクトル化し、コサイン類似度などで近いチャンクを取得
士業の実務での活用例
- 税理士: 「小規模企業の消費税の扱い」と曖昧に検索しても、関連通達やQ&Aを引ける
- 弁護士: 「解雇の正当事由」で検索し、表現の違う判例要旨や書面例を横断取得
- 社労士: 就業規則の類似条項を言い換え込みで検索
- 行政書士: 「建設業許可の要件」で、自治体ごとの表現差異を吸収して資料を集める
キーワードを厳密に揃える必要がなく、自然な言葉のまま資料を引けるのが実務上の利点です。
注意点
- 数字・固有名詞・条文番号などはキーワード検索の方が強い領域です。実運用ではハイブリッド検索(キーワード+セマンティック)が安定します。
- 検索の質は埋め込みモデルの性能とチャンク設計に強く依存します。
