ベクトルデータベース
Vector Database
埋め込みベクトルを高速に保存・検索するためのデータベース。RAGや意味検索の中核として使われる。
ベクトルデータベースとは
ベクトルデータベースは、埋め込み(Embedding)で生成された数値ベクトルを保存し、高速に類似検索できるデータベースです。RAGや意味検索の中核を担います。
従来のRDBは「完全一致・範囲検索」が中心ですが、ベクトルDBは「意味的な近さ」で検索するため、仕組みも最適化もまったく違います。
代表的な製品
- Pinecone
- Weaviate
- Chroma
- Qdrant
- pgvector(PostgreSQLの拡張)
自社サーバに立てる型から、フルマネージドのSaaS型まで幅広く選べます。
役割(RAGの中で)
- 社内文書をチャンクに分割し、それぞれを埋め込みベクトルに変換
- ベクトルDBに文書ID + ベクトル + 元テキストを保存
- 質問時、質問文もベクトル化し、DBで類似度の高いチャンクを検索
- 取得したチャンクをLLMに渡して回答を生成
士業の実務との関係
直接触る機会は少ないですが、RAGを使った社内ナレッジ検索を導入する際に必ず裏側で使われています。「自事務所の過去案件を意味で検索できる」「通達をニュアンスで引ける」といった体験の要です。
選び方の観点としては、データ保管場所(国内/海外)、機密情報への対応、既存ツールとの統合しやすさなどを評価するのが実務的です。
