ベクトル
Vector
複数の数値を並べたデータ表現。AIでは単語や文章を「意味を保った数値の並び」で表すために使う。
ベクトルとは
ベクトル(Vector)は、複数の数値を並べた1列のデータ表現です。数学的には「向きと大きさを持つ量」ですが、AIの文脈では**[0.12, -0.45, 0.89, ...]のような数値列**を指します。
AIは文字や画像を直接扱えないため、すべての情報をベクトルに変換してから処理します。
なぜ重要か
- 文章を意味ベースで扱える: 似た意味の文は似たベクトルになる
- 計算可能: 類似度・距離を数値で比較できる
- 高次元で豊かな表現: 数百〜数千次元でニュアンスを保持
たとえば「税理士」と「会計士」は、ベクトル空間上で近い位置に配置されます。
AIでの使われ方
- 埋め込み(Embedding): 単語・文章を意味ベクトルに変換
- ベクトル検索: クエリと文書のベクトルを比較して類似文書を抽出
- コサイン類似度: ベクトル同士の「向きの近さ」で意味の近さを測る
- ベクトルデータベース: 大量のベクトルを高速検索するための専用DB
他との関係
RAGの根幹は、文書をベクトル化してベクトルDBに保存し、質問をベクトル化して類似文書を引く、という流れです。LLMを実務で活用する際の情報検索の土台になる概念です。
