特徴量
Feature
機械学習モデルに入力する「変数」や「指標」のこと。どんな特徴量を使うかがモデル精度を大きく左右する。
特徴量とは
特徴量(Feature)は、**機械学習モデルに入力する「変数」や「指標」**のことです。たとえば住宅価格予測なら「面積」「築年数」「駅からの距離」など、それぞれが特徴量です。
モデルは、これらの特徴量から結果を予測するように学習します。
古典的な機械学習 vs ディープラーニング
- 古典的機械学習: 人間が「どの特徴量を使うか」を設計する(特徴量エンジニアリング)
- ディープラーニング: モデル自身が生データから有用な特徴量を自動抽出
前者では「何を入力にすべきか」の専門知識が不可欠で、後者では「大量データ」があれば自動で最適な特徴が学習される、という違いです。
LLM における"特徴量"
LLMでは入力テキストが埋め込みベクトル(Embedding)として内部的な特徴量に変換されます。ユーザーとしては「特徴量」を直接意識することはありませんが、Embedding を扱う RAG システムではこの考え方が基礎になっています。
士業業務との関係
直接触る機会は少ないですが、顧問先企業が「データから予測AIを作りたい」と相談してきた場合などに、「どんなデータを特徴量として使うか」の整理が議論の出発点になります。
