教師なし学習
Unsupervised Learning
正解ラベルを使わず、データ自体からパターンを見出す学習方式。クラスタリングや異常検知で使われる。
教師なし学習とは
教師なし学習(Unsupervised Learning)は、正解ラベルを使わず、データ自体の構造やパターンから学習する方式です。「正解を与えない代わりに、データの内在的な性質をモデルに見つけさせる」イメージです。
代表的なタスク
- クラスタリング: 似たデータをグループ化(顧客セグメント等)
- 次元削減: データを少ない特徴量で表現(可視化・前処理)
- 異常検知: 普段と違うパターンを検出(不正取引等)
- 連関ルール発見: 「Aを買う人はBも買う」の発見
教師あり学習との使い分け
- ラベル付きデータがある: 教師あり学習(精度を追求しやすい)
- ラベル付けが困難/コスト高: 教師なし学習から始める
- データの"傾向"を掴みたい: 教師なし学習
実務との接点
士業業務に直接応用されることは少ないですが、以下のような場面で関わります。
- 顧客データの分析: 顧問先をセグメント化して施策を考える
- 異常値の検出: 会計データの異常パターン発見
- 業務パターンの可視化: スタッフの工数データから傾向を抽出
概念として押さえておくと、データ分析ツール・BIツールを使うときの理解が早くなります。
