再現率・適合率
Precision and Recall
分類タスクの評価指標。適合率は「予測の正確さ」、再現率は「見逃しの少なさ」を表す。トレードオフ関係にある。
適合率・再現率とは
適合率(Precision) と 再現率(Recall) は、分類タスクでAccuracyだけでは見えない性能を測るための評価指標です。不均衡データや見逃し・誤検知のコストが異なるタスクで特に重要です。
計算方法
陽性(Positive)を予測する問題で、結果を次のように整理します。
- TP(真陽性): 正しく陽性と予測
- FP(偽陽性): 誤って陽性と予測(本当は陰性)
- FN(偽陰性): 陽性を見逃して陰性と予測
Precision(適合率) = TP / (TP + FP)
Recall(再現率) = TP / (TP + FN)
- Precision: 「陽性と予測したもののうち、本当に陽性」の割合 → 誤検知の少なさ
- Recall: 「本当の陽性のうち、陽性と予測できた」の割合 → 見逃しの少なさ
トレードオフ関係
一般にPrecisionとRecallはトレードオフになります。閾値を厳しくするとPrecisionは上がるがRecallは下がり、緩めると逆になります。両立が難しいため、どちらを重視するかはタスクの性質で決めます。
使い分け
- Recall重視: 見逃しが致命的なタスク(異常検知、重大疾患の診断、不正検出)
- Precision重視: 誤検知のコストが高いタスク(誤警告で業務停止、誤通報)
- 両立したい: F1スコアで総合評価
指標の意味を理解せずに単一の数字だけを見ると判断を誤るため、タスクのリスク構造と照らし合わせて選ぶことが重要です。
