再現率・適合率

Precision and Recall

分類タスクの評価指標。適合率は「予測の正確さ」、再現率は「見逃しの少なさ」を表す。トレードオフ関係にある。

適合率・再現率とは

適合率(Precision)再現率(Recall) は、分類タスクでAccuracyだけでは見えない性能を測るための評価指標です。不均衡データ見逃し・誤検知のコストが異なるタスクで特に重要です。

計算方法

陽性(Positive)を予測する問題で、結果を次のように整理します。

  • TP(真陽性): 正しく陽性と予測
  • FP(偽陽性): 誤って陽性と予測(本当は陰性)
  • FN(偽陰性): 陽性を見逃して陰性と予測
Precision(適合率) = TP / (TP + FP)
Recall(再現率)   = TP / (TP + FN)
  • Precision: 「陽性と予測したもののうち、本当に陽性」の割合 → 誤検知の少なさ
  • Recall: 「本当の陽性のうち、陽性と予測できた」の割合 → 見逃しの少なさ

トレードオフ関係

一般にPrecisionとRecallはトレードオフになります。閾値を厳しくするとPrecisionは上がるがRecallは下がり、緩めると逆になります。両立が難しいため、どちらを重視するかはタスクの性質で決めます

使い分け

  • Recall重視: 見逃しが致命的なタスク(異常検知、重大疾患の診断、不正検出)
  • Precision重視: 誤検知のコストが高いタスク(誤警告で業務停止、誤通報)
  • 両立したい: F1スコアで総合評価

指標の意味を理解せずに単一の数字だけを見ると判断を誤るため、タスクのリスク構造と照らし合わせて選ぶことが重要です。

士業AIで業務を効率化しませんか?

税務・会計・法務の専門AIが、日々の業務をサポートします。
まずは無料プランからお試しください。

無料で今すぐ試す