Given true positive, false negative rates, can you calculate false positive, true negative?

この分野ではかなり用語の混乱がありますね。 個人的には、これについて考えるには、混乱マトリックスに立ち戻るのがいつも便利だと感じています。 分類/スクリーニング検査では、4つの異なる状況が考えられます。

 Condition: A Not A Test says "A" True positive | False positive ---------------------------------- Test says "Not A" False negative | True negative

この表では、「真陽性」「偽陰性」「偽陽性」「真陰性」は事象(またはその確率)です。 したがって、あるのは真陽性率と偽陰性率であろう。 この区別は、両方の数値に分子と分母があることを強調しているので重要です。

少し混乱するのは、「偽陽性率」と「偽陰性率」の定義がいくつかあり、異なる分母があることです。

たとえば、Wikipedia では次のように定義されています (これらはかなり標準的なようです)。

  • True positive rate (or sensitivity): $TPR = TP/(TP + FN)$
  • False positive rate: FPR = FP/(FP + TN)$
  • 真陰性率(または特異度): $TNR = TN/(FP + TN)$

すべての場合において、分母は列合計とする。 これは、その解釈の手がかりにもなる。 真陽性率とは、実際の値が本当にAであるときに、検査で「A」と判定される確率である(つまり、Aが真であることを条件とした条件付き確率である)。 これは、”A” と言ったときにどれくらいの確率で正しいか(つまり、テスト結果が “A” であることを条件とした真陽性である確率)についてはわかりません。

偽陰性率を同じように定義すると、次に $FNR = 1 – TPR$ となります(あなたの数字はこれと一致することに注意ください)。 しかし、真陽性率や偽陰性率から偽陽性率を直接導くことはできません。なぜなら、これらは特異度に関する情報、つまり「Aでない」が正解である場合にテストがどのように振る舞うかの情報を提供しないからです。 混同行列の右列の情報がないので、質問に対する答えは「いいえ、できません」となります。

ただし、文献上では他の定義もあります。 例えば、Fleiss (Statistical methods for rates and proportions) は次のように定義しています:

  • 「偽陽性率は、陽性と答えた人のうち、実際には病気を持っていない人の割合である」
  • 「偽陰性率は、検査で陰性と答えた人のうち、それでも病気を持っている人の割合である」
    • 「偽陽性率は、陽性と答えた人のうち、実際には病気を持っていない人の割合である」
      • 「偽陽性率は、検査で陰性と答えた人のうち、実際には病気を持っていない人の割合である」。”

      (彼は以前の定義も認めていますが、まさに感度や特異度と直接的な関係があるため、「貴重な用語の浪費」と考えています)

      混乱行列を参照すると、$FPR = FP / (TP + FP)$ と $FNR = FN / (TN + FN)$ であることがわかりますので、分母は行合計であると言えます。 重要なことは、これらの定義の下では、偽陽性率および偽陰性率は、テストの感度と特異度から直接導き出すことはできないということである。 また、有病率(対象集団においてAがどの程度頻発しているか)を知る必要があります。

      Fleissは「真の陰性率」や「真の陽性率」という言葉を使ったり定義したりしていませんが、それらが特定の検査結果/分類を与えられた条件付き確率でもあると仮定すれば、@guill11aumeの回答が正しいものになります。

      いずれにしても質問に対して明白な答えはないので、定義に注意することが必要です。

コメントを残す

メールアドレスが公開されることはありません。