Date ratele adevărate pozitive, false negative, puteți calcula falsul pozitiv, adevăratul negativ?

Există destul de multă confuzie terminologică în acest domeniu. Personal, consider întotdeauna util să mă întorc la o matrice de confuzie pentru a mă gândi la acest aspect. Într-un test de clasificare / screening, puteți avea patru situații diferite:

 Condition: A Not A Test says "A" True positive | False positive ---------------------------------- Test says "Not A" False negative | True negative

În acest tabel, „adevărat pozitiv”, „fals negativ”, „fals pozitiv” și „adevărat negativ” sunt evenimente (sau probabilitatea lor). Prin urmare, ceea ce aveți este probabil o rată de adevărat pozitiv și o rată de fals negativ. Distincția contează pentru că subliniază faptul că ambele numere au un numitor și un numitor.

Unde lucrurile devin puțin confuze este faptul că puteți găsi mai multe definiții ale „ratei fals pozitive” și „ratei fals negative”, cu numitori diferiți.

De exemplu, Wikipedia oferă următoarele definiții (par destul de standard):

  • Rata pozitivă adevărată (sau sensibilitate): $TPR = TP/(TP + FN)$
  • Rata falsă pozitivă: $FPR = FP/(FP + TN)$
  • Rata negativă adevărată (sau specificitatea): $TNR = TN/(FP + TN)$

În toate cazurile, numitorul este totalul coloanei. Acest lucru oferă, de asemenea, un indiciu pentru interpretarea lor: Rata adevăratului pozitiv este probabilitatea ca testul să spună „A” atunci când valoarea reală este într-adevăr A (adică este o probabilitate condiționată, condiționată de faptul că A este adevărat). Aceasta nu vă spune cât de probabil este să aveți dreptate atunci când spuneți „A” (adică probabilitatea unui adevărat pozitiv, condiționată de faptul că rezultatul testului este „A”).

Să presupunem că rata falsului negativ este definită în același mod, avem atunci $FNR = 1 – TPR$ (observați că cifrele dumneavoastră sunt în concordanță cu aceasta). Cu toate acestea, nu putem totuși să derivăm direct rata falsului pozitiv din rata adevăratului pozitiv sau din rata falsului negativ, deoarece acestea nu oferă informații despre specificitate, adică despre modul în care se comportă testul atunci când „nu A” este răspunsul corect. Răspunsul la întrebarea dvs. ar fi, prin urmare, „nu, nu este posibil”, deoarece nu aveți informații despre coloana din dreapta a matricei de confuzie.

Există însă și alte definiții în literatura de specialitate. De exemplu, Fleiss (Metode statistice pentru rate și proporții) oferă următoarele:

  • ” rata falsului pozitiv este proporția de persoane, dintre cele care răspund pozitiv, care sunt de fapt libere de boală.”
  • „Rata falsului negativ este proporția de persoane, dintre cele care răspund negativ la test, care totuși au boala.”

(El recunoaște și definițiile anterioare, dar le consideră „risipitoare de terminologie prețioasă”, tocmai pentru că au o relație directă cu sensibilitatea și specificitatea.)

Referindu-ne la matricea de confuzie, înseamnă că $FPR = FP / (TP + FP)$ și $FNR = FN / (TN + FN)$, astfel încât numitorii sunt totalurile rândurilor. Este important de menționat că, în cadrul acestor definiții, ratele fals pozitive și fals negative nu pot fi derivate direct din sensibilitatea și specificitatea testului. De asemenea, trebuie să cunoașteți prevalența (adică, cât de frecvent este A în populația de interes).

Fleiss nu folosește sau definește expresiile „rata adevăraților negativi” sau „rata adevăraților pozitivi”, dar dacă presupunem că acestea sunt, de asemenea, probabilități condiționate având în vedere un anumit rezultat al testului / clasificare, atunci răspunsul lui @guill11aume este cel corect.

În orice caz, trebuie să fiți atenți la definiții, deoarece nu există un răspuns incontestabil la întrebarea dvs.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.