roc - Kun je, gegeven de percentages waar-positief en vals-negatief, ook vals-positief en waar-negatief berekenen? - Cross Validated

Er is nogal wat terminologische verwarring op dit gebied. Persoonlijk vind ik het altijd nuttig om terug te komen op een verwarringsmatrix om hierover na te denken. In een classificatie / screeningstest kun je vier verschillende situaties hebben:

 Condition: A Not A Test says "A" True positive | False positive ---------------------------------- Test says "Not A" False negative | True negative

In deze tabel zijn “waar positief”, “vals negatief”, “vals positief” en “waar negatief” gebeurtenissen (of hun waarschijnlijkheid). Er is dus waarschijnlijk sprake van een waar-positief percentage en een vals-negatief percentage. Het onderscheid is belangrijk omdat het benadrukt dat beide getallen een teller en een noemer hebben.

Waar het een beetje verwarrend wordt, is dat je verschillende definities van “vals-positief percentage” en “vals-negatief percentage” kunt vinden, met verschillende noemers.

Wikipedia geeft bijvoorbeeld de volgende definities (ze lijken vrij standaard):

Terecht positief percentage (of gevoeligheid): $TPR = TP/(TP + FN)$
Vals positief percentage: $FPR = FP/(FP + TN)$
Terecht negatief (of specificiteit): $TNR = TN/(FP + TN)$

In alle gevallen is de noemer het kolomtotaal. Dit geeft ook een aanwijzing voor de interpretatie ervan: Het waar-positief percentage is de kans dat de test “A” zegt wanneer de echte waarde inderdaad A is (d.w.z., het is een voorwaardelijke kans, geconditioneerd op A die waar is). Dit vertelt u niet hoe groot de kans is dat u correct bent wanneer u “A” roept (d.w.z. de kans op een echt positief, geconditioneerd op het feit dat het testresultaat “A” is).

Aannemend dat het vals-negatief percentage op dezelfde manier wordt gedefinieerd, dan hebben we $FNR = 1 – TPR$ (merk op dat uw getallen hiermee in overeenstemming zijn). We kunnen het vals-positiefpercentage echter niet rechtstreeks afleiden uit het waar-positiefpercentage of het vals-negatiefpercentage, omdat die geen informatie geven over de specificiteit, d.w.z. hoe de test zich gedraagt wanneer “niet A” het juiste antwoord is. Het antwoord op uw vraag zou dus zijn “nee, dat is niet mogelijk”, omdat u geen informatie hebt over de rechterkolom van de verwarringsmatrix.

Er zijn echter andere definities in de literatuur. Fleiss (Statistical methods for rates and proportions) geeft bijvoorbeeld het volgende:

” het vals-positieve percentage is het percentage mensen, onder degenen die positief reageren, die in werkelijkheid vrij van de ziekte zijn.”
“Het vals-negatieve percentage is het percentage mensen, onder degenen die negatief op de test reageren, die niettemin de ziekte hebben.”

(Hij erkent ook de voorgaande definities, maar beschouwt ze als “verspilling van kostbare terminologie”, juist omdat ze een duidelijk verband hebben met gevoeligheid en specificiteit.)

Refererend naar de verwarringsmatrix, betekent dit dat $FPR = FP / (TP + FP)$ en $FNR = FN / (TN + FN)$, zodat de noemers de rijtotalen zijn. Belangrijk is dat bij deze definities de percentages vals-positieven en vals-negatieven niet rechtstreeks kunnen worden afgeleid uit de gevoeligheid en specificiteit van de test. U moet ook de prevalentie kennen (d.w.z. hoe vaak A voorkomt in de betrokken populatie).

Fleiss gebruikt of definieert de uitdrukkingen “true negative rate” of “true positive rate” niet, maar als we aannemen dat dit ook voorwaardelijke waarschijnlijkheden zijn gegeven een bepaald testresultaat / classificatie, dan is het antwoord van @guill11aume het juiste.

In elk geval moet u voorzichtig zijn met de definities, want er is geen onbetwistbaar antwoord op uw vraag.

Gegeven de percentages waar-positief en vals-negatief, kun je dan vals-positief en waar-negatief berekenen?

Geef een antwoord Antwoord annuleren