roc - Kun otetaan huomioon todelliset positiiviset ja väärät negatiiviset tulokset, voitko laskea väärät positiiviset ja todelliset negatiiviset tulokset? - Cross Validated

Tällä alalla on melko paljon terminologista sekaannusta. Henkilökohtaisesti minusta on aina hyödyllistä palata sekaannusmatriisiin tätä asiaa miettiessäni. Luokittelu/seulontatestissä voi olla neljä erilaista tilannetta:

 Condition: A Not A Test says "A" True positive | False positive ---------------------------------- Test says "Not A" False negative | True negative

Tässä taulukossa ”tosi positiivinen”, ”väärä negatiivinen”, ”väärä positiivinen” ja ”tosi negatiivinen” ovat tapahtumia (tai niiden todennäköisyyttä). Sinulla on siis luultavasti tosi positiivinen osuus ja väärä negatiivinen osuus. Erottelu on tärkeää, koska se korostaa, että molemmilla luvuilla on osoittaja ja nimittäjä.

Missä asiat menevät hieman sekaviksi, on se, että voit löytää useita määritelmiä ”väärän positiivisen osuuden” ja ”väärän negatiivisen osuuden” määritelmille, joilla on eri nimittäjät.

Wikipediassa on esimerkiksi seuraavat määritelmät (ne vaikuttavat melko tavanomaisilta):

Tosi positiivinen osuus (tai herkkyys): $TPR = TP/(TP + FN)$
Väärän positiivisen osuus: $FPR = FP/(FP + TN)$
Tosi negatiivinen osuus (tai spesifisyys): $TNR = TN/(FP + TN)$

Kaikissa tapauksissa nimittäjä on sarakkeen kokonaismäärä. Tämä antaa myös vihjeen niiden tulkintaan: Todellinen positiivisuusaste on todennäköisyys sille, että testi sanoo ”A”, kun todellinen arvo on todellakin A (eli se on ehdollinen todennäköisyys, joka riippuu siitä, että A on tosi). Tämä ei kerro, kuinka todennäköisesti olet oikeassa, kun sanot ”A” (eli todellisen positiivisen todennäköisyys, ehdollisena sille, että testitulos on ”A”).

Jos oletetaan, että väärien negatiivisten osuus määritellään samalla tavalla, meillä on tällöin $FNR = 1 – TPR$ (huomaa, että numerosi ovat yhdenmukaisia tämän kanssa). Emme kuitenkaan voi suoraan johtaa väärien positiivisten osuutta oikean positiivisen tai väärän negatiivisen osuuden perusteella, koska ne eivät anna tietoa spesifisyydestä eli siitä, miten testi käyttäytyy, kun oikea vastaus on ”ei A”. Vastaus kysymykseesi olisi siis ”ei, se ei ole mahdollista”, koska sinulla ei ole tietoa sekoitusmatriisin oikeasta sarakkeesta.

Kirjallisuudessa on kuitenkin muitakin määritelmiä. Esimerkiksi Fleiss (Statistical methods for rates and proportions) tarjoaa seuraavaa:

” Väärien positiivisten osuus on niiden ihmisten osuus positiivisesti vastanneista, joilla ei todellisuudessa ole tautia.”
”Väärien negatiivisten osuus on niiden ihmisten osuus negatiivisesti vastanneista, joilla kuitenkin on tauti.”.”

(Hän tunnustaa myös edelliset määritelmät, mutta pitää niitä ”arvokkaan terminologian tuhlaamisena” juuri siksi, että niillä on suoraviivainen suhde herkkyyteen ja spesifisyyteen.)

Viitaten sekoitusmatriisiin, se tarkoittaa, että $FPR = FP / (TP + FP)$ ja $FNR = FN / (TN + FN)$, joten nimittäjät ovat rivien summia. Tärkeää on, että näillä määritelmillä väärien positiivisten ja väärien negatiivisten osuuksia ei voida johtaa suoraan testin herkkyydestä ja spesifisyydestä. Sinun on myös tiedettävä prevalenssi (eli kuinka yleinen A on kiinnostavassa populaatiossa).

Fleiss ei käytä tai määrittele ilmaisuja ”true negative rate” tai ”true positive rate”, mutta jos oletamme, että ne ovat myös ehdollisia todennäköisyyksiä, kun otetaan huomioon tietty testitulos/luokitus, @guill11aumen vastaus on oikea.

Joka tapauksessa sinun on oltava varovainen määritelmien kanssa, koska kysymykseesi ei ole mitään kiistatonta vastausta.

Given true positive, false negative rates, can you calculate false positive, true negative?

Vastaa Peruuta vastaus