Given true positive, false negative rates, can you calculate false positive, true negative?

W tym obszarze jest dość dużo terminologicznego zamieszania. Osobiście, zawsze uważam, że warto wrócić do matrycy zamieszania, aby o tym pomyśleć. W teście klasyfikacyjnym / przesiewowym, możesz mieć cztery różne sytuacje:

 Condition: A Not A Test says "A" True positive | False positive ---------------------------------- Test says "Not A" False negative | True negative

W tej tabeli, „prawdziwy pozytywny”, „fałszywy negatywny”, „fałszywy pozytywny” i „prawdziwy negatywny” są zdarzeniami (lub ich prawdopodobieństwem). To, co masz, jest zatem prawdopodobnie prawdziwą stopą dodatnią i fałszywą stopą ujemną. Rozróżnienie ma znaczenie, ponieważ podkreśla, że obie liczby mają licznik i mianownik.

Gdzie rzeczy stają się nieco mylące jest to, że można znaleźć kilka definicji „fałszywej stawki pozytywnej” i „fałszywej stawki negatywnej”, z różnymi mianownikami.

Na przykład, Wikipedia podaje następujące definicje (wydają się one dość standardowe):

  • Prawdziwie pozytywny wskaźnik (lub czułość): $TPR = TP/(TP + FN)$
  • Fałszywy pozytywny wskaźnik: $FPR = FP/(FP + TN)$
  • True negative rate (or specificity): $TNR = TN/(FP + TN)$

We wszystkich przypadkach mianownikiem jest suma kolumn. To również daje wskazówkę do ich interpretacji: Wskaźnik prawdziwie pozytywny to prawdopodobieństwo, że test mówi „A”, gdy rzeczywista wartość jest rzeczywiście A (tj. jest to prawdopodobieństwo warunkowe, uwarunkowane tym, że A jest prawdziwe). To nie mówi ci, jak prawdopodobne jest, że masz rację, kiedy nazywasz „A” (tj. prawdopodobieństwo prawdziwego wyniku pozytywnego, uwarunkowane tym, że wynik testu jest „A”).

Zakładając, że wskaźnik fałszywego negatywu jest zdefiniowany w ten sam sposób, mamy $FNR = 1 – TPR$ (zauważ, że twoje liczby są z tym zgodne). Nie możemy jednak bezpośrednio wyprowadzić współczynnika fałszywych wyników pozytywnych z prawdziwych wyników pozytywnych lub fałszywych wyników negatywnych, ponieważ nie dostarczają one informacji na temat specyficzności, tj. jak zachowuje się test, gdy „nie A” jest poprawną odpowiedzią. Odpowiedź na twoje pytanie brzmiałaby zatem „nie, to nie jest możliwe”, ponieważ nie masz informacji na temat prawej kolumny macierzy konfuzji.

W literaturze istnieją jednak inne definicje. Na przykład, Fleiss (Statistical methods for rates and proportions) oferuje następujące:

  • ” the false positive rate is the proportion of people, among those responding positive who are actually free of the disease.”
  • „The false negative rate is the proportion of people, among those responding negative on the test, who nevertheless have the disease.”

(Uznaje on również poprzednie definicje, ale uważa je za „marnowanie cennej terminologii”, właśnie dlatego, że mają one bezpośredni związek z czułością i swoistością.)

Odnosząc się do macierzy pomyłek, oznacza to, że $FPR = FP / (TP + FP)$ i $FNR = FN / (TN + FN)$, więc mianowniki są sumami rzędów. Co ważne, zgodnie z tymi definicjami, wskaźniki fałszywie dodatnie i fałszywie ujemne nie mogą być bezpośrednio wyprowadzone z czułości i swoistości testu. Musisz również znać częstość występowania (tj. jak często A jest w populacji zainteresowania).

Fleiss nie używa ani nie definiuje zwrotów „prawdziwie ujemna stawka” lub „prawdziwie dodatnia stawka”, ale jeśli założymy, że są to również warunkowe prawdopodobieństwa, biorąc pod uwagę konkretny wynik testu / klasyfikację, to odpowiedź @guill11aume jest poprawna.

W każdym razie, musisz być ostrożny z definicjami, ponieważ nie ma niepodważalnej odpowiedzi na twoje pytanie.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.