Kann man bei gegebenen Raten von wahr-positiv und falsch-negativ die Raten von falsch-positiv und wahr-negativ berechnen?

In diesem Bereich gibt es ziemlich viel terminologische Verwirrung. Ich persönlich finde es immer nützlich, auf eine Verwirrungsmatrix zurückzugreifen, um darüber nachzudenken. Bei einem Klassifizierungs-/Screening-Test kann es vier verschiedene Situationen geben:

 Condition: A Not A Test says "A" True positive | False positive ---------------------------------- Test says "Not A" False negative | True negative

In dieser Tabelle sind „wahr positiv“, „falsch negativ“, „falsch positiv“ und „wahr negativ“ Ereignisse (bzw. deren Wahrscheinlichkeit). Es handelt sich also wahrscheinlich um eine wahr-positive Rate und eine falsch-negative Rate. Die Unterscheidung ist wichtig, weil sie unterstreicht, dass beide Zahlen einen Zähler und einen Nenner haben.

Etwas verwirrend ist, dass man mehrere Definitionen von „falsch-positiv-Rate“ und „falsch-negativ-Rate“ mit unterschiedlichen Nennern finden kann.

Wikipedia gibt zum Beispiel die folgenden Definitionen an (sie scheinen ziemlich standardisiert zu sein):

  • Wahr-positiv-Rate (oder Empfindlichkeit): $TPR = TP/(TP + FN)$
  • Falsch-positiv-Rate: $FPR = FP/(FP + TN)$
  • Wahr-Negativ-Rate (oder Spezifität): $TNR = TN/(FP + TN)$

In allen Fällen ist der Nenner die Summe der Spalten. Dies gibt auch einen Anhaltspunkt für die Interpretation der Ergebnisse: Die wahr-positive Rate ist die Wahrscheinlichkeit, dass der Test „A“ anzeigt, wenn der tatsächliche Wert tatsächlich A ist (d. h. es handelt sich um eine bedingte Wahrscheinlichkeit, die davon abhängt, dass A wahr ist). Sie sagt nichts darüber aus, wie hoch die Wahrscheinlichkeit ist, dass man richtig liegt, wenn man „A“ sagt (d.h. die Wahrscheinlichkeit eines wahren Positivs unter der Bedingung, dass das Testergebnis „A“ ist).

Angenommen, die Falsch-Negativ-Rate ist auf dieselbe Weise definiert, dann haben wir $FNR = 1 – TPR$ (beachten Sie, dass Ihre Zahlen damit übereinstimmen). Wir können die Falsch-Positiv-Rate jedoch nicht direkt aus der Rate der richtigen Positiven oder Falsch-Negativen ableiten, da sie keine Informationen über die Spezifität liefern, d. h. darüber, wie sich der Test verhält, wenn „nicht A“ die richtige Antwort ist. Die Antwort auf Ihre Frage wäre also „nein, es ist nicht möglich“, weil Sie keine Informationen über die rechte Spalte der Konfusionsmatrix haben.

Es gibt jedoch auch andere Definitionen in der Literatur. Fleiss (Statistische Methoden für Raten und Proportionen) bietet z.B. folgendes an:

  • „Die Falsch-Positiv-Rate ist der Anteil der Personen unter den positiv reagierenden Personen, die tatsächlich frei von der Krankheit sind.“
  • „Die Falsch-Negativ-Rate ist der Anteil der Personen unter den negativ reagierenden Personen im Test, die dennoch die Krankheit haben.“

(Er erkennt auch die vorherigen Definitionen an, hält sie aber für eine „Verschwendung wertvoller Terminologie“, gerade weil sie eine direkte Beziehung zu Sensitivität und Spezifität haben.)

Bezogen auf die Verwechslungsmatrix bedeutet dies, dass $FPR = FP / (TP + FP)$ und $FNR = FN / (TN + FN)$, die Nenner also die Zeilensummen sind. Wichtig ist, dass bei diesen Definitionen die Falsch-Positiv- und Falsch-Negativ-Raten nicht direkt von der Empfindlichkeit und Spezifität des Tests abgeleitet werden können. Man muss auch die Prävalenz kennen (d.h. wie häufig A in der interessierenden Population ist).

Fleiss verwendet oder definiert die Ausdrücke „wahre negative Rate“ oder „wahre positive Rate“ nicht, aber wenn wir davon ausgehen, dass es sich dabei auch um bedingte Wahrscheinlichkeiten bei einem bestimmten Testergebnis/einer bestimmten Klassifizierung handelt, dann ist die Antwort von @guill11aume die richtige.

In jedem Fall muss man mit den Definitionen vorsichtig sein, weil es keine unbestreitbare Antwort auf Ihre Frage gibt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.