Dadas taxas verdadeiro positivo, falso negativo, você pode calcular falso positivo, verdadeiro negativo?

Existe uma grande confusão terminológica nesta área. Pessoalmente, eu sempre acho útil voltar a uma matriz de confusão para pensar sobre isso. Em um teste de classificação / triagem, você pode ter quatro situações diferentes:

 Condition: A Not A Test says "A" True positive | False positive ---------------------------------- Test says "Not A" False negative | True negative

Nesta tabela, “verdadeiro positivo”, “falso negativo”, “falso positivo” e “verdadeiro negativo” são eventos (ou sua probabilidade). O que você tem, portanto, é provavelmente uma taxa verdadeira positiva e uma taxa falso negativa. A distinção é importante porque enfatiza que ambos os números têm um numerador e um denominador.

Onde as coisas ficam um pouco confusas é que você pode encontrar várias definições de “taxa falso positivo” e “taxa falso negativo”, com diferentes denominadores.

Por exemplo, a Wikipédia fornece as seguintes definições (parecem bastante padrão):

  • Verdadeira taxa positiva (ou sensibilidade): $TPR = TP/(TP + FN)$
  • Falsa taxa positiva: $FPR = FP/(FP + TN)$
  • True negative rate (or specificity): $TNR = TN/(FP + TN)$

Em todos os casos, o denominador é o total da coluna. Isto também dá uma pista para a sua interpretação: A verdadeira taxa positiva é a probabilidade de o teste dizer “A” quando o valor real é de facto A (ou seja, é uma probabilidade condicional, condicionada ao facto de A ser verdadeiro). Isto não lhe diz qual a probabilidade de você estar correto ao chamar “A” (isto é, a probabilidade de um verdadeiro positivo, condicionado ao resultado do teste ser “A”).

Assumindo que a taxa de falsos negativos é definida da mesma forma, temos então $FNR = 1 – TPR$ (note que seus números são consistentes com isto). No entanto, não podemos derivar directamente a taxa de falsos positivos a partir das taxas de verdadeiros positivos ou falsos negativos porque não fornecem qualquer informação sobre a especificidade, ou seja, como o teste se comporta quando “não A” é a resposta correcta. A resposta à sua pergunta seria, portanto, “não, não é possível” porque você não tem informações na coluna da direita da matriz de confusão.

Existem, no entanto, outras definições na literatura. Por exemplo, Fleiss (Métodos estatísticos para taxas e proporções) oferece o seguinte:

  • ” a taxa de falsos positivos é a proporção de pessoas, entre aqueles que respondem positivos que estão realmente livres da doença”
  • “A taxa de falsos negativos é a proporção de pessoas, entre aqueles que respondem negativos no teste, que no entanto têm a doença.”

(Ele também reconhece as definições anteriores mas considera-as “desperdício de terminologia preciosa”, precisamente porque têm uma relação directa com a sensibilidade e a especificidade.)

Referindo-se à matriz de confusão, significa que $FPR = FP / (TP + FP)$ e $FNR = FN / (TN + FN)$ pelo que os denominadores são os totais das linhas. É importante notar que, sob estas definições, as taxas de falsos positivos e falsos negativos não podem ser derivadas directamente da sensibilidade e especificidade do teste. Você também precisa saber a prevalência (ou seja, a freqüência de A na população de interesse).

Fleiss não usa ou define as frases “taxa verdadeira negativa” ou “taxa verdadeira positiva”, mas se assumirmos que essas também são probabilidades condicionais dado um determinado resultado / classificação do teste, então @guill11aume resposta é a correta.

Em qualquer caso, você precisa ter cuidado com as definições porque não há uma resposta incontestável para a sua pergunta.

Deixe uma resposta

O seu endereço de email não será publicado.