sexta-feira, 8 de maio de 2009

Estatisticamente Falando parte 2

Tal como tinha prometido, vou falar de um conceito que é de extrema importância em qualquer tipo de decisões que se tomem, quando baseadas em informações incompletas ou quando há falta delas.
Os mais atentos saberão que estou a falar do teorema de Bayes, cuja definição matemática é

onde P(A) e P(B) são, respectivamente, as probabilidade dos acontecimentos A e B ocorrerem, P(A|B) é a probabilidade condicional de A, dado B ou seja, é a probabilidade de que se B ocorreu, A venha a ocorrer e P(B|A) logicamente será a probabilidade condicional de B, dado A.
Tal como devem saber, a definição clássica de probabilidade pode ser descrita como o coeficiente entre o número de casos favoráveis (em relação ao acontecimento sobre o qual queremos saber a probabilidade) e o número de casos total (todos os casos possíveis, quer sejam favoráveis ou não). A expressão matemática será, então,
Armados com esta informação, podemos então pensar quão diferente será a interpretação Bayesiana, da noção que normalmente temos dos que é a estatística. Nada como um exemplo para mais facilmente ficarmos com uma imagem dos conceitos envolvidos.

Por exemplo, vamos supor que um indivíduo se desloca ao médico para efectuar um exame fisiológico cujo resultado dirá se essa pessoa tem uma certa doença. O médico sabe que o teste tem uma fiabilidade de 99% (deveríamos ainda saber se a probabilidade de dar falsos positivos e falsos negativos é a mesma, mas neste exemplo vamos supor que sim), e quando o resultado do teste finalmente é conhecido, a resposta é positiva para a existência da doença.
Neste caso o que deve o médico dizer ao doente? O que muitos médicos acabam por dizer é que existe uma chance de 99% de o doente realmente ter essa maleita, no entanto, e à luz do teorema de Bayes, essa informação pode estar dramaticamente errada.
Vejamos por exemplo que se a doença em questão for uma condição rara (por exemplo apenas 500 pessoas em cada milhão de habitantes a ter), e tendo em conta a fiabilidade do teste, se testarmos um milhão de pessoas em princípio haverão 9995 falsos positivos e 5 falsos negativos (1% dos 999500 indivíduos sãos e 1% dos 500 que têm a doença, respectivamente).
Desta forma, dos 1.000.000 de indivíduos que testámos, 10.490 acusaram positivo, de onde 495 têm realmente a doença e 9995 não a têm.
Assim, tendo em conta a definição de probabilidade, existe apenas uma probabilidade de cerca de 4,7% que uma pessoa que acuse positivo no teste tenha realmente a doença em questão.

Como podem ver, a diferença é enorme e aumenta quanto mais rara for a doença ou quanto pior for a fiabilidade do teste efectuado. Quando nos deslocamos ao médico com o intuito de efectuar um qualquer exame, não estamos frequentemente a par da fiabilidade do teste que nos irão fazer, e aceitamos o resultado como se não houvesse qualquer incerteza associada ao diagnóstico. Este comportamento baseia-se na confiança que desenvolvemos nas capacidades técnicas de toda a equipa médica, e nomeadamente na sua compreensão do teorema de Bayes.
Tal como no caso do médico, o mesmo se pode concluir no que diz respeito em relação a entrevistas de trabalho onde, quer queiramos quer não, o teorema de Bayes é utilizado (quase sempre inconscientemente) na observação da nossa personalidade baseada nos estereótipos e na vivência de cada um dos entrevistadores. Ou seja, uma certa conclusão sobre a nossa personalidade, através de algo que tenhamos feito ou dito na entrevista, pode ser tirada partindo do rótulo que o entrevistador nos tenha adjudicado a priori. Ou seja, se for loira e se o entrevistador achar que 90% das loiras são burras, e se por acaso no meio da conversa tiver o azar de mencionar alguma afirmação estúpida, a percepção que ele tem sobre a probabilidade de que a pessoa que ele está a entrevistar ser realmente ignorante, aumenta de uma forma que pode estar errada exclusivamente porque o estereótipo (ou seja a percepção que ele tem sobre a percentagem de loiras menos espertas) pode estar drasticamente errado.
Daí o facto de os estereótipos serem tão perigosos.

Este conceito é também extremamente importante nos jogos de casino, nomeadamente no poker, mas deixarei para outro post este tema

1 comentário:

Vasco Gaspar disse...

Essa foi uma das razões que me levaram a sair da área do Recrutamento e Selecção, onde trabalhei 3 anos.

As entrevistas, segundo vários estudos, têm um grau de "acerto" de 15 a 20%.

Podemos sempre aumentar a "pontaria" usando testes psicométricos, de grupo e afins, mas nunca se ultrapassam os 50%, pelo que os outros 50% são pura arte (e às vezes manha).

No entanto "it's a dirty job but someone has to do it"! :)