Matemática e pesquisa eleitoral

Estadão

25 Fevereiro 2010 | 10h11

Em breve, seremos todos bombardeados por pesquisas de intenção de voto até o ponto de saturação. Mas, para além do significado político (interpretado no blog do José Roberto de Toledo), pesquisas são peças de estatística — que é um ramo da matemática aplicada. E matemática é um dos assuntos por aqui.

A primeira pergunta, claro, é da onde vem a ideia de que pesquisas podem gerar informação útil. Qual a legitimidade, a base lógica, de se supor que as respostas dadas por um punhado de pessoas refletem a intenção de todos os eleitores?

A resposta é a Lei dos Grandes Números, demonstrada no século XVII por Jakob Bernoulli. Ela diz, basicamente, que quanto maior for uma amostra retirada de uma população, mais ela tende a refletir as propriedades da população como um todo. Isso é um teorema, que Bernoulli levou 2o anos para provar. Dá para encontrá-lo na Wikipedia.

Para funcionar, no entanto, a lei requer que a amostra seja aleatória. Um jeito de fazer isso é por meio da amostra aleatória simples, onde todos os membros da população sob estudo têm a mesma chance de serem avaliados. No caso de uma pesquisa para eleição presidencial, estimando-se que haja 130 milhões de eleitores no Brasil e que a pesquisa ouça 1.000 pessoas, a chance de você ser ouvido será de 1.000/130.000.000, o que dá 0,0008%.

(Isso ajuda a debelar a velha questão conspiratória de “você já foi entrevistado? conhece alguém que já tenha sido?”)

Como, no entanto, realizar um sorteio envolvendo 130 milhões de pessoas — e depois entrar em contato com os escolhidos, incluindo o pessoal que foi pescar — tende a ser um pesadelo logístico, as empresas costumam usar profissionais para desenhar outros tipos de amostra, como a estratificada, onde a sociedade primeiro é subdividida em categorias, e os sorteios, de menores proporções, então ocorrem dentro de cada categoria. É um processo complexo e tem lá suas armadilhas, mas que pode funcionar bem.

Supondo que a amostragem tenha sido definida de forma honesta e competente e a pesquisa bem realizada, chegam os números, geralmente dando a intenção de voto em cada candidato e uma margem de erro.

Uma coisa que quase nunca é divulgada quando saem pesquisas eleitorais no Brasil é o intervalo de confiança, que mede o grau de certeza de que a pesquisa reflete, de fato, a opinião da totalidade dos eleitores. Ele geralmente é de 95%, mas os caras podiam explicitar o número.

Um intervalo de 95% significa que existe 1 chance em 20 de que a pesquisa esteja errada — ou, para ser mais preciso, de que o resultado real, que seria obtido se todos os eleitores tivessem sido entrevistados, esteja fora da margem de erro.

Tanto o intervalo de confiança quanto a margem de erro dependem do tamanho da amostra entrevistada. É uma conta simples, na verdade: para achar a margem de erro com um intervalo de 95%, basta dividir 98 pela raiz quadrada do total de entrevistas. Se forem ouvidas 1.000 pessoas, isso dá a conhecida margem de 3,1%. Para obter um intervalo de 99%, é só trocar 98 por 129. No caso de 1.000 entrevistas, o resultado é 4%.

(Algumas vezes o cálculo real pode ser mais sofisticado que esse, mas quando as próximas pesquisas saírem, faça o teste do 98. Ele tende a dar certo na maioria dos casos)

Mas, enfim: o que significa, matematicamente, uma pesquisa de 1.000 eleitores, que diz que o candidato A tem 40% das intenções de voto, com margem de erro de 3% e 95% de intervalo de confiança?

Ela quer dizer que, se no mesmo período em que a pesquisa foi realizada, todos os eleitores tivessem sido ouvidos, há 95% de probabilidade de que entre 37% e 43% deles tivessem dito que preferem o candidato A.

Não parece muita coisa. Mas, politicamente o significado pode ser enorme — só que aí não é mais comigo.