domingo, 17 de julho de 2011

Como (não) prever o Brasileirão – parte 3

Aproveitando a deixa da prova de significância estatística do post anterior, vale a pena revisitar dois textos publicados em maio, sobre formas de (não) prever os times favoritos para o Campeonato Brasileiro.

Uma das formas, que a maioria dos comentaristas usa, é basear-se no desempenho das equipes nos Campeonatos Estaduais.

Resumindo as contas, nos últimos dois anos, os resultados dos Estaduais só coincidiram com os do Brasileirão em 53% das vezes, em um total de 68 comparações. Isso dá um índice de significância próximo de 38%, ou seja, não dá para afirmar de jeito nenhum que os dois resultados estão relacionados.

A outra forma de prever o Brasileirão é bem óbvia: simplesmente tomar como base a tabela do campeonato anterior. Usando-se esse método, para as Séries A e B, alcançou-se 64% de acerto, nos últimos dois anos (total de 408 comparações). Não é um resultado que impressiona, mas é suficiente para alcançar significância maior que 99,99%.

Assim, estatisticamente falando, é certo que o resultado do Brasileirão passado tem relação com o deste (ou seja, quem se deu bem em 2010 tem mais chances de se sair melhor em 2011 que os outros); por outro lado, não existe nenhuma evidência de correlação entre o resultado do Estadual e o do Nacional (ou seja, quem foi campeão e quem deu vexame no torneio regional têm as mesmas chances no Brasileirão).

2 comentários:

  1. Eu tava buscando fazer previsões do brasileirão, usando econometria, para ver se eu fazia previsões mais eficientes que sites de apostas.
    Eu pensei em várias coisas fatores como:
    Desempenho recente
    Se foi campeão estadual
    Se a equipe classificou para a libertadores do ano (equipes na libertadores normalmente contratam mais jogadores, assim tendem a ir melhor no brasileiro)
    Mas eu acho que a única que é relevante é o desempenho recente. Assim fazer algo como um modelo auto-regressivo, usando o desempenho recente das equipes e uma dummy se ela é a equipe mandante parece ser uma maneira eficiente para prever o brasileiro.
    Eu precisava testar isso com uma base de dados maior, mas eu ainda não tive tempo de arranjar uma.
    Abraços.

    ResponderExcluir
  2. Esse é um desafio hercúleo!
    A maior dificuldade, a meu ver, é que um enorme fator de influência não é previsível por modelos matemáticos: a perda de jogadores para o exterior (e, eventualmente, a compra de reforços). Na Europa, isso acontece muito menos no meio da temporada, assim fica mais fácil prever. Isso sem falar da instabilidade dos técnicos, que caem a toda hora, com isso mudando (para melhor ou, geralmente, pior) a força dos times.
    Abs!

    ResponderExcluir