Aproveitando a deixa da prova de significância estatística do post anterior, vale a pena revisitar dois textos publicados em maio, sobre formas de (não) prever os times favoritos para o Campeonato Brasileiro.
Uma das formas, que a maioria dos comentaristas usa, é basear-se no desempenho das equipes nos Campeonatos Estaduais.
Resumindo as contas, nos últimos dois anos, os resultados dos Estaduais só coincidiram com os do Brasileirão em 53% das vezes, em um total de 68 comparações. Isso dá um índice de significância próximo de 38%, ou seja, não dá para afirmar de jeito nenhum que os dois resultados estão relacionados.
A outra forma de prever o Brasileirão é bem óbvia: simplesmente tomar como base a tabela do campeonato anterior. Usando-se esse método, para as Séries A e B, alcançou-se 64% de acerto, nos últimos dois anos (total de 408 comparações). Não é um resultado que impressiona, mas é suficiente para alcançar significância maior que 99,99%.
Assim, estatisticamente falando, é certo que o resultado do Brasileirão passado tem relação com o deste (ou seja, quem se deu bem em 2010 tem mais chances de se sair melhor em 2011 que os outros); por outro lado, não existe nenhuma evidência de correlação entre o resultado do Estadual e o do Nacional (ou seja, quem foi campeão e quem deu vexame no torneio regional têm as mesmas chances no Brasileirão).
Eu tava buscando fazer previsões do brasileirão, usando econometria, para ver se eu fazia previsões mais eficientes que sites de apostas.
ResponderExcluirEu pensei em várias coisas fatores como:
Desempenho recente
Se foi campeão estadual
Se a equipe classificou para a libertadores do ano (equipes na libertadores normalmente contratam mais jogadores, assim tendem a ir melhor no brasileiro)
Mas eu acho que a única que é relevante é o desempenho recente. Assim fazer algo como um modelo auto-regressivo, usando o desempenho recente das equipes e uma dummy se ela é a equipe mandante parece ser uma maneira eficiente para prever o brasileiro.
Eu precisava testar isso com uma base de dados maior, mas eu ainda não tive tempo de arranjar uma.
Abraços.
Esse é um desafio hercúleo!
ResponderExcluirA maior dificuldade, a meu ver, é que um enorme fator de influência não é previsível por modelos matemáticos: a perda de jogadores para o exterior (e, eventualmente, a compra de reforços). Na Europa, isso acontece muito menos no meio da temporada, assim fica mais fácil prever. Isso sem falar da instabilidade dos técnicos, que caem a toda hora, com isso mudando (para melhor ou, geralmente, pior) a força dos times.
Abs!