Entrevistas   Entrevista da Semana
Foto: Divulgação

Marcelo Leme de Arruda é estatístico graduado e pós-graduado pela Universidade de São Paulo. É membro-diretor da RSSSF (The Rec.Sport.Soccer Statistics Foundation) e idealizador do site Chance de Gol Internacional.

 

“Os números são mais realistas que eu”

Futebol se discute, sim. Ou melhor, se calcula. Na tentativa de prever resultados de jogos, o estatístico Marcelo Arruda substituiu o campo por softwares e computadores, a bola por dados numéricos e os jogadores pela matemática. Ele, que há 7 anos mantém o site Chance de Gol, usa fórmulas para estipular as possibilidades de vitória, empate e derrota em partidas. Funciona mais ou menos assim:

1) Levam-se em conta os resultados de cada time nos últimos 4 anos – quem perdeu ou ganhou e por quantos gols de diferença.

2) Como os resultados dos oponentes de cada um desses times também são submetidos ao mesmo cálculo, forma-se uma espécie de “rede” de times, cada um com seu “coeficiente”, determinando quem é mais forte e quem é mais fraco.

3) Adicionam-se aí outros coeficientes, representando fatores como o fato de o jogo ser na casa de um dos times ou em campo neutro, etc.


Um exemplo bem simples:

1) Amanhã, A vai jogar contra B, na casa de B.

2) Mês passado, A ganhou de C por 3 gols, e C já tinha vencido B anteriormente, por 1 gol. Essa “rede” de confrontos mostra que A é mais forte que B. Com base nas diferenças de gol, Arruda confere um coeficiente a cada time.

3) Por outro lado, B vai jogar em casa, o que pode favorecê-lo de alguma maneira.

4) Com esses “ingredientes” em mãos, o estatístico simula, em um computador, milhares de partidas entre A e B. Daí, sai um relatório mostrando a porcentagem de vitória para A e B ou de empate.

Como já dá para imaginar, o trabalho de Arruda é mais que polêmico. “Recebo muitas críticas por não considerar fatores que não podem ser transformados em números, como o ‘peso da camisa’, por exemplo.” Mas, quando questionado sobre as suas próprias expectativas de torcedor, ele admite: “Os números são mais realistas que eu.”

O portal bateu um papo com ele sobre essas e outras questões, incluindo suas previsões para a Copa do Mundo de 2006. Aliás, você poderia imaginar que a Suécia e a República Checa são favoritas? Saiba por quê, lendo a íntegra da entrevista, a seguir.


O futebol é normalmente definido como uma "caixinha de surpresas". Qual a utilidade prática dos cálculos probabilísticos nesse universo de improbabilidades?

É você dimensionar as possibilidades dessas surpresas. No futebol, ao contrário de outros esportes, tudo pode acontecer. No basquete, por exemplo, se um time forte jogar dez vezes com um time fraco, o time forte ganha todas as dez. O fraco, por mais que tente se retrancar, não tem como deixar alguém sentado em cima da cesta. Não existe goleiro no basquete.

O futebol, por inúmeras características – como a possibilidade de o time jogar mais na defesa, as zebras, a possibilidade de um time forte não estar “inspirado” no dia –, é mais suscetível, mais vulnerável a essa aleatoriedade. Qualquer coisa pode acontecer. Mas existe uma tendência de que, em condições normais, o time mais forte ganhe o jogo. Então, a probabilidade diz que, se o Brasil jogar contra Papua Nova Guiné, podem acontecer três coisas: o Brasil deve ganhar, porque é muito mais forte, mas pode empatar e pode a Papua Nova Guiné ganhar. O que a probabilidade faz não é afirmar o que vai acontecer, mas sim dimensionar as possibilidades. É dizer que, entre todas as possibilidades, existe uma que é mais, digamos, “acontecível”.


Quais são os critérios utilizados pela Fifa para a criação do seu ranking de seleções? Na sua opinião, esses critérios são justos?
A Fifa utiliza muitos critérios. Eu acho os critérios justos, mas acho que, justamente por usar tantos critérios, acaba dando uma formulação matemática muito complicada. A Fifa usa basicamente os resultados dos jogos, o âmbito geográfico dos jogos (se o jogo é entre asiáticos, europeus, sul-americanos ou entre países de continentes diferentes), a competição para qual o jogo valeu e a própria força dos times.

Inicialmente, a Fifa pega quantos pontos o time tem no ranking e faz um cálculo (e aí já é um pouco de caixa-preta, porque não se revela exatamente como esse cálculo é feito). Ao contabilizar os resultados de jogos, se o time mais forte vencer, recebe menos pontos do que o mais fraco ganharia se tivesse acontecido o contrário. Aí, acrescenta-se um bônus para o time que estiver jogando fora de casa, porque teoricamente é mais difícil para um time jogar fora de casa. Em campo neutro, não há esse bônus. Aí, multiplica-se o resultado por um coeficiente que é relativo aos continentes aos quais os times pertencem. Depois, entra um outro coeficiente, que tem a ver com a competição. Exemplos: se for um jogo amistoso, o coeficiente é de 0,7; se for copa continental, é 0,8; se for Copa do Mundo, é 1. Aí, eles consideram os resultados dos últimos 8 anos da seguinte forma: para cada um dos anos, fazem uma média dos melhores resultados, depois uma média de todos os resultados, e confrontam essas duas médias, gerando uma só. Então, somam essas médias, sendo que as mais atuais têm peso maior. Exemplo: a média de 2006 tem peso 1; de 2005 tem 5/6; de 2004, 7/8... Enfim, faz-se uma “montalheira” toda para se chegar nesse ranking.

Muita gente critica o ranking da Fifa por achar que ele não considera um ou outro fator, mas, na maioria das vezes, a Fifa utiliza, sim, e a pessoa é que não sabe. Mas é tanto cálculo que acho que isso acaba muito mais complicando que explicando.


Na sua opinião, o ranking da Fifa poderia ser usado para a escolha dos cabeças-de-chave, ou como um método auxiliar na fase eliminatória?
Já é usado. No sorteio das chaves da Copa desse ano, a Fifa usou esse ranking como um dos critérios para identificar os cabeças, o que causou grande polêmica. O México ficou entre os oito primeiros. Os Estados Unidos ficaram em 9.o lugar e quase roubaram a posição de cabeça-de-chave da Itália. Eles usaram também a colocação nas Copas de 1998 e 2002 e os rankings de 2003, 2004 e 2005. Então, dá para entender: em 2002, os Estados Unidos chegaram nas quartas-de-final e a Itália morreu nas oitavas. O México chegou às oitavas em 1998 e 2002.


No ranking da Fifa e no imaginário da maioria dos torcedores, a Suécia é uma das seleções menos cotadas para levar a Copa. Mas aparece em terceiro lugar no seu ranking. Algo parecido acontece com a República Checa, que aparece em 2.º lugar tanto no seu ranking como no da Fifa. Como explicar essa probabilidade para o "coração de torcedor", que esperaria ver nesses postos seleções como Holanda e Argentina?
Primeiro porque “coração de torcedor” mistura muito o momento atual com a história. Tanto o ranking do Chance de Gol quanto o da Fifa usam resultados recentes. A Fifa usa os últimos oito anos, e eu uso os últimos quatro (uso quatro porque sempre tem uma Copa no meio, para avaliar os cruzamentos intercontinentais). E o “coração de torcedor” leva em conta que a Holanda já foi duas vezes vice-campeã. Tinha até o apelido de “Laranja Mecânica”. A Argentina já foi campeã duas vezes, teve o Maradona. Mas o Maradona não vai jogar, nem a Holanda vai jogar com o mesmo time da “Laranja Mecânica”. Se você avaliar os resultados atuais, vai ver que a Argentina perdeu de 4 a 1 na Copa das Confederações. Tudo bem que foi para o Brasil, mas foram três gols de diferença. A Holanda nem participou da última Copa do Mundo e teve uma campanha fraca na Eurocopa. Na hora de fazer os cálculos, isso acaba pesando.

Quanto à Suécia e à República Checa, ambas tiveram bons resultados na Eurocopa e nas eliminatórias para a Copa do Mundo. A República Checa ganhou da Alemanha. A Suécia ganhou da Itália, que ganhou do México na Copa do Mundo, que ganhou do Brasil na Copa das Confederações, que ganhou da Argentina no mesmo campeonato. A Suécia ganhou da Argentina na última Copa do Mundo.

Existe um critério usado pelo “coração de torcedor”, mas que não é possível transformar em números, que é o “peso da camisa”. Na hora H, o Brasil é o Brasil, e a Suécia é a Suécia. A bagagem histórica do Brasil acaba pesando um pouco. Mas não dá para pontuar isso em um ranking. O que o pessoal precisa lembrar, ao olhar o ranking, é o fato de que ele não é histórico, é atual e é frio. É resultado de contas, de números. Não há como medir camisa ou outras subjetividades. Por exemplo: o Ronaldinho foi duas vezes o melhor do mundo pela Fifa. Tudo bem, mas isso não entra no ranking, senão vai ficar ainda mais complicado do que já é a soma da Fifa.

Outro questionamento que costumo receber quando publico a probabilidade de um jogo: “Você diz que A tem mais chances de ganhar que B, mas A não ganha esse clássico há 3 anos.” Eu sei disso, mas os números não sabem. Outro: “O centroavante do time da casa está machucado, e o visitante vem com três reforços de seleção.” Está bem, mas isso também não conta. Ranking é número e acaba pagando o preço dessa limitação.


Fale um pouco sobre a sua relação com a matemática e com o futebol e sobre como e quando você decidiu seguir essa carreira.
Desde pequeno, eu gosto de futebol. Durante a Copa de 82, tive acesso a guias impressos com nome de jogadores, seleções, inclusive de países dos quais nunca tinha ouvido falar, como Argélia, Kuwait e Camarões. E num desses guias tinha uma lista de todos os campeões da história de vários campeonatos, como a Concacaf, Interclubes da África, todos os campeões nacionais de 1981. O Almanaque Abril também tinha listas parecidas. Fiquei maravilhado com tudo aquilo e comecei a colecionar. Nessa época, comecei a brincar de fazer rankings, levando em conta os times que tinham vencido mais vezes esse ou aquele campeonato. Durante a Copa de 86, a Folha publicou uma estatística de cada time, para justificar o favoritismo. O cálculo era algo como chutes a gol mais o número de passes certos, divididos pelo número de faltas mais impedimentos. Cada país tinha o seu “índice”, que era atualizado e comparado com o dos outros a cada jogo. Gostei muito dessa idéia de índices, porque dava para calcular e, de alguma forma, antecipar o resultado.

Na minha família, sempre conversamos bastante sobre futebol. Eu procurava meios de me informar para basear meus argumentos nas discussões e, nessas pesquisas, comecei a me perguntar sobre os critérios daqueles rankings de “melhores times de todos os tempos”. Por exemplo: quem determinava que a conquista da Copa Libertadores vale mais que a do Campeonato Brasileiro? Questionava se o Santos era mesmo o melhor de todos os tempos, por ter sido campeão mundial, mas sem ter ganhado nenhum Campeonato Brasileiro. O Flamengo já tinha ganhado três Brasileiros e a Copa União. Se você mudasse um pouco os valores de cada campeonato, o Flamengo passaria à frente do Santos. Sempre tive essas curiosidades, sempre gostei de matemática e sempre procurei formas de “matematizar” meu interesse por futebol, tanto que acabei entrando na faculdade de Estatística. E, no último dia de aula do curso, um professor comentou comigo sobre um artigo acerca do campeonato da NHL (a liga profissional de hóquei dos Estados Unidos) e que havia modelos estatísticos sobre chances de vitória, empate e derrota para cada jogo. E esse professor estava tentando adaptar esse modelo para o futebol, mas acabou não conseguindo. O hóquei tem muitos gols a mais que o futebol – é comum uma partida terminar em 15 a 13. Quando ele aplicava o modelo no futebol, chegava a números negativos. E aí, pesquisando, montei um modelinho bem simples para calcular um ranking de times. Mostrei para ele e começamos a trabalhar na minha tese de mestrado. Em 1999, tivemos aquele Campeonato Brasileiro que tinha o cálculo da média do rebaixamento, que acabou dando toda aquela discussão sobre o Botafogo e o Gama. E ninguém entendia direito como funcionava isso. Então, eu e meu professor resolvemos montar um site para explicar ao público como funcionava o cálculo e aproveitamos o modelo que eu criei para divulgar o Departamento de Estatística da USP. Criamos o site e, antes mesmo que eu defendesse a minha tese, surgiu um convite do Terra para integrar o portal. E daí para frente virou uma atividade profissional mesmo.


Existem oportunidades de emprego para matemáticos no futebol?
Ainda é restrito. Eu estou percebendo que esse nicho de cálculo de probabilidades, em que estou, tem muito menos visibilidade do que eu esperava. Porque é muito estático: a pessoa entra no site, vê a probabilidade de seu time ganhar, fecha o site e vai embora. Também não há muita conseqüência concreta, não se desenvolve. Pode haver, sim, mercado para quem resolver trabalhar com loteria, com apostas. Onde pode haver um pouco mais de aplicação seria dentro dos clubes. “Olha, de acordo com esse cálculo, nós teríamos que fazer 80 pontos para sermos campeões, e o nosso time hoje tem 30% de chances de atingir essa meta. Atualmente, somos capazes de chegar a 65 pontos e, portanto, precisamos melhorar.” Seria um trabalho mais de diagnóstico.

Onde eu acho que existe um grande campo de trabalho – mas seria necessário que as comissões técnicas estivessem preparadas para isso – seria na análise do desempenho do time, de cada jogador. Isso é feito amplamente nos Estados Unidos. E foi feito – mesmo que timidamente – pelo preparador físico Moraci Santana, tanto no São Paulo, quando foi campeão mundial com o Telê Santana, quanto depois, na seleção brasileira do Parreira, em 1994. O Moraci tinha um programa em que ele anotava coisas que julgava importantes. Assim, concluía que, a partir dos 30 minutos do segundo tempo, a taxa de acerto dos cruzamentos do jogador Fulano caía. Então, já servia como orientação para o técnico mudar alguma coisa na tática ou substituir esse jogador. Eu não sei exatamente o que ele anotava. Mas não eram aquelas anotações típicas de jornal de segunda-feira, como passes perdidos, faltas cometidas... Eram anotações do desempenho de cada jogador, ligadas – eu acredito – ao tempo do jogo. Eram coisas como “Cafu errou um passe aos 32 minutos”.

De fato, saber que o time errou 50 passes em um jogo não tem muita utilidade. Mas saber que, desses, 49 quem errou foi o Antônio, aí sim é válido. E mais: se ele souber que, desses 49, só dois foram no primeiro tempo, o técnico já sabe que pode usar o Antônio no primeiro tempo e que, no intervalo, é melhor substituir esse jogador. Esse rastreamento do tipo “quem erra, onde erra e quando erra” que o Moraci fazia era passado para o técnico, que usava os dados como queria.

Na Copa de 94, muitos jogos foram disputados sob o sol do meio-dia. Portanto, foi muito útil para o Parreira saber do Moraci quais jogadores resistiam mais ao calor.


Qual tem sido o nível de acertos do seu ranking nas últimas competições?
Isso é algo que me perguntam muitas vezes e que é complicado responder, devido à falta de familiaridade que as pessoas têm com as probabilidades. Do ponto de vista matemático, o acerto é 100%. Em nenhum momento, digo que um time vai ganhar ou perder. Digo que há mais chances de que algo aconteça, baseado no histórico recente dos times envolvidos no jogo. O Brasil tem 90% de chances de ganhar da Papua Nova Guiné, caso enfrente essa seleção na Copa. Mas há 2% de chances de ocorrer o contrário.


Seria errado, então, perguntar quais foram os maiores erros e acertos da sua carreira?
Tecnicamente, só se poderia falar em erro ou acerto se eu dissesse que há 100% de chances de algo acontecer. Mas existem algumas previsões mais acuradas que podem ser mencionadas. Existiram alguns jogos em que os meus cálculos de probabilidade destoavam do senso comum, e o time para o qual eu previa mais chances de vitória realmente ganhou. Exemplos: São Caetano e Fluminense, na Copa João Havelange. O São Caetano vinha do módulo amarelo e o Fluminense era o terceiro colocado do módulo principal. Mas, pelos cálculos, o São Caetano tinha mais chances de se classificar que o Fluminense, e foi o que aconteceu. Outro exemplo é França e Austrália na Copa das Confederações em 2001. A França era campeã mundial e européia, mas os cálculos mostravam mais chances para a Austrália (64%), e ela acabou ganhando. A Austrália tinha acabado de ganhar de 22 a 0 de Tonga e de 31 a 0 da Samoa Americana. Então, isso jogou a cotação da Austrália lá em cima.


Existe 100% em probabilidade?
Não em probabilidade calculada. Pode até dar 99,99%. 100%, nunca. Mas existe a chamada “probabilidade subjetiva”. Correntes dentro da faculdade discutem muito isso e acham que não há necessidade de um modelo matemático, que basta opinar. Tem um exemplo clássico que é o da moeda jogada para o alto. Diz-se que há 50% de chances de cair cara e 50% de chances de cair coroa. Mas uma pessoa pode dizer: “Eu analisei essa moeda, o atrito do ar, pensei comigo mesmo e acho que tem um pouco mais de chances de sair coroa.” Eu tenho o direito de ter essa opinião. Outra coisa que se pode fazer é jogar essa moeda muitas vezes e analisar os resultados. E uma pessoa também pode achar (seja por qual for o motivo) que a chance de o Brasil ganhar da Papua Nova Guiné é de 100%, ou seja, que a Papua Nova Guiné não vai ganhar nunca.

Vale lembrar que 100% não existe para cálculos de vitória, empate ou derrota, mas existe, sim, para cálculos de classificação. Durante os campeonatos, os times chegam, às vezes, em situações em que, mesmo que percam todos os jogos dali para frente, já garantiram a pontuação necessária para ir à próxima fase. Há times que se sagram campeões com uma, duas rodadas de antecipação. São casos em que todas as combinações possíveis dão o mesmo resultado.


Como você faz para manter seus cálculos sempre atualizados, à medida que os jogos vão ocorrendo?
Eu tenho um banco de dados com todos os resultados que julgo importantes das seleções que estão na Copa do Mundo nos últimos quatro anos. Veja que há uma dose de subjetividade aí: eu considero jogos que julgo importantes. São todos os jogos de Copas do Mundo, de Confederações, Continentais, eliminatórias da Copa do Mundo e de Copas Continentais, os amistosos “data Fifa” e os amistosos envolvendo as seleções que estão na Copa – estes últimos, deste primeiro semestre de 2006. Por que não considero todos os jogos? Para não introduzir resultados “irreais” nos cálculos. De repente, teve um amistoso da Argentina contra a Venezuela em que ela perdeu, mas não porque jogou pior e, sim, porque jogou com um time reserva. No ano passado, tivemos amistosos que o Equador disputou sem os seus melhores jogadores, que estavam na Europa, e perdeu para a Bolívia. Não é um resultado real porque não foi o Equador “de verdade” que perdeu. Eu estaria tirando pontos injustamente. Eu suponho que, nas Copas oficiais, o time bota os melhores jogadores. A mesma coisa, nos amistosos “data Fifa”, para os quais normalmente os times europeus já estão orientados a liberar os jogadores para suas respectivas seleções. E os amistosos deste primeiro semestre, também considero, porque são preparatórios para a Copa e, para muitos jogadores, vale vaga na escalação. Também dá para considerar como sendo um amistoso sério. E nesse banco de dados vou adicionando os resultados que vão acontecendo, e o computador processa de acordo com as fórmulas matemáticas que estabeleci, que levam em conta, além dos resultados, fatores como campo de jogo, etc.


Como funcionam os seus rankings de clubes nacionais e internacionais e quais as diferenças em relação aos da CBF e da IFFHS, respectivamente?
O da CBF é unicamente histórico. Eles consideram toda a trajetória do time desde 1971 e dá pontuações de acordo com a colocação que a equipe alcança nos campeonatos. Não tem nada a ver com resultado atual e não serve para traçar probabilidades de jogos. Uma grande prova disso é que o ranking da CBF traz o Bangu na frente do São Caetano.

O meu ranking de clubes nacionais é parecido com o de seleções. A diferença é que, no de clubes nacionais, analiso só o desempenho do último ano. Considero o Campeonato Brasileiro, a Copa do Brasil e os principais campeonatos estaduais. E é o mesmo mecanismo. Tem aquela massa de resultados e aquele sistema de equações associado a cada jogo.

O ranking de seleções da IFFHS é parecido com o da CBF, mas usa só os últimos 12 meses. Eles medem a colocação nos campeonatos, mas não contam campeonatos estaduais, só de nacionais para cima. Se não me engano, entra um cálculo de aproveitamento também. Digamos que a Copa Libertadores valha 50 pontos. Se um time ganha a Libertadores e teve aproveitamento de 70% nesse campeonato, ganha 35 pontos (70% de 50). Na minha opinião, esse ranking acaba até beneficiando um pouco os times da América do Sul, porque aqui os times podem disputar duas Copas. Na Europa, podem disputar somente uma.

O meu ranking de clubes internacionais é igual ao de clubes brasileiros, só que só uso as Copas Continentais e o Mundial de Clubes. Posso adiantar que esse ano haverá uma flutuação maior nas posições, porque a maioria dos clubes tem poucos jogos nos últimos 12 meses – seis em média. O que mais tem jogos é o Saprissa, com 16. Então, como o ranking se baseia nos resultados dos últimos jogos, há pouca base para ele. Qualquer goleada pode causar grandes mudanças nas colocações.


A sua intuição de torcedor normalmente coincide com os cálculos probabilísticos que você desenvolve?
Às vezes, coincide, mas os cálculos são mais realistas que eu. Por exemplo: o Saprissa foi campeão da Copa da Concacaf, em que jogam os principais times do México. Eu pensei: “Se o Saprissa ganhou dos principais do México, é um time que pode engrossar no Mundial... O Liverpool não é grande coisa, teve um período instável no Campeonato Inglês... Então, o Saprissa pode muito bem ganhar do Liverpool.” Mas, na hora de calcular, dava 70% para o Liverpool vencer, 20% para empate e 10% para o Saprissa. E realmente o Liverpool acabou ganhando de forma indiscutível, 3 a 0. Mostrou que os números refletiam melhor a diferença entre os times do que a minha intuição.

 

Por César Munhoz
Colaboraram Siedro Augusto Haus e Ricardo von Staa

*****


   


         
<< voltar  
         




Copyright 1999-2021. Portal Educacional. Todos os Direitos Reservados.

Termos de uso | Quem somos