<
>

O Bola de Prata voltou! Entenda as estatísticas por trás do Algoritmo DataESPN

Bolas de Prata estão mais uma vez em disputa ESPN.com.br

Explicar a realidade através da matemática é um desafio tentador. No mundo do futebol, posso afirmar que é impossível. Tendo isso em mente, preciso dizer, antes de qualquer coisa, algo muito importante: a intenção do Algoritmo DataESPN é ajudar a encontrar histórias e medir com uma visão fria o que acontece em campo, através de um conjunto de estatísticas. Explicar o que é o futebol, afirmar categoricamente quem é melhor ou pior através dele é uma pretensão perigosa e longe do que o departamento entende por ‘futebol’.

O desafio principal foi juntar este agregado de números de uma forma compreensível, que gerasse uma aproximação do que é nossa sensação, seja como espectador, torcedor ou analista. Responder a perguntas como: “quem está se destacando?”; “quem está acima ou abaixo da média?”; “quem faz mais ou menos do que o esperado?”.

Para começar o trabalho, foram diferentes estudos, tendo como base alguns exemplos de Rankings bem desenvolvidos no mundo dos esportes. Com consultoria de equipe da ESPN nos Estados Unidos, o SIG (Stats & Information Group), tivemos experiências como o Total QBR ESPN (rating de quarterbacks na NFL) e o player rating da NBA (também desenvolvido na ESPN) como guias e bases para a criação de algo voltado para o futebol, esporte mais difícil de ser medido simplesmente por números.

E para desenvolver o projeto, usamos uma ferramenta exclusiva da casa: o ESPN TruMedia, banco de dados estatístico com mais de 30 mil partidas de futebol cadastradas, incluindo acesso completo a números da Copa do Mundo desde 1966, por exemplo.

CARACTERÍSTICAS ESPECÍFICAS DE POSIÇÃO

Ao todo, são 100 critérios ‘medindo’ cada um dos jogadores. Dividimos o campo em três setores (defensivo, meio de campo, ofensivo) a fim de que cada posição pudesse ter sua própria característica. Exemplo: um centroavante vai receber pontuações por ações defensivas, como desarmes ou interceptações. Obviamente que os pesos destas serão menores do que para um zagueiro, e também maiores quando realizadas no terço de ataque em relação ao de defesa.

Vamos ilustrar: o peso da média das interceptações para um centroavante no setor ofensivo é 0,40, no defensivo 0,09. No caso de um zagueiro, 0,10 no ataque e 1,10 na defesa. Importante perceber como ambos receberão pontuações em terços que não fazem parte do seu “campo de ação” primordial, mas estas são consideradas bônus, algo a mais. Ou seja, um centroavante que só fique na banheira esperando a bola, pode até fazer muitos gols; mas, para ter a maior pontuação, terá de marcar muito mais que seus concorrentes. Da mesma forma, um zagueiro artilheiro, vai se beneficiar, mas se ele só fizer gols e comprometer lá atrás, dificilmente estará entre os primeiros.

DIFERENTES CAMPEONATOS

Da mesma forma que cada posição tem sua característica, cada campeonato também tem. Por isso, outra particularidade importante do Algoritmo DataESPN é que os próprios jogadores que vão definir o que é ‘bom’ e o que é ‘ruim’.

Se lembrarmos do Brasileirão 2016 e vermos que os artilheiros terminaram com 14 gols, podemos pensar que este é um número baixo. Esta impressão pode ser evidenciada olhando a Premier League 2016-17: Harry Kane (Tottenham) terminou com 29 – jogadores com 14 ficaram em 13° na tabela de artilharia. Mas, se eu fosse um jogador da Série A brasileira e marcasse 14 gols em 2016, seria artilheiro do torneio, e afinal isso é sim uma coisa boa.

Portanto, quem é capaz de definir se “5,3 interceptações por jogo” é uma média boa para um zagueiro? Como determinar que “0,67 gol por partida” é um número relevante para um centroavante, um meia? O próprio campeonato que vai nos responder isso. Cada uma das 92 médias de um jogador específico estará em um ranking no campeonato – exemplo: “5,3 interceptações por jogo é a 10ª melhor média de um lateral”; “0,67 gol por partida é a maior média de um centroavante”. Juntando todas, chegamos à pontuação final.

PESOS E METODOLOGIA

Temos as médias e as proporções, é hora de aplica-las. É neste momento que entram os pesos. E é aí que entra também, principalmente, o lado “DataESPN” da coisa. Dar pesos, sugerir relevâncias, mensurar importâncias, é um tanto quanto subjetivo. A participação do DataESPN é justamente filtrar essas medidas, aplicar os conceitos que trabalhamos no dia a dia no nosso grupo e que os departamentos de análise de desempenho dos clubes procuram melhorar em seus elencos, ou estão à procura no mercado.

Um dos critérios que mais mudou após esta análise mais crítica foi a interceptação. Não à toa, já citei no texto algumas vezes. Acostume-se a ouvir este termo, cujo significado nada mais é do que um passe roubado. Tradicionalmente, não é um conceito muito usado/falado nos jornais. Costumávamos ouvir mais “desarme”. Qual a diferença de um para outro? As duas situações caracterizam uma roubada de bola. No caso da interceptação, esta é uma ação limpa, livre de alguns riscos que se está sujeito ao tentar o desarme (falta, cartão, drible), que obrigatoriamente exige um contato, aproximação ao rival.

Aproveitando os dados históricos que o ESPN TruMedia dispõe, pudemos comprovar esta teoria e, em média (dependendo do campeonato), zagueiros interceptam entre 40%-60% a mais do que desarmam. Uma diferença considerável.

ALGORITMO DataESPN APLICADO

A pontuação que cada jogador recebe a partir destas 92 estatísticas varia de 0 a 10, sendo que o 10 perfeito (impossível de existir) seria o jogador que tivesse as maiores médias em critérios positivos e as menores em critérios negativos (falta, cartão, impedimento, etc).

Este resultado representa 40% da pontuação final no Prêmio ESPN Bola de Prata Sportingbet desde 2017. Os outros 60% continuam sendo as tradicionais notas atribuídas por jornalistas in loco. E por que o lado subjetivo recebe a maior parte? Justamente porque o futebol é um esporte com muitas ações imponderáveis, participações indiretas que podem ser fundamentais ao time – um jogador que sem a bola é genial; aquele volante que sem você perceber que está em campo é o melhor da partida; o centroavante caneludo que perde ‘zilhões’ de chances claras antes de fazer o gol; ou aquele mesmo caneludo que sempre salva o time na hora certa.

Para concluir: a meta do Algoritmo DataESPN é auxiliar um estudo de jogadores individualmente. Não é a verdade absoluta. Muitas vezes a pontuação de determinado jogador é menor do que outro, mas porque as características dele são mais objetivas – pode ter poucas ações com a bola, mas é aquele atleta que define, que em poucos toques faz mais do que a média. Têm torcedores que preferem artilheiros que não precisam de muito para garantir a vitória de seus times. Outros preferem jogadores ultra-habilidosos. Este é o lado humano do futebol, que não pode e nunca será esquecido. Afinal, se fossem todos robôs, cumprindo funções específicas com 100% do planejado, todos os jogos terminariam empatados. E que graça isso teria?