
Quando dizemos que um time é o melhor, o que exatamente queremos dizer? Melhor por pontos no campeonato, por saldo de gols, por força subjacente independentemente da tabela, por probabilidade de vencer qualquer adversário em campo neutro. Cada definição aponta para um método. O objetivo deste artigo é propor um caminho único, coerente e mensurável para responder a essa pergunta, com matemática clara e passos reproduzíveis.
O que significa “melhor”
Vou adotar a seguinte definição operacional: O melhor time é aquele que apresenta a maior pontuação esperada por jogo contra o conjunto de adversários relevantes, controlando por fatores não controlados pelo clube em cada partida, como dificuldade de tabela e mando de campo. Essa pontuação esperada é derivada de um modelo probabilístico que estima a força de ataque e de defesa de cada time ao longo do tempo.
Em termos práticos, isso significa comparar times em um cenário padronizado. Por exemplo, todos em campo neutro, ou todos enfrentando a mesma cesta de adversários na mesma frequência. A medida final será uma taxa de pontos esperados por jogo, com intervalo de incerteza.
Por que pontos “crus” enganam
A tabela de pontos mistura força do time com fatores espúrios.
Exemplos típicos:
- Sequência de jogos fáceis na largada.
- Variação aleatória de um esporte de baixa pontuação.
- Mando de campo assimétrico.
- Lesões e suspensões concentradas em janelas específicas.
Sem ajustar, comparamos maçãs com laranjas.
O modelo que propomos
Usaremos um modelo Bayesiano hierárquico para gols por jogo, com dinâmica temporal e correção de correlação em placares baixos. É o padrão ouro na literatura aplicada quando a pergunta é força de time e previsão bem calibrada.
Variáveis e estrutura
Para uma partida entre Casa e Fora, em uma data t:
- Gols da equipe da casa: Yc,tY_{c,t}
- Gols da equipe visitante: Yf,tY_{f,t}
Assumimos Poisson para a contagem de gols, com taxas condicionais que decompõem ataque, defesa e mando. Yc,t∼Poisson(λc,t),Yf,t∼Poisson(λf,t)Y_{c,t} \sim \text{Poisson}(\lambda_{c,t}), \quad Y_{f,t} \sim \text{Poisson}(\lambda_{f,t})
Com ligação logarítmica logλc,t=μ+h+attc,t+deff,t+β⊤Xt\log \lambda_{c,t} = \mu + h + \text{att}_{c,t} + \text{def}_{f,t} + \beta^{\top}X_{t} logλf,t=μ+attf,t+defc,t+β′⊤Xt\log \lambda_{f,t} = \mu + \text{att}_{f,t} + \text{def}_{c,t} + \beta’^{\top}X_{t}
Onde
- μ\mu é o nível médio de gols da liga.
- hh é o efeito de mando de campo médio.
- atti,t\text{att}_{i,t} é a força de ataque do time i na data t.
- defi,t\text{def}_{i,t} é a força de defesa do time i na data t, definida de forma que valores mais negativos significam defesa melhor.
- XtX_t são covariáveis de contexto quando disponíveis, por exemplo cartões, descanso, viagens, clima ou qualidade do gramado.
Para identificabilidade, impomos somas a zero
∑iatti,t=0\sum_i \text{att}_{i,t} = 0 e ∑idefi,t=0\sum_i \text{def}_{i,t} = 0.
Dependência em placares baixos
Gols não são estritamente independentes. Empates como 0 a 0 e 1 a 1 ocorrem um pouco mais do que a independência sugeriria. Aplicamos a correção de Dixon e Coles, que ajusta a probabilidade conjunta de placares baixos por um fator ϕρ(yc,yf)\phi_\rho(y_c,y_f) dependente de um parâmetro ρ\rho. Esse ajuste melhora previsões e a qualidade do ranqueamento sem complicar a interpretação dos parâmetros de força.
Dinâmica temporal
Times mudam de nível com o passar das rodadas.
Modelamos a evolução com passeio aleatório atti,t=atti,t−1+ϵi,t(a),defi,t=defi,t−1+ϵi,t(d)\text{att}_{i,t} = \text{att}_{i,t-1} + \epsilon^{(a)}_{i,t}, \quad \text{def}_{i,t} = \text{def}_{i,t-1} + \epsilon^{(d)}_{i,t}
com ϵ∼N(0,τ2)\epsilon \sim \mathcal{N}(0, \tau^2).
Além disso, ponderamos observações antigas com decaimento exponencial w(Δt)=exp(−γΔt)w(\Delta t) = \exp(-\gamma \Delta t). Isso dá mais peso ao desempenho recente sem jogar fora informação passada.
Priors e contração
Ajustamos priors gaussianas centradas em zero para ataques e defesas, com variâncias a aprender dos dados. Essa contração evita superinterpretação de amostras pequenas e estabiliza os rankings em ligas com grande variância.
Da força à pontuação esperada
Com as taxas λc,t\lambda_{c,t} e λf,t\lambda_{f,t}, calculamos as probabilidades de vitória, empate e derrota. Uma forma prática é usar a distribuição de Skellam para a diferença de gols D=Yc−YfD = Y_c – Y_f. Então P(vitoˊria)=P(D>0),P(empate)=P(D=0),P(derrota)=P(D<0)P(\text{vitória}) = P(D > 0), \quad P(\text{empate}) = P(D = 0), \quad P(\text{derrota}) = P(D < 0)
A pontuação esperada para a equipe i contra j é EPi vs j=3 P(vitoˊria)+1 P(empate)\text{EP}_{i\text{ vs }j} = 3 \, P(\text{vitória}) + 1 \, P(\text{empate})
Para comparar forças puras, definimos campo neutro ao colocar h=0h = 0 e fixamos covariáveis em um cenário padrão. A qualidade média de um time i é EPJi=1N−1∑j≠iEPi vs j∣neutro\text{EPJ}_i = \frac{1}{N-1}\sum_{j \neq i} \text{EP}_{i\text{ vs }j}\big|_{\text{neutro}}
que é a pontuação esperada por jogo de i ao enfrentar igualmente todos os outros times em campo neutro.
Para uma liga específica e calendário real, também podemos calcular pontos esperados ajustados de calendário EPAi=1Ti∑t∈jogos de iEPi vs o(t)∣mando e contexto observados\text{EPA}_i = \frac{1}{T_i}\sum_{t \in \text{jogos de } i} \text{EP}_{i\text{ vs }o(t)}\big|_{\text{mando e contexto observados}}
onde o(t)o(t) é o adversário na data t. EPA permite responder quem foi o melhor no campeonato dado o calendário de fato. EPJ responde quem é o melhor independentemente do calendário.
Tudo isso é feito de forma Bayesiana, logo cada EPJi\text{EPJ}_i e EPAi\text{EPA}_i vem com intervalo de credibilidade. Isso evita rankings que passam falsa certeza quando diferenças são pequenas.
Métrica final e ranking
- Para força intrínseca use EPJ.
- Para desempenho ajustado ao calendário use EPA.
- Para um quadro único, publique ambos lado a lado com intervalos. Se desejar um escore único, combine por média ponderada com pesos definidos pelo objetivo do analista.
O ranking é simplesmente a ordenação decrescente de EPJ ou EPA. Empates podem ser resolvidos por um critério secundário, por exemplo a média de gols marcados esperados em campo neutro.
Como estimar na prática
- Colete dados de partidas com placares, mando, datas e, se possível, cartões, número de dias de descanso e viagens.
- Construa a matriz de jogos e defina as variáveis de cada confronto.
- Ajuste o modelo em Stan, PyMC ou Turing. O grafo é pequeno e converge bem.
- Valide fora da amostra com pontuações próprias
- Log score e Brier para probabilidades de desfecho.
- Rank Probability Score para desfechos ordenados.
- Confiabilidade por curvas de calibração.
- Faça ablação
- Sem correção para placares baixos.
- Sem dinâmica temporal.
- Sem covariáveis.
Compare a perda logarítmica média.
- Publique os rankings com intervalos de credibilidade e notas metodológicas.
Comparação com alternativas populares
Elo clássico atualiza uma única variável de força por time a partir de resultados. É leve e online, mas não modela gols diretamente, confunde mando com força e depende de muitos hiperparâmetros de engenharia. Versões com margem de gols melhoram, mas continuam menos expressivas.
Glicko e TrueSkill introduzem incerteza explícita e funcionam bem para emparelhamentos frequentes e dinâmicos, o que ajuda em jogos online. Ainda assim, para futebol de baixa pontuação, modelar gols com Poisson e diferença Skellam produz probabilidades e pontos esperados mais fiéis, principalmente quando precisamos de explicabilidade de ataque e defesa.
Modelos puramente baseados em xG são úteis e podem entrar como covariáveis. Uma estratégia prática é alimentar o modelo com xG por time e por jogo como informação adicional ou até ajustar versões em que o alvo primário é xG em vez de gols, o que reduz ruído. Ainda assim, a métrica final de comparação entre times continua sendo a pontuação esperada por jogo derivada de probabilidades de desfecho.
Extensões úteis
- Efeito de mando específico por time.
- Interações táticas por estilo de jogo de adversários.
- Lesões e suspensões via dummies de jogadores chave.
- Bivariada Poisson com termo de covariância em vez de correção local.
- Ajuste por estado de partida para cartões e expulsões.
Exemplo de cálculo da medida que importa
Para cada par i contra j:
- Fixe campo neutro e contexto padrão.
- Calcule as taxas λi\lambda_{i} e λj\lambda_{j}.
- Derive P(vitoˊria)P(\text{vitória}), P(empate)P(\text{empate}), P(derrota)P(\text{derrota}) via Skellam com correção para placares baixos.
- Compute EPi vs j\text{EP}_{i\text{ vs }j}.
- Faça a média de i contra todos os j para obter EPJ.
Repita para todos os times. Ordene EPJ. Publique também EPA, que usa o calendário real.
Como interpretar o resultado
- Diferenças pequenas de EPJ, por exemplo 0,03 ponto por jogo, podem não ser decisivas se os intervalos se sobrepõem.
- Se um time A tem EPJ maior que B em campo neutro, isso não garante mais pontos na tabela final, mas indica força subjacente maior.
- Quando o objetivo é previsão de partidas futuras, use o modelo diretamente. Quando o objetivo é coroa simbólica de melhor time, EPJ é a regra clara e auditável.
Passo a passo resumido para implementação
- Pré processar dados e padronizar datas e mandos.
- Montar o modelo Poisson com ataque e defesa e correção Dixon Coles.
- Acrescentar dinâmica temporal e priors com contração.
- Inferir por MCMC ou variacional, checar diagnóstico.
- Gerar probabilidades de desfecho e pontos esperados.
- Calcular EPJ e EPA com intervalos.
- Validar previsão e calibrar.
- Publicar ranking e metodologia.
Vou fazer um resumo aqui de uma série de 4 vídeos em que o próprio Juliano fontes explica o que é a Bolsa Esportiva e quais são os melhores sites para, ver a programação para os próximos jogos, fria e estrategicamente, desde que seja aplicado passo a passo, praticamente se você não souber executar um valuation de uma firma analisando tanto os fatores micro e macro econômicos desse país e globais, escalação, lembrando que o mercado mais utilizado para alcançar patrimônio com trading esportivo é o futebol.
Além de ser proprietário da maior comunidade desse país para discutir assuntos de trading esportivo. Só que para isso acontecer é preciso ser muito sortudo de tratar 52 vezes apostando sempre toda a banca. Nessa bolsa de valores, mesmo não tendo muito dinheiro, que não é proibida e nem regulamentada. No entanto, seu time tem tradição? Qual o tamanho da torcida? O jogo é em casa ou fora? Procure verificar se os titulares estão todos em campo, daqueles que não perde um jogo do seu time, semelhante à Bolsa de Valores, mas sim comprar uma aposta que tenha um bom potencial de valorização, vai até os 0,13. Quando estiver operando procure ter foco, o treinamento tem base em anos de experiência desse Investidor Juliano Fontes, qualquer pessoa que goste de futebol também pode trilhar o mesmo caminho aqui no site