Comparer les équipes nationales et prédire l'imprévisible

Julien Roger jeudi 29 octobre 2015

Toni Kroos et Mats Hummels baissent la tête après que l'Irlande a marqué un but

Il est tentant de penser que les résultats possibles --- en sport comme dans la vie de tous les jours --- ne peuvent s’envisager qu’en noir, blanc ou parfaitement gris. Soit le résultat est attendu et son alternative impossible, ou l’on ne peut rien dire et le futur se joue à pile ou face. Nous n’allons pas vous aider à résoudre tous vos problèmes décisionnels (pour l’instant !) mais nous voulons vous permettre d’avoir une approche plus nuancée lorsque vous essayerez de prédire le résultat d’un match de football.

Au cours des derniers mois, la France a perdu contre l’Albanie et l’Allemagne contre l’Irlande du Nord. Si l’on suivait la vindicte populaire, nous serions tentés de hausser les épaules, d’abandonner tout espoir de faire des prédictions justes, et de nous retirer de la vie statistique.

La réalité pourtant est que, bien que de tels évènements soient rares, la probabilité qu’ils aient lieu peut être estimée de manière précise. Une approche pour ce faire est de mettre au point un système de classement des équipes rationnel et de l’utiliser pour déterminer les chances que de tels évènements se produisent. Aujourd’hui nous allons introduire notre version d’un tel classement, en suivant le schéma des classements Elo que nous avons optimisé pour le football international.

Dans les semaines à venir, nous décrirons plus en détail le fonctionnnement de ce classement et l’utiliserons, entre autre, pour prédire les différences de buts et étudier l’importance des matchs amicaux. Nous fournirons aussi le classement mis à jour de manière régulière, les classements historiques depuis 1872 ainsi que les outils pour déterminer les probabilités de résultats de tous les matchs possibles entre équipes nationales. En attendant, voici les bases.

Les classements Elo, à quoi ça sert ?

Commençons par une petite introduction du système de classement que nous allons utiliser pour faire nos prédictions. Nous rentrerons dans les détails dans les articles suivants, en attendant vous pouvez allez voir notre article précédent sur l’indice FIFA pour le football féminin que nous avons utilisé pour prédire la Coupe du Monde avec un certain succès. Pour l’instant, nous allons nous intéresser à deux des ingrédients clés de tout classement Elo.

Premièrement, les indices tels que celui utilisé à l’origine par Elo pour établir son classement se veulent prédictifs : dans leur définition est incluse une formule mathématique qui, étant donnée la différence d’indices entre deux équipes ainsi qu’une correction possible pour l’équipe jouant à la maison, prédit les chances que l’une ou l’autre gagne ou qu’il y ait match nul. Par exemple, avant leur match, notre modèle aurait prédit que l’Allemagne avait 62% de chances de battre l’Irlande du Nord contre 14% de chance de perdre et 24% de finir avec un match nul. Quatorze n’est pas égal à zéro, et l’Allemagne l’a découvert à ses dépends.

Deuxièmement, ces indices sont autocorrecteurs : après chaque match, le résultat actuel est comparé avec ce que le modèle prédisait et les deux équipes voient leur indice évoluer. En pratique, les deux équipes s’échangent un certain nombre de points suivant le résultat, le tout restant un jeu à somme nulle. L’importance de cet échange est déterminé par l’écart entre la prédiction et résultat. Les indices de l’Allemagne et de l’Irlande du Nord ont par exemple beaucoup évolué dans des directions inverses du fait du résultat surprenant de leur match.

Müller découvre que quatorze n'est pas égal à zéro

Il s’agit de la théorie, que nous avons ensuite adapté à notre contexte. Nous avons répertorié plus de 35 000 évènements depuis le premier match officiel, Écosse-Angleterre le 30 novembre 1872, jusqu’au 1er octobre de cette année. Nous avons calculé le classement historique de toutes les équipes reconnues par la FIFA, en optimisant notre modèle en comparant les résultats et nos prédictions sur la période 1945-2009. Nous avons utilisé les 5 000 matchs qui ont eu lieu depuis pour valider la précision de notre modèle. Le nombre de points moyens d’une équipe a été établi (de manière arbitraire) à 1 500, la plupart des équipes restant entre 1 000 et 2 000 points au cours du temps.

Le classement et l’indignation

Ne retardons pas plus l’échéance, voici notre top 20 au 1er octobre 2015 :

Oui, le Brésil est premier de notre classement et, oui, l’Argentine et la Colombie sont 2ème et 3ème devant l’Allemagne. Inacceptable ? Peut-être --- Ou peut-être pas. Si vous avez un peu suivi les évènements depuis la dernière Coupe du Monde, à la fin de laquelle l’Allemagne était évidemment première de notre classement, vous savez que le Brésil a très bien joué contre les équipes hors de sa confédération. Ils ont récemment battu la France 3—1 et les États-Unis 4-1 à domicile, et ont aussi gagné à la maison 2-0 contre le Mexique et 1-0 contre le Honduras. Pendant ce temps, ils ont échangé des coups avec la Colombie et le Chili, leur abandonnant certains de leurs points durement gagnés. Ces points se sont ensuite diffusés dans toute l’Amérique du Sud, participant à la domination de cette confédération sur le classement mondial.

Au même moment, l’Allemagne perdait contre l’Irlande du Nord, la France contre l’Albanie et les Pays-Bas ne se qualifiaient même pas pour l’Euro 2016. Ils sont maintenant 26ème de notre classement, derrière la Roumanie, le Costa Rica et… l’Iran. Ça peut paraître un peu brutal, mais il faut comprendre quelques spécificités de ce classement.

Lié à leur caractère autocorrecteur, les indices Elo sont naturellement réactifs. Les performances d’aujourd’hui sont un bon indicateur des résultats de demain. Si une équipe sur ou sous-performe, ceci se répercute instantanément sur son classement et sur ses probabilités de victoire pour les matchs à venir. Même si certaines performances peuvent être des évènements isolés, en moyenne, un bon ou mauvais résultat doit être considéré comme un signe de l’évolution de la qualité d’une équipe, au moins sur le court terme.

Le court terme, le prochain match, c’est réellement ce à quoi s’intéresse tout classement Elo. Ils ne reflètent pas nécessairement les qualités historiques d’une équipe. Après la dernière Coupe du Monde, les Pays-Bas étaient considérés, à raison, comme l’une des meilleures équipes du monde. Leur compétitivité au cours des années est un signe d’avantages stratégiques, historiques et systémiques --- plus le crochet intérieur de Robben, moins le talent unique de Van Persie pour les contre son camp légendaires. Ces qualités ne peuvent pas disparaître après quelques contre-performances, et il est très probable qu’ils retrouvent leur niveau réel dans les années à venir. Pour l’instant cependant --- pour des raisons qui mériteraient d’être analysées plus en détail mais qui peuvent se résumer aux péripéties d’une équipe en reconstruction --- ils ne sont juste pas très bons.

On veut des preuves !

Comme nous voyons déjà les fourches et les torches se dessiner à l’horizon, nous allons essayer de vous donner quelques preuves de l’efficacité de notre classement. Nous allons devoir faire un petit tour de passe-passe : pour ce qui va venir nous allons considérer qu’un match nul compte comme la moitié d’une victoire. Prédire les matchs nuls est une histoire très intéressante, mais nous préférons reporter cette discussion à un autre article.

Ceci étant dit, voici un graphe qui compare les probabilités de victoires avec les résultats actuels pour l’ensemble des matchs de janvier 2010 à septembre 2015 :

Plus précisément : nous avons considéré les 5 200 matchs que nous avons pu répertorier entre le 1er janvier 2010 et le 9 septembre 2015 et les avons classés suivant la différence d’indice Elo entre les deux adversaires au moment du match. Nous avons ensuite rassemblé les matchs par groupe de 200 en suivant cet ordre, le but étant de les rassembler par différences d’indices similaires. La différence d’indices moyenne pour chaque groupe nous donne une probabilité moyenne de victoire pour ce groupe, calculée suivant notre modèle. Chacun des 26 points du graphe compare cette probabilité aux résultats effectifs pour un groupe de 200 matchs.

Le résultat est assez joli, surtout qu’il semble fonctionner pour toutes les différences d’indices possibles. Au milieu du graphe par exemple, on trouve un point représentant 200 matchs pour lesquels la différence d’indices moyenne est de seulement -4, ce qui correspond aux matchs les plus serrés à priori que nous ayons répertoriés sur cette période. Notre modèle prédit que la probabilité de victoire moyenne pour ces matchs était de 49,3%. Le poucentage de victoires réel : 50,75%. Autrement dit une erreur d’environ trois victoires sur 200 matchs, ce qui n’est pas trop mal. À l’autre extrême, le point le plus à droite correspond à 200 matchs pour lesquels la différence d’indices moyenne est de +396, c’est à dire parmi les matchs les plus déséquilibrés de ces cinq dernières années. Selon nos prédictions, l’équipe favorite aurait dû gagner 92,2% du temps. Le pourcentage de victoire a finalement été de 92,75%, ce qui correspond à environ une victoire de plus qu’estimé. On ne sait pas pour vous, mais nous, on est assez contents de ces résultats.

Une question de moyenne

Un bon modèle prédictif ne fonctionne pas en noir et blanc. Il doit être capable d’évaluer la probabilité de tous les évènements, même les plus improbables. Le fait que l’on “se trompe” à peu près quatorze fois sur cent pour des matchs aussi déséquilibrés à priori qu’Irlande du Nord-Allemagne ou Albanie-France est une qualité du système, cela signifie que le modèle fonctionne proprement. De la même manière, dire qu’un match a 50% de chances de basculer pour l’une ou l’autre équipe ne veut pas dire que l’on se défausse. Cela signifie réellement que ce type de matchs se répartit équitablement en moyenne, et qu’il serait idiot de choisir un favori dans ce cas. Parfois le gris reste gris et on ne peut rien faire de plus qu’apprécier le spectacle.