Les bases du Moneyball

Moneyball...si vous êtes cinéphile vous aurez certainement entendu parler du film avec Brad Pitt (vf.: le Stratège), tiré du roman du même nom écrit par M.Lewis), mais probablement pas dans le contexte du football. 

Le principe sous-jacent à ce concept est simple: trouver des joueurs sous-évalués, passant ainsi sous les radars des recruteurs des autres clubs, en s'appuyant sur un modèle de traitement des données. Evidemment, lorsqu'on est à la tête d'un club obscur en 7ème division anglaise avec un budget quasiment inexistant et une masse salariale famélique, on est très loin d'avoir les moyens de travailler avec une armée de recruteurs et d'analystes de données à ses côtés. Et pourtant, quelle que soit la capacité financière du club, un principe fondamental demeure: lorsqu'on a moins de moyens que les autres, il faut travailler mieux. Et dans ce cadre, travailler mieux signifie travailler plus, être plus pointilleux (c'est-à-dire passer davantage de temps) dans la recherche des joueurs qui apporteront une vraie plus-value à votre équipe. Et évidemment, tout ceci doit s'effectuer sans bourse délier...

Si vous avez été amené à entreprendre la lecture de cet article, c'est que vous avez forcément été en mesure de déterminer l'ADN de votre équipe, et donc que vous avez pu correctement cibler les profils compatibles avec l'identité de jeu voulue et dès lors susceptibles d'incorporer à votre effectif. Nous ne reviendrons pas là-dessus. Donc vous savez ce que vous voulez, probablement que vous avez été amenés à composer une shortlist en fonction de différents critères (attributs et coût financier principalement), c'est maintenant que l'approche Moneyball entre en scène. L'opération va viser à utiliser les statistiques afin d'affiner votre sélection de joueurs et concentrer votre attention sur ceux supposés apporter une réelle plus-value à votre équipe. Alors comment faire concrètement ?

Le travail préparatoire va consister à attribuer à chaque position sur le terrain une liste de Key Performance Indicators (KPIs), autrement dit des statistiques sur différents aspects du jeu en fonction du poste et/ou rôle que vous assignerez à tel ou tel joueur. Prenons un exemple. Pour le style de jeu que je souhaite assigner à mon équipe je sais que je dois rechercher un Attaquant Pivot, grand et puissant, qui saura aimanter les grands ballons qui lui seront adressés et bien entendu être efficace devant le but, principalement dans le domaine aérien. Je sais également, pour qu'il puisse correspondre à l'ADN de mon équipe, il faudra qu'il ait d'aussi bonnes notes que possible en Agressivité, Détente Verticale, Jeu de tête et Finition, entre autres, mais prioritairement celles-là.  Il est fort probable, avec une certaine variation en fonction du niveau et de l'endroit où vous jouez, que plusieurs joueurs (voire beaucoup) répondent à ces critères. Pour déterminer et ordonner mon choix, je vais rechercher les KPIs que j'ai choisi pour ce poste/rôle choisi afin d'étudier au plus près mon futur Attaquant Pivot, à savoir: le nombre de duels aériens remportés par match (Têtes/90), le taux de duels aériens remportés (Têtes%), le cumul par match de buts et passes décisives (Actions Déc./90), le nombre de Passes Clés et le nombre de hors-jeu rapportés par match (HJ/90).

A l'arrivée, en répétant le processus pour tous les joueurs ciblés à tous les postes, nous aurons des éléments de comparaison et de classement qui feront office de vraie aide à la décision. Il est bien entendu que cibler des attributs/caractéristiques/aptitudes bien précis et, au contraire, accepter que le joueur ciblé ait des faiblesses en théorie peu impactantes pour notre style de jeu réduira fortement, entre autres, l'attractivité et donc le coût de ce joueur. C'est là tout le but de la manœuvre: si vous faites la même chose et vous positionnez sur les mêmes joueurs qu'une équipe ayant plus de moyens que vous, alors il y a de grandes chances qu'en fin de compte vous perdiez. En tant qu'équipe à la traîne, il faut être inventif et innovant si vous voulez tirer votre épingle du jeu.

Et en pratique ?

Précédemment j'évoquais la production d'un référentiel qui compilerait tous les KPIs sélectionnés pour chaque poste/rôle recherché. J'ai commencé par répartir mes joueurs en 4 catégories selon les postes qu'ils occupent: défenseurs, milieux latéraux, milieux centraux et attaquants.

Certains joueurs qui expérimentent la méthode utilisent des "profils tactiques" en lieu et place des postes, au final cela revient plus ou moins au même à partir du moment où vous avez une image précise de ce que vous recherchez. 

Plusieurs choses sont à remarquer dans mes choix (car évidemment ce sont bien des choix).

  • les têtes font à la fois partie des KPIs offensifs et défensifs. Lorsqu'on pratique le hoofball on s'attend à disputer énormément de duels aériens dans les deux camps.
  • les postes de DC et DL sont regroupés car je considère mes latéraux comme les centraux 3 et 4, et donc ils partagent les mêmes KPIs. Je me fiche pas mal que mes latéraux passent la ligne médiane, et encore moins qu'ils participent au jeu offensif. Ils sont là avant tout pour protéger mon but, ne pas se faire passer par leur adversaire et gagner les duels.
  • les ML sont évidemment là pour défendre, mais également contribuer au jeu offensif principalement par leurs centres. Et pourtant j'ai préféré aux centres les passes clés. Ce qui m'intéresse c'est d'abord le danger apporté, peu importe le moyen.
  • les MC seront évalués à travers leur erreurs, même si l'exploitation de cette donnée dans le jeu n'est pas simple, car ils évoluent dans une zone ou toute perte de balle peut être dangereuse, et également le taux de passes réussies car j'attends d'eux très peu de prises de risque dans leurs passes. 
  • pour les ATT c'est très simple, ce qui m'importe est leur capacité à être décisifs. Ce qui inclut ne pas annihiler les (peu nombreuses) occasions de l'équipe en se mettant hors-jeu.

J'aurais aimé pouvoir exploiter davantage la donnée Récupérations, malheureusement elle n'est visible que lorsque l'analyse du match est disponible (onglet Analyse Joueurs > Possession). Très fastidieux car pour cela il faut analyser match par match, mais très intéressant. A défaut, pour les milieux, j'inclue le KPI Interceptions mais c'est davantage une stat de défenseur.

Notons enfin que le poste de gardien, si particulier, sera traité ultérieurement.

Application à l'équipe

Même si on l'a coachée pendant une soixantaine de matchs il est toujours bon d'en apprendre sur sa propre équipe. Cela permet d'avoir des confirmations (la qualité dans le jeu aérien et sur les tacles par exemple, mais aussi les errements défensifs constatés et traduits en chiffres) et également pointer du doigt certaines choses dont on a pas forcément conscience dans le feu de l'action, comme par exemple que H.Hall n'est pas forcément une mauvaise solution comme Latéral Droit alors qu'il a été progressivement mis de côté à mesure que la saison avançait. 

Mais surtout, étant donné qu'en début de partie on manque beaucoup de data, cela nous permettra d'avoir quelques références et points de comparaison au moment d'évaluer des recrues potentielles.

Une aide à la décision pour le mercato

Je considère le choix de recrutement d'un joueur comme l'aboutissement d'une chaîne de décisions démarrée par la constitution d'une pré-sélection que j'ai choisi de baser sur des attributs essentiels à l'ADN de mon équipe (image ci-dessus). La deuxième étape consistera à exploiter les données à disposition afin de réduire la liste et proposer une période d'essai pour laquelle il faudra encore agir avec méthode. C'est de la que viendra la fumée blanche, autrement dit l'honneur de travailler sous les ordres de Vinnie Jones...

En résumé:

Pré-sélection ---> exploitation des données théoriques ---> convocation pour période d'essai ---> exploitation des données de terrain ---> CONTRAT

Voici une possibilité, appliquée à mon propre effectif, de pré-sélectionner les joueurs dont les attributs s'avèrent compatibles avec l'ADN de mon équipe. Il s'agit d'importer le tableau de sélection dans une feuille de calcul (Paramètres > Impression d'écran > Imprimer comme une page web) afin de rendre la sélection lisible et exploitable en utilisant le formatage conditionnel. En fin de tableau j'effectue une moyenne pondérée des attributs en fonction de chaque poste/rôle (coeff. 3 pour les attributs essentiels, coeff. 1 pour les attributs importants), ce qui me donne une note sur 20 à la fin. La question n'est pas se savoir à partir de combien on garde et en dessous de combien on jette, mais plutôt de se donner une lecture claire.

Les données de la saison précédente concernant les joueurs ciblés (en rouge nos propres joueurs)
Les données de la saison précédente concernant les joueurs ciblés (en rouge nos propres joueurs)

Les limites de la méthode

Beaucoup de monde le dit et le répète avec force: football et statistiques ne font pas bon ménage. On peut leur donner en partie raison sur ce point. Pour moi la raison essentielle est que, contrairement à des sports comme le basket ou le baseball, les caractéristiques du jeu football rendent les choses difficiles:

  1. la rareté des points
  2. la délimitation et le repérage, dans l'espace et dans le temps, d'une action
  3. la complexité des situations qui rend délicate l'extraction d'éléments simples à des fins d'analyse
  4. le brouillage des statistiques lorsque des joueurs évoluent à plusieurs postes
  5. le manque de références statistiques solides et d'éléments de comparaison au départ
  6. les informations renvoyées par le jeu.

Je m'attarderai particulièrement sur ce dernier point, qui se différencie nettement des trois autres. On peut manifestement avancer que le jeu nous renvoie une large variété de statistiques à examiner, qu'elles soient liées à une équipe, un match ou bien un joueur en particulier. En outre l'analyse du match nous offre bien d'autres choses à exploiter: tirs, passes, mouvement des joueurs et bien d'autres choses encore sont disponibles en fonction du degré de précision que l'on souhaite atteindre. Les aficionados des statistiques peuvent se réjouir, tableaux, graphes et schémas ne manquent pas. Plus ou moins exploitables, on peut en débattre longtemps. A vrai dire, personnellement, deux manques que je qualifierais de majeurs me chagrinent:

  • l'absence des xG, qu'il faut reconstituer manuellement ce qui demande un travail colossal. C'est un indicateur majeur du nombre de buts qu'une équipe "aurait dû scorer" (au sens statistique), indicateur bien plus représentatif de la physionomie d'un match que des données "grand public" tels tirs cadrés ou possession. A l'heure où les xG ont acquis un statut d'indicateur reconnu, je considère que c'est un gros manque.
  • l'absence d'indicateurs permettant une évaluation pointue des milieux, particulièrement dans leur rôle défensif. Là encore nous sommes obligés de nous rabattre sur des données insatisfaisantes. Le Tacles par match est une mesure trop rare et ne discrimine pas assez, à mon goût, le travail d'un milieu à vocation défensive. Interception est clairement une stat de défenseur. Il reste une statistique beaucoup plus intéressante qui est le nombre de Récupérations du ballon, mais qu'il faut aller chercher dans l'analyse de chaque match pas toujours disponible. Même chose en ce qui concerne les passes dans le Tier 2 du terrain au vu de ce que j'attends de mes milieux: récupération du ballon puis passe propre à un équipier. Le % de passes réussies est un indicateur trop général.

Alors que faire ? Faut il pour autant tout mettre à la corbeille et laisser l'intuition et l'empirisme gouverner nos choix ? Malgré tous les écueils énoncés ci-dessus je suis persuadé que non. Du point de vue du joueur je trouve que cela favorise incontestablement l'immersion. Du point de vue du tacticien ce travail d'analyse constitue une aide à la compréhension et à la décision.

 

Immersion - Compréhension - Décision

 

sont autant de moteurs qui favorisent et encouragent l'investissement dans Football Manager. Ce sera la conclusion de cet article.