Moneyball: Exploiter le potentiel grâce à un scouting intelligent des données

footballytics

1. Feb. 20228 Min. Lesezeit

Lorsque l'on ne connaît pas bien quelque chose ou que l'on ne l'a pas testé intensivement, il est difficile d'en évaluer le plein potentiel. Dans ce blog, nous montrons comment nous utilisons notre approche et différentes méthodes et fonctions mathématiques pour appliquer une exploration intelligente et complémentaire des données afin d'exploiter au maximum le potentiel.

Le datascouting est une identification des joueurs et non une sélection.

Le datascouting n'a pas pour objectif de trouver le meilleur joueur, mais de trouver beaucoup de bons joueurs. Les profils d'un très grand nombre de joueurs sont analysés afin d'éliminer ceux qui ne conviennent pas. Plus le profil de recherche est détaillé, meilleur est le filtre et meilleur est le résultat.

Les données ne sont pas utilisées pour trouver le meilleur joueur. Mais pour déterminer rapidement les 50 meilleurs joueurs parmi les 1'000 disponibles, parmi lesquels les 10 meilleurs ont de grandes chances de figurer (pré-scouting). Cela permet de gagner un temps précieux lors du #scouting, car les Scouts peuvent se concentrer sur un petit nombre de joueurs sans devoir en passer des centaines au crible. Déterminer les meilleurs parmi les candidats reste la tâche des scouts avec leur expertise et leur expérience.

Le scouting de données analyse tout le monde du football en un seul clic

Combien de temps vous faut-il pour estimer grossièrement si un joueur correspond ou non à votre profil de recherche ? Cinq ou dix minutes ? Avec dix minutes, il vous faut environ 16 heures pour 100 joueurs. Un algorithme peut le faire en une minute pour 100 000 joueurs. De plus, les données permettent de trouver des joueurs surprenants et moins chers, car la demande est moins importante en dehors de la recherche standard de masse. Le scouting de données garantit que l'on ne se focalise pas trop vite sur des joueurs isolés ou recommandés, mais que l'on cherche dans tout le spectre. Même là où l'on ne s'attend pas à trouver quelque chose.

D'un point de vue purement statistique, on peut dire, en raison de la quantité et de la variance, que l'on trouve vraiment un talent de la décennie dans chaque ligue.

Le scouting de données réduit la dépendance vis-à-vis des conseillers

Il y a encore beaucoup trop de clubs qui pratiquent un scouting en grande partie réactif. Les agents leur proposent plusieurs joueurs par jour et les recruteurs doivent fournir beaucoup d'efforts pour une évaluation rapide et, pour la plupart, un refus. Beaucoup d'efforts pour des joueurs qui ne les intéressent pas du tout.

Avec cette approche réactive, les clubs se concentrent beaucoup trop tôt sur un petit nombre de joueurs. Ils ne pêchent pour ainsi dire que dans l'étang des agents/conseillers et dans leur intérêt. Mais si l'on utilise les données pour identifier les joueurs adéquats, on peut inverser le jeu et pêcher dans les mers du monde. Et ensuite, si nécessaire, aller à la rencontre des conseillers concernés. Change the game.

Data Scouting - Processus de scouting des données

Le processus de scouting idéal commence par le scouting des données (pré-scouting).

Tous les profils des joueurs disponibles sont analysés. Le résultat est une liste de candidats de 30 à 100 joueurs. Ensuite, les candidats sont évalués par les recruteurs à l'aide d'un scouting vidéo et en direct.

english article: data driven scouting

Maturités dans l'utilisation des données dans le scouting

Sur la base des expériences et des discussions avec des clubs nationaux et internationaux, nous pouvons classer les clubs selon les niveaux de maturité suivants dans l'utilisation des données.

Utilisateur : les scouts utilisent des données dans des outils de fournisseurs professionnels. Les statistiques des joueurs et les métriques sont ainsi comparées de manière simple et standardisée. Scouting réactif selon les recommandations de conseillers/agents.

Individuel : pas de ressources analytiques propres. Les ressources de scouting existantes sont en outre chargées de tâches d'analyse. Les données sont exportées des outils et analysées dans des applications tierces telles qu'Excel, Tableau, Power-Bi en fonction des besoins spécifiques de l'association. Développent leurs propres KPI spécifiques au club. Mélange entre scouting réactif et préventif. Souvent, aucun processus de données cohérent n'est mis en œuvre dans le scouting.

Analyste : les clubs disposent de ressources d'analystes dédiées qui travaillent avec les scouts. Utilisent des KPI, des logiques, des algorithmes et des fonctions mathématiques avancés dans le scouting de données. L'exploration des données et les décisions basées sur les données sont établies par toutes les parties prenantes du scouting et, le cas échéant, de l'analyse des matches.

Équipes d'analystes : disposent d'équipes complètes d'analystes, de data scientists et de mathématiciens. Adoptent une approche scientifique et développent leurs propres méthodes et logiques d'analyse des données. La culture des données est établie dans toute l'association.

Rien n'empêche d'utiliser des outils standardisés. Ceux-ci sont très avantageux et très bons. Mais pour reconnaître et exploiter le potentiel de l'analytique, il faut aussi investir dans les personnes, les ressources propres et le savoir-faire.

Chaque association devrait envisager d'explorer elle-même ce potentiel. En ce moment, les associations recherchent presque quotidiennement des analystes de données, pour créer ou renforcer leur département d'analyse.

Les nouvelles technologies ont toujours le potentiel de transformer les systèmes, de déplacer les rapports de force et de modifier les exigences des postes de direction.

L'analyse des données nous dit que le joueur en question correspond au profil de recherche et qu'il a réalisé de bonnes performances. Mais les données ne sont qu'une vision spécifique. Comme un œil ou une perspective supplémentaire. Comme toute autre perspective, elle n'est pas la seule vérité. Mais il serait insensé de dédaigner cette perspective pour prendre des décisions importantes.

La vision des données est dans tous les cas une valeur ajoutée. Soit elle confirme notre propre perception, soit elle nous oblige à regarder de plus près.

Tous les clubs utilisent les données pour comparer les joueur et à faire du scouting. Mais rares sont les clubs qui exploitent exploitent vraiment tout le potentiel.

Pour que le scouting soit un succès durable et systématique, il faut que différentes personnes et différents groupes travaillent bien ensemble et que certaines choses positives soient réunies. En d'autres termes :

Dans les domaines de la connaissance, des compétences, de la communication, des processus et de la gestion, il existe un nombre incroyable de possibilités pour exploiter le potentiel des Data Analytics, ne serait-ce que de manière approximative.

Plus qu'un simple jonglage de chiffres

Le datascouting, c'est bien plus que de comparer des chiffres, de les traiter dans Excel, de les trier ou de les faire éclater dans un diagramme x/y.

Le DataAnalytics, c'est du football, de l'informatique et des mathématiques. Par expérience, ces dernières sont, à tort, fortement sous-estimées. Mais sans savoir-faire et sans fonctions mathématiques, il n'est pas possible d'analyser et de comparer intelligemment des montagnes de données.

Notre approche complémentaire du data scouting

Nous avons l'ambition de recruter le plus de bons joueurs possible

de trouver les meilleurs et de ne pas passer à côté des meilleurs.

Nous utilisons des fonctions mathématiques qui nous aident à comparer et à interpréter les données. Les exemples les plus connus sont la moyenne, la médiane et l'écart-type. D'autres, comme la moyenne harmonique, le sigmoïde, le Z-score et la cosine, sont un peu moins connues.

Nous analysons les données disponibles à l'aide de trois approches différentes. Nous nous assurons ainsi de pouvoir trouver des joueurs intéressants de plusieurs manières.

La NASA suit également cette approche dans le domaine spatial. Pour maximiser la sécurité en cas de panne, les équipements les plus importants doivent non seulement être installés en double, mais aussi être construits avec deux technologies différentes.

1) Value Adjustment - Ajuster les valeurs

Afin de comparer les joueurs de la manière la plus juste possible, nous ajustons les métriques quantitatives offensives et défensives avec différentes unités. Selon la métrique, par possession, par passe, par touche ou même par passe spécifique. Il s'agit de mettre en relation l'input et l'output de manière pertinente. Dans la sélection, cela génère également des joueurs d'équipes ayant moins de possession de balle et les fait briller.

Plus la corrélation entre la métrique quantitative et l'unité ajustée est forte, plus les conclusions de l'analyse des données seront solides et pertinentes.

Blog in english: Comparing players fairly

2) Datascouting avec Profils de position et métriques

Nous avons défini plus de 20 profils de poste détaillés qui permettent une analyse précise des joueurs et de leur rôle tactique. Par exemple, un milieu de terrain défensif a besoin d'autres métriques clés qu'un milieu offensif, tandis qu'un défenseur central très joueur avec une forte possession de balle a des exigences très différentes de celles d'un récupérateur classique.

Grâce à ce réglage fin et précis, nous identifions les joueurs les meilleurs et les plus appropriés - adaptés individuellement au style de jeu des clubs. Outre les positions et les rôles classiques, nous tenons également compte des interprétations modernes, comme le défenseur latéral en retrait ou la false 9. Rien que pour les milieux de terrain, nous avons défini sept profils de poste.

Voici un exemple de 4-2-3-1 de la Premier League

3) Algorithme de similitude

Les scores de similarité ont été utilisés pour la première fois dans le sport par le pionnier de la saboterie Bill James. Ses méthodes ont également été utilisées par Billy Beane au baseball chez les Oakland Athletics. Connue grâce au livre/film Moneyball (The Art of Winning an Unfair Game, by Michael Lewis).

Il s'agit d'une méthode mathématique permettant de déterminer la similitude entre deux vecteurs. En termes très simples, on compare chez les joueurs la similitude globale de la distance par rapport à la moyenne pour toutes les métriques pertinentes. Nous pouvons ainsi examiner la similitude globale des données de chaque joueur et obtenir un résultat de couverture de -1 (opposé) et 1 (identique).

Nous pouvons ainsi partir d'un joueur de référence et trouver des joueurs similaires.

Prenons l'exemple de Lionel Messi. Nous pouvons utiliser l'algorithme pour rechercher dans tous les championnats du monde des joueurs dont le profil/les caractéristiques sont les plus proches possibles.

Cela ne signifie pas que les joueurs trouvés sont aussi bons que Messi. Mais qu'ils ont les mêmes forces et faiblesses et qu'ils sont très similaires en termes de style et d'expression. Cette méthode nous permet également de trouver des joueurs intéressants, qui ne deviennent parfois encore plus intéressants qu'après un examen plus approfondi... .

Prenons comme exemple pratique le vainqueur de la Ligue des champions Kevin de Bruyne de Manchester City. Il présente des valeurs exceptionnelles dans différentes dimensions. Si nous lui appliquons l'algorithme, nous trouvons Iliass Bel Hassani du RKC Waalwik en Eredivisie, avec une similitude de 93,21%. D'ailleurs, son contrat expire le 31 mai 2023 ;-)

Comparaison directe des profils.

Bel Hassani a malheureusement déjà trente ans et le meilleur âge pour le scouting. Mais cela devient passionnant lorsque nous appliquons l'algorithme à des joueurs plus jeunes.

Ainsi, nous trouvons entre autres Matt O'Riley (22 ans) du Celtic Glasgow avec une ressemblance de 84,8%. Bien sûr, dans une ligue avec une force différente, mais un jeune joueur en développement avec un profil de force similaire à Kevin De Bruyne.

Bien sûr, nous trouvons également de jeunes joueurs de la Super League, de la Bundesliga, de la Bundesliga autrichienne et de toutes les autres ligues. Que ce soit De Bruyne, Messi, Kimmich, Barella, Grealish, Pedri, Haaland, Neymar, Osimhen, Kim Min-jae and Co. Avec des mathématiques intelligentes, vous pouvez identifier des joueurs talentueux et jeunes avec des profils similaires aux superstars. Les possibilités sont vastes. On pourrait également citer l'équipe clone U23 de Manchester City comme exemple. Également dédié à une ligue ou une région. Le data scouting n'est pas une science exacte. Il n'y a pas de voie dorée. Mais plus vous abordez le sujet et en apprenez plus, plus les possibilités et solutions complémentaires s'offrent à vous.

J'encourage tous les clubs et agences à investir non seulement dans les outils, mais aussi dans les personnes et le savoir-faire analytique. Sinon, ils restent un dans la foule. Commencez un voyage d'apprentissage et recueillez vos propres expériences. C'est le seul moyen de capter le potentiel d'utilisation des données et, si possible, de l'exploiter.

Voici notre datascouting service

Nous ne pouvons pas nous empêcher de terminer par une citation d'un mathématicien.

"Donnez-moi un point fixe et je bouleverserai la terre." Archimède

footballytics – nous savons comment faire parler les données Nous soutenons les clubs, les entraîneurs, les agences et les joueurs avec des services d'analyse et de conseil dans l'utilisation et l'interprétation des données. Pour prendre de meilleures décisions dans le dépistage, l'analyse du jeu et sur le terrain.