Utiliser l'apprentissage automatique pour répondre à des questions spécifiques au baseball

Compte tenu de la nature du jeu dans le baseball, une grande partie des blessures se produisent dans des incidents sans contact, ce qui signifie que la nécessité de mesurer et de contrôler la charge d'exercice contribuera à réduire ces types de blessures.

Dans cette optique, l'équipe analytique de Catapult a mis en place un apprentissage automatique qui tire parti des milliers de points de données obtenus avec son appareil OptimEye S5. En utilisant ces données brutes et des vidéos de matchs et d'entraînements professionnels, Catapult a pu développer des algorithmes spécifiques au sport qui quantifient le volume et l'intensité d'activités telles que le lancer et le balancement de la batte.

Les premiers tests ont révélé un taux de précision supérieur à 90 %, la fonctionnalité d'apprentissage automatique lui permettant de s'améliorer au fur et à mesure que les données lui sont transmises.

Réduire la liste des personnes handicapées en MLB

Des études publiées dans The American Journal of Orthopedics ont montré que le nombre d'affectations sur la liste des invalides et le nombre total de jours d'invalidité ont augmenté d'année en année. Parmi les joueurs blessés sur la liste d'invalidité, les lanceurs sont plus souvent blessés et passent plus de temps sur la liste d'invalidité que tous les autres postes.

L'équipe d'analystes de Catapult a entrepris de quantifier les mouvements qui entraînent le plus souvent ces blessures de surmenage, en partant du principe que la possibilité d'utiliser des données objectives sur le volume et l'intensité de ces mouvements donnera aux praticiens le pouvoir de contrôler les charges d'entraînement.

La fabrication d'un algorithme de baseball

Afin de quantifier des événements tels que les lancers et les coups de batte, un algorithme d'apprentissage automatique supervisé a été formé pour faire correspondre les lancers et les coups de batte recueillis pendant l'entraînement aux relevés de l'appareil OptimEye S5.

Plus précisément, Catapult a construit un algorithme Random Forest basé sur des données collectées lors de séances d'entraînement de diverses équipes de baseball, tant professionnelles que collégiales. Les données d'entraînement contiennent des relevés d'accéléromètre et de gyroscope pour plus de 6 000 événements de lancers, de coups de batte, ou les deux, pour des douzaines de joueurs et diverses positions.

Un seuil sur la charge du joueur a été introduit afin d'isoler les événements explosifs d'autres événements tels que la marche. Cela permet de s'assurer que l'algorithme ne retient que les lancers et les mouvements de batte similaires à ceux d'un jeu.

Autour de chacun de ces événements, Catapult a étudié les caractéristiques obtenues à partir de l'accéléromètre tridimensionnel et du gyroscope tridimensionnel dans une fenêtre de deux secondes à partir de l'événement : une seconde avant et une seconde après. Les exemples de caractéristiques comprennent la valeur maximale, la moyenne et l'écart type pour la lecture des accéléromètres et des gyroscopes.

Chacune de ces caractéristiques a été saisie pour l'événement en question ainsi que pour sa classification en tant que lancer, coup de batte ou aucun des deux, afin de constituer un ensemble d'entraînement pour l'algorithme.

Résultats et discussion

Après avoir été exposé à un grand nombre d'exemples couvrant de nombreux lancers et mouvements de batte, l'algorithme a pu atteindre une précision de plus de 90 % dans la détection des lancers et des mouvements de batte au cours d'une session d'entraînement. Les lancers détectés avec une excellente précision sont les suivants :

  • Salle d'attente
  • Lancer du monticule au receveur
  • Lancers de qualité pendant l'échauffement
  • Lancers à longue distance lors de l'alignement
  • Balançoires dans la cage ou pendant l'entraînement à la batte

L'estimation prudente reflète le fait que l'algorithme n'est paramétré que pour compter les lancers et les swings qui sont suffisamment durs pour ressembler à un jeu (c'est-à-dire les lancers et les swings de batte de "qualité"). La plupart des erreurs sont dues à des lancers trop mous au début de la routine pour être comptabilisés.

Après avoir classifié une séance d'entraînement en swings, lancers ou aucun des deux, l'algorithme calcule la charge totale associée à chaque swing et à chaque lancer de batte. Diverses quantités telles que la player load moyenne player load ou le temps moyen entre ces activités, ainsi que le banding pour chaque lancer ou battement, peuvent être obtenues par le biais de l'interface.

Les mesures de Catapult pour les lanceurs et les batteurs permettent aux praticiens du baseball de contrôler le volume et l'intensité des mouvements clés qui conduisent à des blessures de surutilisation et coûtent aux équipes professionnelles et universitaires des millions de dollars chaque année. Ces mesures peuvent dicter l'avenir de la périodisation de l'entraînement des lanceurs et des batteurs pour les entraîneurs qui souhaitent une meilleure transparence de l'effet de l'entraînement dans un environnement réel.

Vous souhaitez savoir comment Catapult peut répondre à vos questions spécifiques sur le sport ? Pour en savoir plus sur nos analyses de performance, cliquez ici.

Prêt à prendre une longueur d'avance sur la concurrence ?