Utilizar el aprendizaje automático para responder a preguntas específicas del béisbol

Dada la naturaleza del juego en el béisbol, una gran parte de las lesiones se producen en incidentes sin contacto, lo que significa que la necesidad de medir y controlar la carga de ejercicio ayudará a reducir este tipo de lesiones.

Con esto en mente, el equipo de análisis de Catapult ha implementado un aprendizaje automático que aprovecha los miles de puntos de datos obtenidos con su dispositivo OptimEye S5. A partir de esos datos brutos y de vídeos de partidos y entrenamientos profesionales, Catapult ha podido desarrollar algoritmos específicos para cada deporte que cuantifican el volumen y la intensidad de actividades como los lanzamientos y el balanceo del bate.

Las primeras pruebas han demostrado un índice de precisión superior al 90%, con funciones de aprendizaje automático que le permiten mejorar a medida que se introducen más datos.

Reducción de la lista de incapacitados en la MLB

Estudios publicados en The American Journal of Orthopedics han demostrado que el número de lesiones en la lista de incapacitados y el número total de días en dicha lista ha aumentado año tras año. Entre los jugadores que se lesionan en la lista, los lanzadores son los que se lesionan con más frecuencia y los que pasan más tiempo en ella, en comparación con todas las demás posiciones.

El equipo de análisis de Catapult se propuso cuantificar los movimientos que con más frecuencia provocan estas lesiones por sobreuso, con la teoría de que poder utilizar datos objetivos sobre el volumen y la intensidad de estos movimientos dará a los profesionales el poder de controlar las cargas de entrenamiento.

La creación de un algoritmo de béisbol

Para cuantificar eventos como los lanzamientos y los swings de bateo, se entrenó un algoritmo de aprendizaje automático supervisado para comparar los lanzamientos y swings de bateo recogidos durante el entrenamiento con las lecturas del dispositivo OptimEye S5.

En concreto, Catapult creó un algoritmo Random Forest basado en datos recogidos en sesiones de entrenamiento de varios equipos de béisbol, tanto profesionales como universitarios. Los datos de entrenamiento contienen lecturas de acelerómetros y giroscopios de más de 6.000 eventos de lanzamientos, balanceos de bate, o ninguno de los dos, para docenas de jugadores y varias posiciones.

Se introdujo un umbral en la carga del jugador para aislar los eventos explosivos de otros eventos como caminar. Esto garantizará que el algoritmo solo elija lanzamientos y balanceos del bate similares a los del juego.

En torno a cada uno de estos eventos, Catapult estudió características obtenidas del acelerómetro tridimensional y del giroscopio tridimensional dentro de una ventana de dos segundos desde el evento: un segundo antes y un segundo después. Entre las características se incluyen el valor máximo, la media y la desviación estándar de la lectura de los acelerómetros y los giroscopios.

Cada una de estas características se introdujo para el evento de interés, así como su clasificación como un lanzamiento, un golpe de bate, o ninguno de los dos, para construir un conjunto de entrenamiento para el algoritmo.

Resultados y debate

Tras ser expuesto a un gran número de ejemplos para cubrir muchos lanzamientos y balanceos del bate, el algoritmo fue capaz de alcanzar una precisión superior al 90% en la detección de lanzamientos y balanceos del bate durante una sesión de entrenamiento. Entre los lanzamientos detectados con excelente precisión se incluyen:

  • Bullpen
  • Lanzamiento desde el montículo al receptor
  • Lanzamientos de calidad durante el calentamiento
  • Lanzamientos a larga distancia durante el trabajo de campo
  • Columpios en la jaula o durante la práctica de bateo

La estimación conservadora refleja el hecho de que el algoritmo sólo está configurado para contar los lanzamientos y los swings que son lo suficientemente fuertes como para parecerse a un juego (es decir, lanzamientos y swings de bate "de calidad"). La mayoría de los errores se deben a lanzamientos suaves al principio de la rutina que son demasiado suaves para ser contados.

Tras clasificar una sesión de entrenamiento en swings, lanzamientos o ninguno de los dos, el algoritmo calcula la carga total asociada a cada swing de bateo y lanzamiento. A través de la interfaz pueden obtenerse diversas cantidades, como la player load media player load o el tiempo medio entre estas actividades, así como el anillado de cada lanzamiento o swing de bateo.

Las métricas de Catapult para lanzamientos y swings de bateo permiten a los profesionales del béisbol controlar el volumen y la intensidad de los movimientos clave que provocan lesiones por uso excesivo y cuestan millones de dólares al año a los equipos profesionales y universitarios. Estas métricas tienen la capacidad de dictar el futuro de la periodización del entrenamiento de lanzadores y bateadores para los entrenadores que desean una mayor transparencia en el efecto del entrenamiento en un entorno real.

¿Le interesa saber cómo Catapult puede responder a sus preguntas específicas sobre el deporte? Obtenga más información sobre nuestros análisis de rendimiento aquí.

¿Preparado para ganar ventaja competitiva?