Utilizar a aprendizagem automática para responder a perguntas específicas do basebol
Dada a natureza do jogo no basebol, uma grande parte das lesões ocorre em incidentes sem contacto, o que significa que a necessidade de medir e controlar a carga de exercício ajudará a reduzir este tipo de lesões.
Com isto em mente, a equipa de análise da Catapult implementou a aprendizagem automática que tira partido dos milhares de pontos de dados obtidos com o seu dispositivo OptimEye S5. Utilizando esses dados em bruto e vídeos de jogos e treinos profissionais, a Catapult conseguiu desenvolver algoritmos específicos para cada desporto que quantificam o volume e a intensidade de actividades como o lançamento e o balanço do taco.
Os primeiros testes demonstraram uma taxa de precisão superior a 90%, com a funcionalidade de aprendizagem automática a permitir-lhe melhorar com o aumento dos dados que lhe são fornecidos.
Reduzir a Lista de Desactivados na MLB
Estudos efectuados no The American Journal of Orthopedics demonstraram que o número de transferências para a lista de incapacitados (DL) e o número total de dias de DL têm aumentado de ano para ano. Entre os jogadores lesionados na DL, os lançadores são os que se lesionam mais frequentemente e passam mais tempo na DL, em comparação com todas as outras posições.
A equipa de análise da Catapult propôs-se quantificar os movimentos que mais frequentemente conduzem a estas lesões por uso excessivo, com a teoria de que a possibilidade de utilizar dados objectivos sobre o volume e a intensidade destes movimentos dará aos profissionais o poder de controlar as cargas de treino.
A criação de um algoritmo de basebol
A fim de quantificar eventos como lançamentos e pancadas, foi treinado um algoritmo de aprendizagem automática supervisionado para fazer corresponder os lançamentos e as pancadas recolhidos durante o treino às leituras do dispositivo OptimEye S5.
Especificamente, a Catapult criou um algoritmo Random Forest baseado em dados recolhidos em sessões de treino de várias equipas de basebol, tanto profissionais como universitárias. Os dados de treino contêm leituras de acelerómetro e giroscópio para mais de 6.000 eventos de lançamentos, balanços de taco, ou ambos, para dezenas de jogadores e várias posições.
Foi introduzido um limiar na carga do jogador para isolar os eventos explosivos de outros eventos, como a marcha. Isto assegurará que o algoritmo seleciona apenas os lançamentos e as pancadas semelhantes aos do jogo.
Em torno de cada um destes eventos, o Catapult estudou caraterísticas obtidas a partir do acelerómetro tridimensional e do giroscópio tridimensional dentro de uma janela de dois segundos a partir do evento: um segundo antes e um segundo depois. Exemplos de caraterísticas incluem o valor máximo, a média e o desvio padrão da leitura dos acelerómetros e dos giroscópios.
Cada uma destas caraterísticas foi introduzida para o evento de interesse, bem como para a sua classificação como um lançamento, um golpe de taco, ou nenhum dos dois, para criar um conjunto de treino para o algoritmo.
Resultados e discussão
Depois de ter sido exposto a um grande número de exemplos para cobrir muitos lançamentos e balanços de taco, o algoritmo conseguiu atingir uma precisão superior a 90% na deteção de lançamentos e balanços de taco durante uma sessão de treino. Os lançamentos detectados com excelente precisão incluem:
- Bancada
- Arremesso do monte para o apanhador
- Lançamentos de qualidade durante o aquecimento
- Lançamentos de longa distância durante o lançamento em campo
- Baloiços na gaiola ou durante os treinos de batedura
A estimativa conservadora reflecte o facto de o algoritmo só estar definido para contar lançamentos e balanços que são suficientemente duros para serem semelhantes aos do jogo (ou seja, lançamentos e balanços de "qualidade"). A maior parte dos erros resulta de lançamentos suaves no início da rotina que são demasiado suaves para serem contados.
Depois de classificar uma sessão de treino em balanços, lançamentos ou nenhum dos dois, o algoritmo calcula a carga total associada a cada balanço do taco e lançamento. Várias quantidades, como a player load média player load ou o tempo médio entre estas actividades, bem como a banda de cada lançamento ou batida, podem ser obtidas através da interface.
As métricas da Catapult para lançamentos e batimentos permitem aos praticantes de basebol controlar o volume e a intensidade dos principais movimentos que conduzem a lesões por uso excessivo e que custam às equipas profissionais e universitárias milhões de dólares todos os anos. Estas métricas têm a capacidade de ditar o futuro da periodização do treino de lançadores e batedores para os treinadores que pretendem uma melhor transparência do efeito do treino num contexto real.
Está interessado em saber como a Catapult pode responder às suas perguntas específicas sobre desporto? Saiba mais sobre a nossa análise de desempenho aqui.