Utilizzo dell'apprendimento automatico per rispondere a domande specifiche sul baseball

Data la natura del gioco nel baseball, gran parte degli infortuni si verificano in incidenti senza contatto, il che significa che la necessità di misurare e controllare il carico di esercizio contribuirà a ridurre questo tipo di infortuni.

Per questo motivo, il team di analisi di Catapult ha implementato l 'apprendimento automatico che sfrutta le migliaia di dati ottenuti con il dispositivo OptimEye S5. Utilizzando questi dati grezzi e i video delle partite e degli allenamenti dei professionisti, Catapult è stata in grado di sviluppare algoritmi specifici per lo sport che quantificano il volume e l'intensità di attività come il lancio e l'oscillazione della mazza.

I primi test hanno dimostrato un tasso di accuratezza superiore al 90%, con una funzionalità di apprendimento automatico che consente di migliorare con l'aumentare dei dati immessi.

Riduzione della lista dei disabili nella MLB

Studi pubblicati sull'American Journal of Orthopedics hanno dimostrato che il numero di assegnazioni alla lista disabili (DL) e il numero totale di giorni di DL sono aumentati di anno in anno. Tra i giocatori infortunati in DL, i lanciatori si infortunano più frequentemente e trascorrono più tempo in DL rispetto a tutte le altre posizioni.

Il team di analisti di Catapult ha cercato di quantificare i movimenti che più comunemente portano a questi infortuni da sovraccarico, con la teoria che la possibilità di utilizzare dati oggettivi sul volume e sull'intensità di questi movimenti darà ai professionisti la possibilità di controllare i carichi di allenamento.

La creazione di un algoritmo per il baseball

Per quantificare eventi come lanci e battute, è stato addestrato un algoritmo di apprendimento automatico supervisionato per abbinare i lanci e le battute raccolti durante l'allenamento alle letture del dispositivo OptimEye S5.

In particolare, Catapult ha costruito un algoritmo Random Forest basato su dati raccolti da sessioni di allenamento di varie squadre di baseball, sia professionistiche che collegiali. I dati di allenamento contengono letture di accelerometri e giroscopi per oltre 6.000 eventi di lanci, battute o altro, per decine di giocatori e varie posizioni.

È stata introdotta una soglia sul carico del giocatore per isolare gli eventi esplosivi da altri eventi come la camminata. In questo modo si garantisce che l'algoritmo scelga solo i lanci e le oscillazioni della mazza simili a quelli del gioco.

Intorno a ciascuno di questi eventi, Catapult ha studiato le caratteristiche ottenute dall'accelerometro tridimensionale e dal giroscopio tridimensionale entro una finestra di due secondi dall'evento: un secondo prima e un secondo dopo. Esempi di caratteristiche sono il valore massimo, la media e la deviazione standard delle letture degli accelerometri e dei giroscopi.

Ciascuna di queste caratteristiche è stata inserita per l'evento di interesse e per la sua classificazione come lancio, battuta o nessuno dei due per costruire un set di allenamento per l'algoritmo.

Risultati e discussione

Dopo essere stato esposto a un gran numero di esempi per coprire molti lanci e oscillazioni della mazza, l'algoritmo è stato in grado di raggiungere un'accuratezza superiore al 90% nel rilevare lanci e oscillazioni della mazza durante una sessione di allenamento. I lanci rilevati con un'eccellente accuratezza includono:

  • Box di servizio
  • Lancio dal monte di lancio al ricevitore
  • Lanci di qualità durante il riscaldamento
  • Lanci a lunga distanza durante il fielding
  • Oscillazioni nella gabbia o durante gli allenamenti di battuta

La stima conservativa riflette il fatto che l'algoritmo è impostato per contare solo i lanci e le oscillazioni che sono abbastanza forti da essere simili a quelli di un gioco (cioè lanci e oscillazioni di "qualità"). La maggior parte degli errori è dovuta a lanci morbidi all'inizio della routine, troppo morbidi per essere conteggiati.

Dopo aver classificato una sessione di allenamento in oscillazioni, lanci o nessuno dei due, l'algoritmo calcola il carico totale associato a ciascuna oscillazione e lancio della mazza. Attraverso l'interfaccia si possono ottenere varie quantità, come il player load medio player load o il tempo medio tra queste attività, nonché la fascia per ogni lancio o battuta.

Le metriche di Catapult per i lanci e gli swing di mazza consentono ai professionisti del baseball di controllare il volume e l'intensità dei movimenti chiave che causano infortuni da uso eccessivo e costano milioni di dollari alle squadre professionistiche e collegiali ogni anno. Queste metriche sono in grado di dettare il futuro della periodizzazione dell'allenamento di lanciatori e battitori per gli allenatori che desiderano una maggiore trasparenza sugli effetti dell'allenamento in un contesto reale.

Siete interessati a scoprire come Catapult può rispondere alle vostre domande specifiche sullo sport? Scoprite di più sulle nostre analisi delle prestazioni qui.

Siete pronti ad acquisire un vantaggio competitivo?