機械学習を使って野球特有の質問に答える

野球のプレーの性質上、ケガの大部分は非接触で起こる。つまり、運動負荷を測定し、コントロールする必要性が、この種のケガを減らすのに役立つ。

これを念頭に置いて、Catapultの分析チームは、OptimEye S5デバイスで得られた何千ものデータポイントを活用する機械学習を実装した。その生データとプロの試合やトレーニングのビデオを使用して、Catapultは、投球やバットスイングなどの活動の量と強度を定量化するスポーツに特化したアルゴリズムを開発することができた。

初期のテストでは90%以上の精度が実証されており、機械学習機能により、データを入力すればするほど精度が向上する。

MLBにおける故障者リストの削減

The American Journal of Orthopedics誌に掲載された研究によると、故障者リスト(DL)の登録数およびDL総日数は年々増加している。DL入りした選手のうち、投手の負傷が多く、他のどのポジションと比べてもDL入り期間が長い。

カタパルトの分析チームは、このような使い過ぎによる傷害を最もよく引き起こす動作を定量化することに着手した。これらの動作の量と強度に関する客観的データを使用できるようになれば、実践者はトレーニング負荷をコントロールする力を得ることができるというのがその理論だ。

野球のアルゴリズムができるまで

投球やバットスイングなどのイベントを定量化するために、教師ありの機械学習アルゴリズムが、トレーニング中に収集された投球やバットスイングをOptimEye S5デバイスからの測定値と照合するように訓練された。

具体的には、Catapultは、プロと大学の様々な野球チームのトレーニングセッションから収集したデータに基づいて、ランダムフォレストアルゴリズムを構築した。トレーニングデータには、数十人の選手と様々なポジションについて、投球、バットスイング、またはそのどちらでもない6,000以上のイベントの加速度計とジャイロスコープの測定値が含まれています。

爆発的なイベントを歩行などの他のイベントから分離するために、選手の負荷に閾値を導入した。これにより、アルゴリズムがゲーム的なスローイングとバットスイングのみを選択するようになる。

Catapultは、これらのイベントのそれぞれについて、イベントから2秒間のウィンドウ内(イベントの1秒前と1秒後)で3次元加速度計と3次元ジャイロスコープから得られた特徴を調査した。特徴量の例としては、加速度計とジャイロスコープの読み取り値の最大値、平均値、標準偏差などがある。

これらの各特徴は、アルゴリズム用のトレーニングセットを構築するために、興味のあるイベントと、その投げ、バットスイング、またはそのどちらでもない分類に対して入力された。

結果と考察

多くの投球とバットスイングをカバーするために多くの例にさらされた後、アルゴリズムは、トレーニングセッション中に投球とバットスイングを検出する際に90%以上の精度を達成することができました。優れた精度で検出されたスローは以下の通り:

  • ブルペン
  • マウンドからキャッチャーへのピッチング
  • ウォームアップ中の質の高いスロー
  • フィールディング時の遠投
  • ケージ内やバッティング練習中のスイング

この控えめな推定値は、アルゴリズムが、ゲーム的に十分な硬さのスローとスイング(すなわち「質の高い」スローとバットスイング)のみをカウントするように設定されていることを反映している。エラーの大半は、ルーチンの最初のほうで、カウントするには柔らかすぎるスローによるものである。

トレーニングセッションをスイング、スロー、またはそのどちらでもないものに分類した後、アルゴリズムは各バットスイングとスローに関連する総負荷を計算します。各スローやバットスイングのバンディングだけでなく、player load 平均player load これらのアクティビティ間の平均時間など、さまざまな量をインターフェイスを介して取得することができます。

投球とバットスイングに関するCatapultの測定基準により、野球の実践者は、使い過ぎによる怪我を引き起こし、プロや大学のチームに毎年何百万ドルもの損害を与えている主要な動きの量と強度をコントロールすることができます。これらのメトリクスは、実世界でのトレーニング効果に対する透明性を高めたいコーチのために、投手と打者のトレーニング期間設定の未来を決定する能力を持っています。

Catapultがあなたのスポーツ特有の質問にどのように答えられるか、ご興味はありませんか?パフォーマンス分析についての詳細はこちらをご覧ください。

競争力を高める準備はできていますか?