元フィギュアスケート選手とディープラーニングの華麗な出会い　「選手の役に立ちたい」社会人大学院生の挑戦（3/5 ページ）

公開 2019年04月12日 07時00分

更新 2019年04月10日 12時14分

著者

松本健太郎

[ITmedia]

印刷する連載新着通知を受け取る

　まず回転不足を判定するにあたって、データを「回転不足なし（0）・軽度回転不足（1）・重度回転不足（2）」の3種に分ける三値分類という問題設定に落とし込みました。廣澤さんいわく「課題意識を研究テーマとして実現可能なレベルに落とし込むのが難しかった」そうです。

　データセットは、2018年～19年のグランプリシリーズの放映映像を中心に、単独ジャンプ部分のみを切り出し、日本スケート連盟のサイトにある競技結果を参考に正解ラベルを付与しました。総データ数は599件で、これを訓練データ（80％）とテストデータ（20％）に分けて機械学習モデルを作成しています。

　データ1つ1つに正解ラベルを付ける作業は時間がかかりますが、「ジャンプの判定は専門性がすごく高い作業なので、他の人にやってもらうのは難しかった」といいます。結局、廣澤さん1人でコツコツ作成していきました。

　加えて回転不足を判定するのですから、データセットには「回転不足だったときのデータ」が必要になります。しかし、モデルの質を担保するためにはトップレベルの選手や審判のデータを使用する必要があります。「国際大会の中でも一番レベルの高いシニア部門のデータを使ったのですが、技術的に優れた選手が集まっているので回転不足のデータは少なかったです」（廣澤さん）

　モデル作成において、オープンに公開されている「Sports-1M データセット」で学習済みの3D CNNを特徴抽出器として使用しました。選手のジャンプ画像を読み込ませ、中間層で4096次元の特徴ベクトルを抽出、それをSVMで学習させました。