Wide Open Spaces: A statistical technique for measuring space creation in professional soccer

以下の部分は””を全て記入しないとページがうまく表示されません。記入しても問題がある場合は管理者に連絡をしてください。 Issue投稿からウェブサイトに投稿までは約1日かかります。この部分はページに表示されないので消しても消さなくてもOKです

thumbnail: "https://user-images.githubusercontent.com/48281753/61040887-74f09f00-a40c-11e9-99d7-946187d5833c.png" authors: "Javier Fernandez" labs: "F.C. Barcelona" conference: "MIT SLOAN SPORTS ANALYTICS CONFERENCE" sport: "Soccer" url: "https://www.researchgate.net/publication/324942294_Wide_Open_Spaces_A_statistical_technique_for_measuring_space_creation_in_professional_soccer" year: "2018"

要旨 Abstract

論文のアブストラクトを日本語で軽く 試合中、選手のオフ・ザ・ボールの時間は90分のうちの97%を占め、その時間の選手のプレーを評価することは非常に重要な課題である。この研究では、ニューラルネットワークを用いて、オフザボールの選手の、スペースを生み出す行動、また選手の、価値の高いスペースを占有する行動を定量的に評価するためのモデルを構築し、実際の試合に当てはめて評価してみる論文。

リサーチ課題

スペースの価値をどうやって評価するか？

リサーチ課題に対する結論

ピッチコントロールモデル、スペース占有モデル、スペース生成モデルの構築

手法

まずは一言で FCバルセロナの取得するトラッキングデータを用いて、様々な統計的解析表現（二変量正規分布、確率密度関数、等）を用いることで、ピッチコントロールモデルやスペース占有、スペース生成モデルを構築する。（ピッチコントロールモデル、スペース価値モデル、およびこれらを重ねたピッチ図）↓

手法の具体的な説明 -まずはピッチコントロールについて- サッカーピッチ空間において、選手の影響度はかなり異なる。ボールの位置であったり、相手選手との距離感であったり、選手の移動速度も影響因子になりうります。そこで、プレイヤーの位置、速度、ボールまでの相対距離を考慮して形状を考慮することができる、二変量正規分布を用いてプレイヤーの影響領域を定義する方法を使っています。ここから、選手の影響度 I を求める。ある時間tにおける、ある場所pでの選手の影響度Iは、平均と共分散行列の二変量正規分布で定義されて、以下の式になります↓

これを可視化するとこんな感じに↓

この式を使って、ピッチコントロールを定義すると以下の式になります。σはロジスティック関数

これをモデリングすることで、以下の図が得られる、これがピッチコントロールモデルです。

白い丸がボールで、黄色が相手。このシーンはサイドでの攻撃だが、ボールを追う相手チーム二人の背後のエリアは、赤く表示されていて、ボールをうまく制御することが難しいことがわかる。非常に感覚ともマッチしたモデルになっていることがわかります。

これのアニメーションがこちら↓ https://www.researchgate.net/deref/http%3A%2F%2Fwww.lukebornn.com%2Fsloan%2Fspace_occupation_1.mp4

-次にスペース価値- スペース価値モデルは、ボールがある位置からみて、どこが一番攻撃において効果的なエリアかを可視化したものです。スペース価値を予測するため、隠れ層を１つ有するフィードフォワードニューラルネットワークを使って、以下の式により定義される、マッピングのパラメータθを学習します。式はこれ↓

損失関数Lを最小にする最適パラメータθを見つけることを目的とし、損失関数Lに平均二乗誤差を、活性化関数fにシグモイド関数を選択すると、以下の式が得られる↓

これで得られたモデルがこちらです↓

これでスペース価値モデルはできました。

スペース価値のアニメーションはこちら↓ http://www.lukebornn.com/sloan/field_value.mp4

ここで、スペースコントロール値とスペース価値の定義式を乗することで、占有スペースの質が数値的に求められます。これで得られたモデルが下の図の(c)

これにより、課題だったスペース占有ゲイン、スペース生成が求められます。まず、先ほどの占有スペースの質を一定時間で平均したものをGとき、スペース占有ゲイン（SOG）を以下のように定義できます↓

また、スペース占有損失SOLは、SOGの反対の概念です。

次は、スペース生成ゲインについてスペース生成とは、例えばスアレスがニアに走って、対応したDFが、自分のいたスペースを開けた場合、そこにスペースが出来る、このような動きのことです。これを数学的に表現すると、値同士の親密度が有効です。ある時間内のプレイヤー間の距離が定数δより小さい場合、親密度が高い、、のように定義すると、スペース生成の概念は以下の式で表せます↓

aは、最小誘引距離を制約するための定数。

よってスペース生成ゲイン（SGG）は、以下のように表せます↓

これらの指標を使って実際に試合の分析をしてみる

従来のアプローチとはどのように異なるか 従来のスペース分析では、ボノロイ図が主に使われていたが、スペースの境界面が厳格に定められており、実際のピッチに当てはめて分析することが難しかった。今回は、より柔軟な境界面で実際の感覚と合うモデルを構築している。

結果

ラ・リーガのビジャレアル戦でこのモデルを当てはめてみた。結果がこんな感じです↓

これはSOGに関する表です。世界的に有名な選手はSOGが高いことがわかる。特筆すべきはメッシで、SOGの中でも、受動的SOGが多く、これはランニングの行動なしにスペースを占有することに優れていることがわかる。つまり体力的にもかなり効率的にスペースを支配していることが見て取れます。

次はSOLとSGGに関する表です↓

メッシ、スアレス、イニエスタ、ネイマールなど、ボールを保持する時間の長い選手は、スペースを損失する傾向があることが明らかにあります。一方で、スペース生成に関しては、前線の選手は多く相手選手を引き付けるのでSGGが高くなります（スアレスはかなりスペースを生み出しています。）またセルジロベルトのような中盤の選手は引き付ける動きが少ないからSGGが低いです。

さらに、このヒートマップをみると、スアレスの生成したスペースをメッシが多く活用していることも分かります↓

問題点や議論できることがあれば おもろいーーー！

その他

リサーチクエスチョンに関する論文 pythonでの実装方法を知りたい 手法に関する論文

AtomScott / Sportech-Sanity