はじめまして、筑波大学蹴球部(以下、筑波大)のデータ班という組織の班長を務めています金侑輝と申します。
筑波大学蹴球部にはパフォーマンスチームというピッチ外の活動を行う組織があり、データ班はその内の一つで主にトップチームのデータ分析を行っています。
活動内容としては、基本的に関東リーグ、カップ戦などのトップチームの公式戦のデータシートを作成し、それをもとにデータレビューを行なっています。
今回、普段作成しているシートを使って実際に取得しているデータやその意味、見方について説明できたらと考えています。
こちらが筑波大で実際に作成しているデータシートになります。
今回は、先週行われたプレミアリーグ第32節、マンチェスター・シティvsリヴァプールの試合のモデルにして説明させていただきます。
かなりハイレベルな試合でご覧になった方も多いと思いますが、実際に数字を見て振り返ってみると意外な点もあったりすると思うので、試合をご覧になった方は是非ともご一読いただきたいと考えています。
筑波大で作成しているデータシートですが、こちらは大きく4枚で構成されています。
筑波大におけるデータ分析の目的としては、「試合で自分たちのプレーモデルをうまく遂行できていたか」をデータを用いて振り返るというものになります。
ですので、単に数字を羅列するのではなく、プレーモデルに沿ったデータを作成し、取得しています。
上図でもわかるようにそれぞれの局面ごとに対応する指標が存在します。
攻撃:Packing Rate、xG(ゴール期待値)、ZONE、PAI(ペナルティエリア侵入)
守備:PPDA、IRO(Intercept Remove Opponents) 、(ZONE、PAI )
攻撃→守備:5秒以内奪取数
守備→攻撃:Fast Break
それでは一つ一つの指標を実際の数字を見ながら説明させていただきます。
こちらが1枚目のシートになっています。
一番上に対戦相手とスコア、そしてその下からデータの各項目になっています。
そしてデータの順番は攻撃、守備、トランジションの順でシート状に示しております。
まずは攻撃の指標から紹介させていただきます。
xGとは「ゴール期待値」の別称で、決定機に関する指標になります。実際のスコアとは別にその名の通り、「期待されたスコア」を数字として算出しています。算出方法はシュートを打った位置、シュートを打った部位やタッチ数、シュート時の状態(フリーなのか、マークがいたのか)などを変数として数字を出しています。
この試合においてはマンチェスター・シティの方が前半に決定機を多く作りましたが、後半はシティに比べてリヴァプールがの方がよりゴールの確率が高い決定的なチャンスが多かったことがわかります。
PAIはどのエリアからペナルティエリアに入ったかを表す指標で、ペナルティエリアへの侵入方法(パス、クロス、ドリブル)とその成功率を可視化しています。
ただセットプレーに関しては数字から入れずに算出しています。
この試合マンチェスターシティは左サイド深い位置から多くペナルティエリアに侵入していますが、リヴァプールの方はサイド深い位置からの侵入は少なく中央やサイド浅い位置からの侵入傾向にあったことがわかります。
次に紹介するデータは「Packing Rate」 になります。
これはサッカーの前進に関わる評価値で、「パスやドリブルで何人相手を越えることができたか」を数字として出してどちらのチームが上手く前進を行えていたのかを評価します。
「Packing Rate」の計算方法は、(一本のパスで越えた人数)×(評価値)になります。
評価値というのは受け手の状態やエリアによって変動する値で、「受け手が敵陣ゴール方向を向いてパスを受けた」or「受け手がゴール付近でパスを受けた」ときに値が高くなります。
この数字の合計を「Packing Rate」として可視化しています。
したがって試合を通して「Packing Rate」はマンチェスター・シティの方が高く、特に前半はリヴァプールと比べても圧倒していることがわかりので、前半は特にシティが優勢であったことが実際の数字からもわかります。
こちらが3枚目と4枚目のシートになりますが、この2枚は両方とも「Packing Rate」に関わるデータになっています。先述した「Packing Rate」を個人単位で評価するシートになっています。
マンチェスター・シティのデータを用いて詳しく説明させていただきます。
実際の試合のフォーメーション通りに選手の画像が並んでいるのですが、選手の下に2種類の数字があります。左側が「出し手としてのPacking Rate」になります。つまり、「どれほど効果的なパスを出したか」を評価する指標になります。対して右側は「受け手としてのPacking Rate」になります。これは「どれほど効果的なパスを受けたか」という意味になります。
この試合マンチェスターシティの選手は積極的にリヴァプールDFラインの背後を取りに行っていたので、CBのパサーとしての数値が高く、両SBの受け手としての数値がかなり高くなっています。
またシティの特徴として中盤のクオリティがかなり高いというものがありますが、数字としても中盤の3選手の値が高くなっており、効果的なパスを何本が通していることがわかります。
この試合を見ていた方は感じるかもしれませんが、スターリングの受け手としての数値がかなり低くなっており、上手くボールを受けられたシーンはあまり多くなかったということもデータからもわかるようになっています。
また、こちらは「Packing Rate」をエリアに分割したものです。
どのエリアで効果的に前進を行えていたかを評価するものになっています。
マンチェスター・シティに関しては、中央の数値も高い上に左右のバランスが良いので、かなり効果的に攻撃ができていたことがわかります。
ちなみにですがリヴァプールのものは上図のようになっています。
これは「Packing Rate」を表にしたもので、誰から誰へのパスで効果的に前進できていたのかがわかるような表になっています。
この試合でも特徴的だったラポルト→カンセロのラインの数値が一番高くなっていることがわかります。
このように筑波大では「Packing Rate」を重要視してデータ分析を行っています。
海外でも積極的に導入されていて勝率と直結する指標とも言われているので、引き続き取得しながら精度を高めていこうと思います。
次に紹介するのが「ZONE」という指標になります。
これは相手の守備ラインをどれくらい割合で超えることができたかを表す指標になっています。相手の守備ラインは基本的に縦3列で考えていて、図で見れるようなZone1、Zone2、Zone3、Zone4はその守備ラインの前後のエリアを表しています。したがってこのZONEとはピッチのここからここまでという絶対的な境界を持つものではなくて、相手に対して変化しうる相対的な境界を持ったものになっています。
この試合のリヴァプールはインサイドハーフの選手が1枚出てきてセンターバックに規制をかけたり、従来のリヴァプールが行っているようなウイングが外切りでプレスをかけてくるシーンもあったのですが、基本的には4-5-1の形でプレスを行っているという解釈のもとで考えています。
例えば左側の図で「Zone4」が22.0%というのがありますが、これは総攻撃回数のうち、22%の割合で相手の背後までボールを運べているということになります。この試合シティは積極的に背後のスペースを取りに行ったこともあって、高いキック精度と抜け出しの質の高さでリヴァプールのハイラインに対して5回に1回以上の割合で背後のスペースまでボールがつながっていることを示します。
ざっくりそれぞれのzoneにおける意味合いを以下に示します。
・Zone1:相手の守備の1stラインも越えることができずにボールを失ってしまった
・Zone2:相手の1stラインは越えられたがその次の中盤のラインを越えられずにボールを失ってしまった
・Zone3:相手の中盤とディフェンスのラインの間(いわゆるライン間)までボールを運べた。
・Zone4:相手の背後のスペースまでボールがつながった。
先ほど述べた通り図を見てみると、「Zone4」の値は高くなっているのですが、「Zone2」での数値もかなり高くなっており、相手の中盤5人のラインの奥に侵入することができた回数はそれほど多くなかったことがわかります。
この指標をもとにしてビルドアップにおけるプレーモデルの評価を行なっています。
ここからは2枚目のシートになり、守備の指標になります。
紹介するデータは「PPDA」になります。
これはもうかなり広まっているデータだとも思うのですが、プレスに関する指標で、数値が低ければ低いほどプレスがうまく行えているという意味を持つデータになります。
本来はもう少し定義が複雑なのですが、計算式を簡単に説明すると、「(敵陣での敵チームのパスの総数)÷(敵陣での次チームの守備アクションの総数)」になります。
したがってこのPPDAは
・敵陣での相手のパスが少ないほどプレスがよく行えている
・敵陣での自チームの守備アクションが多いほどプレスがよく行えている
という考え方のもとでプレスの評価を行う指標になります。
実際の数字を見てみてもリヴァプールは4-5-1の形で構えてから規制をかけて奪うという方法をとっていて、ボールを奪いに行くプレスという点ではそこまで効果的には行えておらず、PPDAの数字が高くなってしまっている印象です。
対してシティは4-4-2の形で積極的にセンターバックにもプレスをかけていたので、リヴァプールと比べてもPPDAの数値が低くプレスが効果的であったことがわかります。
次にここからはトランジションのデータになります。
攻から守、守から攻とそれぞれ1つずつ指標を設定しています。
このデータは「5秒以内奪取数」というもので、その名の通り奪われてから5秒以内に奪い返した回数を表しており、右側にその奪ったエリアを示しています。
ポゼッションを行うチームにとって即時奪回というのはかなり重要な原則になっているので、この数値が高いほどポゼッションをうまく行えていた試合であったおいえる傾向が高いです。
奪ったエリアを見てもマンチェスター・シティはこの試合、高い位置での即時奪回が行えていたことがわかります。
最後に紹介するのが、「fast break」という指標になります。
これはカウンター指標で、ボールを奪ってから規定時間内にアタッキングサード(以下A3)までボールを運べた回数を表しています。
「Fast Break」としてカウントされる条件は以下のようになります。
・ディフェンシブサードで奪ってから10秒以内にA3に侵入
・自陣ミドルサードでボールを奪ってから6秒以内にA3に侵入
・敵陣ミドルサードでボールを奪ってから4秒以内にA3に侵入
・ATでボールを奪う
つまりボールを奪ってからいかに時間をかけずにA3までボールを運べたかを評価する指標で、この試合だとマンチェスターシティの方がより高い位置でボールを奪ってそのままカウンターに繋げられていたことがわかります。
先ほどにも説明の際に使いましたが、3枚目と4枚目のシートがこちらになります。
冒頭にもあったこの図ですが、これまでの通りすべての局面に指標を設定してプレーモデルの達成度を振り返っています。
ここまでのデータを踏まえて今回の試合をざっくり振り返ると、様々な局面でマンチェスター・シティの方がリヴァプールに対して数字で上回っていたことがわかると思います。
従来のやり方とは異なる戦い方を選んだマンチェスター・シティでしたが、そのクオリティはかなりのもので、それは数字にも表れていました。また、それに対して少ないチャンスを確実に決め切るリヴァプールもまた圧巻で、プレミアリーグ頂点を奪い合う両者の本領が全て発揮された素晴らしい試合だったと考えます。
サッカーは他のスポーツと比べても不確定要素が多いスポーツで、いくらデータで理解したつもりでも、実際にピッチ上で起こっていることはかなり複雑であり、数字だけではわからないことがほとんどなので、リヴァプールのような「一発」を持っているチームは実際の数字を飛躍して勝利を掴み取ることがあることも多いと思います。
だからこそサッカーは面白いと思いますし、サッカーのデータ分析は面白いと考えています。
数字だけでは予測できないカオスな状況の多さがサッカーのデータ分析を難しくしているとは思いますが、だからこそデータ分析にはどこまでも可能性があると信じています。サッカーを全て理解して次に起こることを予測することはかなり困難ですが、少しでもその状態に近づけるように今後とも分析業務に一生懸命励んでいきたいと考えています。
日本でもデータ分析はまだまだ浸透しておらず、海外と比べてもそのレベルはかなり遅れていると思いますので、是非ともこれからデータというものに意識を向けてサッカーを見る方が増えてほしいなと思います。
ここまで長い文章を最後までお読みいただきありがとうございました!
今後とも筑波大学蹴球部、またデータ班のご声援のほどよろしくお願いします!
筑波大学蹴球部
データ班長
金 侑輝