より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

スーパーラグビーのスタッツで分析するラグビーの勝因は?

ラグビーだけでなく、スポーツの試合を見終わった時に、振り返ることは、

勝因はなんだったのだろう?

でしょう。

実況が解説者に聞くこともあります。

この勝因がスタッツでわからないということで、スーパーラグビーのスタッツで分析していきたいと思います。

項目

英語なので、下記サイトを参考にしつつ整理しました。今回集められたスタッツの項目を紹介します。

“スタッツ”はプレーの成績表 | ラグビー初心者ドットコム

結構多いです。

全般

項目 説明
Posession ボール所持率
Territory 地域支配率

攻撃に関する項目

項目 説明
Runs 走った回数
Runs Metres 走った距離
Line Breaks ラインブレイク。相手のディフェンスラインを崩した回数
OffLoads オフロードパスの回数
Phase Seven Plus 7回以上連続して攻撃している回数
Kicks キックの回数
Kicks Metres キックの距離

防御に関する項目

項目 説明
Tackles タックルの回数
Missed Tackles タックスの失敗数
Handling Errors ハンドリングエラー
Penalties Conceded 反則
FreeKicks Conceded フリーキックを与えた
Sin Bins シンビン(一定時間退場)
Send Offs 退場

#### セットプレーに関する項目

項目 説明
Scrums Won スクラムに勝った
Line Outs Won ラインアウトに勝利した
Line Outs Won Against Throw 相手チームの投げるラインアウトに勝利?
Line Outs Not Straight ラインアウトでまっすぐ投げず、反則

分析

では、分析していくことにします。

相関図

まずは、相関図です。

f:id:rimever:20181230221702p:plain

細かい図になりましたが、勝利に相関が強い項目から並べていくと

  1. ラインブレイク
  2. ホームであるか
  3. キックの回数
  4. キックの距離
  5. 相手のタックル失敗
  6. 相手が投げるラインアウトで取った(? 自信ないですごめんなさい)
  7. スクラムで勝ったか
  8. 相手のハンドリング失敗
  9. 地域支配率

ホームアドバンテージについては以前の記事でも紹介した通り。

一番強い相関だったのがラインブレイクしたかとなりました。

攻撃に関するプレーのスタッツが良いのに越したことはないのでしょうが、上位に、走った回数や走った距離は来ていません。

そりゃ、トライするんだから走った回数とか走った距離は多いでしょという結論になるものだと思っていたのですが、そうではなかったというのが意外でした。

ラインブレイクは走った回数やオフロードパスの回数と相関しているため、局所的に考えて、この数値だけがよくなれば勝てるというのは安直な考えとなります。

ですが、キックも重要なのかなとか、新しい発見があり、客観的にこの相関を見ると面白いなとは思いました。

7回以上連続で攻撃しているかという項目については、攻め続けている=良いのではとも思われますが、逆で、攻めあぐねているから、打開できずに攻撃をし続けているということのようです。

機械学習

機械学習アルゴリズムを用いて、このスタッツだけ(もちろん得点は含みません)で勝利の判定を行ってみることにします。

ランダムフォレスト

f:id:rimever:20181230224813p:plain

74.8%となりました。4試合に3試合しか当てられない。うーん。80%に届いて欲しい!

LightGBM

f:id:rimever:20181230224928p:plain

77.7%

ラッキーセブンですが、80%には届きませんでした。

勝利を予測するには、このスタッツだけでは物足りない様子。

最後に

スタッツだけ見ても面白くないし、ゲームの展開はわからない。

やっぱり、実際のゲームを見ないと楽しめないですね。