最近の日本代表の試合は
日本-イングランドは前半は勝っていたのに、負けてしまいました。
これだから日本はここぞというときに弱いんだと言われるので生姜、逆に日本-ロシアは前半は負けていたのですが、勝っています。
ラグビーは逆転が多い試合なのでしょうか?
手元にハーフタイム時点でのスコアがあるので、前半負けている場合に後半で逆転するケースについてPythonで分析してみたいと思います。
とはいえ、欠損値があります。
Pythonだとdropna()で除外できるのがいいですね。
その後、前半の互いのチームの成績があるので、その点数差のカラムを作ってしまいます。
temp = data.replace({'': pd.np.nan, '-': pd.np.nan}) temp = temp.dropna() temp = temp.assign(Hta_int = temp['Hta'].astype(np.int64)) temp = temp.assign(Htf_int = temp['Htf'].astype(np.int64)) half_data = temp.query("Hta_int >= 0 & Htf_int >= 0") half_data['HDiff_int'] = half_data['Hta_int'] - half_data['Htf_int'] half_data.describe()
前処理が終わったら、あとは、前半に負けているケース(前半に点差がマイナス)を抽出します。
結果としては前半負けていて、後半逆転勝ちする可能性は17%でした。
サッカーで先制点を取ったチームが勝つ確率が高いみたいな。
とはいえ、だからこそ2015年ワールドカップに日本が南アフリカを撃破した試合は、素晴らしいということです。
1番の大逆転劇は?
あくまでも2016年9月からの私の手元にあるデータですが
ブラジルーアルゼンチン。3-33と圧倒的にアルゼンチンが勝っている状況から、36-33と引っくり返しています。
逆転勝ちの多いチームは
南米の人は気分屋だから〜みたいな偏ったような説が聞かれますが、どうなんでしょう。
groupbyした結果をsortするのは、私、これまで出来なかったのですが下記を参考にしました。
sorting - pandas groupby sort descending order - Stack Overflow
temp = half_data.query("HDiff_int < 0") grouped = temp.groupby('Team').count().reset_index() grouped = grouped.sort_values('Result',ascending=False) grouped
オーストラリア、ニュージーランド、イングランド、ウルグアイ。
これらのチームが出てくるところを見るに、地力のあるチームだから逆転できるというような気がします。
逆に強豪だけど逆転の少ないチームを探した方が面白い気がします。
手元にあるデータで逆転勝ちをしたことない国を探したところ、ワールドカップ出場国の中では
- ロシア
- フランス
- アイルランド
でした。そのうち、ロシアとアイルランド は日本は同じプールで試合することになります。
前半で勝ち越して、勝利したいですね。
前半と後半で展開は変わる?
勝ったチームと負けたチームに分けたデータでの比較ですが、ほとんど変わりません。
勝ったチームの平均は36点。負けたチームの平均は14点。
前半と後半の値を比較したところ、半々となっていました。
標準偏差も前後半比較してもさほど違いもありません。
初めてサッカー観戦に誘ってくれた友人が『終了15分前が見所だぞ』と言ってくれたのですが、ラグビーはそうでもなさそう。
なので、ラグビーは最初から見て楽しむことにしましょうかね。