機械学習もしようかと思ったのですが、下記に引き続き、ニュージーランドだけでなく世界のラグビー選手のデータを集めることにしました。
集めたデータを分析してみる
頑張って集めたデータを眺めてみます。
またまた、Pythonで、pandasを使います。
やはり、注目すべきはトップの成績を残したプレイヤーたちです。
※ここでのデータはテストマッチの成績について述べています。
もっとも勝利したのは?
リッチー=マコウ。ニュージーランドの名主将です。世界最優秀選手に3回も選出されています。
131勝17敗。
フランカーですのでポイントゲッターではありません。ですが、勝利数でトップ。
やはり、名選手は記憶にも記録にも残るものということでしょうね。
動画を見たのですが、私には彼の凄さが全然わかりませんでした。
ボールを奪う技術が高いのですが、私が見ても、何が起きたのかわからないのです。
ちなみに出場試合数もリッチー=マコウの148も最多になります。
逆にもっとも負けたのは
不名誉な記録にも思えますが、一人で戦うスポーツではないですから。
負けても負けても不屈の選手で国を背負って戦い続けた選手です。
セルジオ=パリセ。イタリアの選手です。34勝100敗です。
総得点は、やはりダン=カーターだけど・・・
総得点・コンバージョン・ペナルティゴールは全てダン=カーターです。
総得点が高いため、キックでの成功数も多いです。
ですが、ドロップゴール数でダン=カーターを上回る選手がいます。
それが、ジョニー=ウィルキルソンです。
総得点も1246点です。
通算トライ数は日本のあの人!
大方、オールブラックス(ニュージーランド代表)の伝説プレイヤーなのだろう、と思いました。
ジョナ=ロムーとか。
え? え?
Daisuke Ohata | Rugby Union | Players and Officials | ESPN Scrum
ほんとだー!
テレビ番組、スポーツマンNo.1決定戦で活躍していた記憶があります。
Webスクレイピングの難しさ
色々、思うように行きませんでした。
C#ではHtmlAgilityというのを使ってWebスクレイピングは経験あったのですが、
- 全く成績が載っていない想定外のデータがあった
- 後で知ったら、pyqueryの方が早い?Pyquery, lxml, BeautifulSoup comparison · GitHub