より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

Python

衝撃のDatalore〜圧倒的な使いやすさを誇るクラウド上のJupyter Notebook

Dataloreの魅力 blog.jetbrains.com 要はクラウド上で動かせるJupyter Notebookといったところです。 ホーム画面 この手のサービスでは、Google ColaborateryやAzure Notebooksがあります。 それらのサービスがありながらも圧倒的な存在感のあるサービスです…

Kaggleのカーネルで学ぶデータ分析「ポケモン、データだぜ!」

kaggle その2 Advent Calendar 2018 - Qiitaの22日目です。 Kaggleのカーネルを投票順で眺めていると、良いカーネルがあったので紹介します。 Data ScienceTutorial for Beginners | Kaggle 私は日本人ですし、日本が好きなので、初心者向けのチュートリアル…

7人制ラグビーの魅力をデータとPython で語る

これまでは15人制のラグビーを扱ってきました。15人制はラグビーユニオンと呼ばれます。 他にも13人制のラグビーリーグと7人制のセブンズというのが存在します。 rugby-island.com 混乱してきましたね。 ここでは7人制ラグビー、セブンズについてデータとPyt…

クリスティアーノ・ロナウドが何ゴール取るかを機械学習とFIFA18のデータで予測する

Python Advent Calendar 2018 - Qiitaに16日目の投稿です。 以前にやった記事の続きをやりたいと思います。 rimever.hatenablog.com 簡単に言うと、ゲーム「FIFA18」のステータスでCR7こと、クリスティアーノ・ロナウドが何点取れるか予測するという話です。…

ラグビーで後半に逆転は多いかをPythonで分析してみる

最近の日本代表の試合は 日本-イングランドは前半は勝っていたのに、負けてしまいました。 これだから日本はここぞというときに弱いんだと言われるので生姜、逆に日本-ロシアは前半は負けていたのですが、勝っています。 ラグビーは逆転が多い試合なのでし…

ラグビーの点差をPythonで分析しながらヒストグラムについて学ぶ

これまでPythonでラグビーについて分析してきましたが、個人成績についてばかりでした。 試合の点差についてPythonで分析することにします。 いきなり結論 書いてみたのですが、ややダラダラした内容になってしまいました。 ですので、いきなり結論から入っ…

術前・術後の在院日数を手術分類で分析してみる

下記の記事の続きです。 rimever.hatenablog.com AttributeError: module 'pandas' has no attribute 'core' いつもの調子でcsvをpandasで読もうとしたらエラー。 python - AttributeError: module 'pandas' has no attribute 'core' - Stack Overflow jupyt…

都道府県別の術前・術後の平均在院日数をPythonで分析してみる

今回は在院日数についての分析を行いたいと思います。 というのも、下記の記事を読んだためです。 hospia.jp 平均在院日数が、患者の回復速度を表し、短いほど病院が優れているという指標という考え方です。 データを集める e-Statsでは、術前と術後に分けて…

ラグビーのペナルティゴールとコンバージョン、どっちが多いの?

まずは、こちらの記事。 news.livedoor.com 2018年ラグビー年間最優秀選手がアイルランド代表のセクストンとなりました。 アイルランドとは日本はW杯で試合するので、この選手は日本の前に立ちはだかります。 ポジションはスタンドオフでスコアラーです。 彼…

Pythonでラグビーをポジション別にトライ数で分析

というのも、自分でこういうブログを書くこともあって、アニメの『ALL OUT』を見ていました。 神高(じんこう)こと神奈川高校ですが、ウイングの江文が派手なトライを決めるシーンが目立ちます。 ですが、意外なポジションの選手が点を取るシーンも登場しま…

都道府県別の病院数についてPythonで分析してみる

都道府県別の病院数について自分なりに分析してみます。 www.e-stat.go.jp 前処理 下記の流れでデータを用意。 e-statのサイトからダウンロード Googleスプレッドシートにアップロード スプレッドシート上で適当に編集、コメントアウト 再度スプレッドシート…

医療に関するデータ分析に挑戦してみる

うちの会社には機械学習もチャレンジしている意欲的な若手がいるのですが、彼らがやっていることは「株価」のようです。 会社としては医療ITなんだから、医療に関することをやってみようよということでチャレンジしてみることにしました。 やろうと思ったき…

FIFA18のデータを活用して、セリエAの選手が何点取れるか線形回帰で分析してみるも失敗

2018-2019の注目はセリエA これまでFIFA18のデータを分析してきましたが、データをちまちまとこねくり回しながら考えていたのは、 CR7こと、クリスチアーノ・ロナウドがイタリアで何点取るかです。 web.gekisaka.jp 2018年、イタリアはW杯出場を逃しましたが…

Pythonでラグビーをポジション別に試合数で分析

まだまだ懲りずにやってみようかと思います。 試合数で分析 今回はラグビーをポジション別に試合数で分析です。 学生時代にラグビー部だった後輩がいるのですが、ラグビーの話を振ると 「試合前に怪我しないことを祈ってました」 え。 とはいえ、私なんてア…

JetBrainsのPython開発者アンケートを見て〜DjangoかFlaskか

www.jetbrains.com JetBrainsについて JetBrainsの製品については日本でも販売代理店があります。 ですが、本社はチェコにあることもあって、アンケートに回答したユーザーは日本とは大きく異なるかもしれません。 使用用途 データ分析 52%。 Web開発 45% …

Pythonでラグビーをポジション別にBMIで分析

まだまだ、ポジション別の分析が続きます。 身長、体重と来たら、BMIでしょう。 BMIで面白い記事が書けるかチャレンジしてみます。 ラガーマンのBMIを見て、自分のBMIに安心してしまおうという企画です。 自分の体重とラガーマンの体重では脂肪と筋肉の違い…

Pythonでラグビーをポジション別に体重で分析

前回の身長に続き、今度は体重で分析しようと思います。 rimever.hatenablog.com ラグビーにおいて体重は重要かと。 というのもテレビ中継の際には、スクラムで8人が組み合うとき、お互いのチーム合計体重が表示されます。 オールブラックスことニュージーラ…

Pythonでラグビーをポジション別に身長で分析〜もっとも身長の高いポジションは?

ラグビーはポジションも個性があって面白いです。 www.jsports.co.jp 身長とポジションの相関図 今回は身長とポジションの相関図を見ることにします。 ポジションと身長の相関図 やたらでかい相関図になってしまいました。 複数ポジションを担当できる選手が…

ラグビー日本代表×イングランド代表とPythonで見る1試合あたりの得点

11/17にイングランド代表と日本代表のテストマッチが開催されました。 出場メンバーであっ、と思ったプレイヤーがいました。 rugbyhack.com それは誰かという前に、 rimever.hatenablog.com ワールドクラスのラグビー選手についてもう少し掘り下げてPythonで…

Pythonのコーディング規約PEP8について学ぶ

Pythonのコーディング規約のドキュメントとしてPEP8というものが存在します。 はじめに — pep8-ja 1.0 ドキュメント コーディング規約について学んで見ようかと思います。 まず、大事なのは規約について説明する前に 一貫性にこだわりすぎるのは狭い心の現れ…

Pythonでワールドクラスのラガーマンのデータを集める〜通算トライ数トップは日本のあの人

集めたデータを分析してみる もっとも勝利したのは? 逆にもっとも負けたのは 総得点は、やはりダン=カーターだけど・・・ 通算トライ数は日本のあの人! Webスクレイピングの難しさ 機械学習もしようかと思ったのですが、下記に引き続き、ニュージーランド…

Pythonでラグビーをもっと知ろう! 〜 ラグビー界のメッシと、それに続く者

最近、ラグビーの魅力を紹介されたので、ラグビーに関するデータを分析してみようと思います。 何を目標にするのか データを集める データを集めることは大事 Webスクレイピング データを分析する データの概要(describe) 1598得点した男 ダン=カーターに続…