より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

軽くデータ分析する上で便利なSeaborn.countplot

職場で、システム障害に関するデータ分析をすることになった時のこと。

Googleスプレッドシート上の関数で処理をしてました。

しかし、分析と結果をまとめておいた方が役立ちそうなので、Jupyter NotebookとRISEとの合わせ技を使ってみました。

データ数も多くなく、機械学習をするわけでもなく、前処理とかよりさっと使える関数を使いたくなります。

これまで使ったことないのに、多用することになったのが、seabornライブラリのcountplotです。

pythondatascience.plavox.info

import seaborn as sns
data = sns.load_dataset('iris')

# data.head()

sns.countplot(data['species'])

数値でなくとも、指定の項目にどのような値があるか、その値が、どれほどの数があるかを把握することができます。

f:id:rimever:20190529093040p:plain
irisについては綺麗にデータの数が揃ってる。