より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

「前処理大全」を読んで自分の未熟さを知る

gihyo.jp

前処理大全は、いくつもの前処理において、SQL,R,Python においてAwesome な書き方とNot Awesome な書き方を紹介した本です。

Awesomeって「驚くばかり」という意味なんですね。

Pythonについて、まだまだこれからの私には目からウロコでした。

pandas配列インデックスではなく、queryで絞れとのこと。

私が書いていたのはど素人のコーディングでした。

Query使う前(Not Awesome)

high_age = data[data.Age == 47]
veteran_data = data[(data.Age > 33) & (data.Overall > 80)]

Query使ったら(Awesome

high_age = data.query('Age == 47')
veteran_data = data.query('Age > 33 & Overall > 80')

SQLのWhere句みたいにスマートに書けますね。 

終わりに

こんなのは序の口でまだまだいくらでもこの本ではたくさんのTipsが紹介されています。

Rとの比較も時間をかけてやってみたいです。

興味がある方は是非。