前処理大全は、いくつもの前処理において、SQL,R,Python においてAwesome な書き方とNot Awesome な書き方を紹介した本です。
Awesomeって「驚くばかり」という意味なんですね。
Pythonについて、まだまだこれからの私には目からウロコでした。
pandas配列インデックスではなく、queryで絞れとのこと。
私が書いていたのはど素人のコーディングでした。
Query使う前(Not Awesome)
high_age = data[data.Age == 47]
veteran_data = data[(data.Age > 33) & (data.Overall > 80)]
Query使ったら(Awesome)
high_age = data.query('Age == 47')
veteran_data = data.query('Age > 33 & Overall > 80')
SQLのWhere句みたいにスマートに書けますね。
終わりに
こんなのは序の口でまだまだいくらでもこの本ではたくさんのTipsが紹介されています。
Rとの比較も時間をかけてやってみたいです。
興味がある方は是非。