より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

Chainerチュートリアルとかキノコのデータセットとか

Chainerを勉強してみたいなと思っていたのですが、書籍のレビューを見ていると評価が芳しくないので、公式ドキュメントを見て勉強してみることにしました。

Mushroom

最初はいつもの手書き文字であるMNISTではなく、mushroom。

キノコが食べられるか食べられないかのデータで深層学習を行います。

docs.chainer.org

以下のような形で、e=edible,p=poisonousなどという頭文字だけのcsvデータ。

こういう数字ではなく、略字だけで表現したデータというのは新体験。

f:id:rimever:20190207222649p:plain

Chainerについて

私のスキルかもしれないが、typoが多い。

記述量は多い気がします。

前回のQuickStartを紹介した時もそうですが、以下のようなグラフが出るのはChainerの長所かも。

f:id:rimever:20190206223133p:plain

キノコのデータについて掘り下げてみる

このデータが何であるか、よくわからないのにChainerが深層学習で解決してくれるところがこのチュートリアルのすごいところなのですが、せっかくのキノコのデータについて掘り下げてみることにしました。

データの詳細は下記に記載されています。

Mushroom Classification | Kaggle

傘の形や傘の色、傷、匂い、傘の裏、軸の部分についてなどの情報です。

毒性率 = 毒キノコの数 / 総数

として、相関図を表示してみます。

f:id:rimever:20190211172622p:plain

絶対に食べてはならないケースが出てますね。

gill-colorというのはキノコの傘の裏のことのようですが、色が黒か緑は絶対外れのようです。

赤かオレンジは安全なようです。

多分。