より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

FIFA18データセットで市場価値と総合力の相関にガウス曲線を適用してみる

Python機械学習の参考書を読んで勉強中なのですが、その中でガウス曲線なるものが出てきました。

直線より曲線であればデータに合っている場合に線形回帰より線形基底関数モデルが良いと。

以前、pandasでFIFA18のcsvデータについて分析してみましたが、

rimever.hatenablog.com

f:id:rimever:20181029231608p:plain

「むむっ、この散布図に適用できるのでは」と思い浮かびました。

勉強を中断して、試してみることにします。勉強より実践あるのみ。

f:id:rimever:20181030221513p:plain

これはなかなか。。。それっぽい。

ガウス曲線の値を調整するしていくことでより近づけることができます。

で、あまり大きくするとグニャグニャになって過学習となります。なるほど。これが過学習か、と。

最終的には訳のわからない形に。

f:id:rimever:20181031211109p:plain

まだまだ勉強中の身なので、わかっていない部分はありますが、面白いです。