より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

Dataloreで気づいたこと。日本語文字化けとかdatalore.plotとか

年末から年明けにかけて、Dataloreの記事が、はてなブックマークしていただいたので、あれからいくつか気づいたことを書きます。

以前の記事では日本語文字化けについて泥臭い対応方法しか案内出来ませんでした。

それについて気づいた点を。

Dataloreでは独自のdatalore.plotというモジュールがあります。

もしやとサインインした時に生成されていたサンプルプロジェクトにはdatalore.plotを用いたコードが入ってますので、ここで日本語を使ったところ、

f:id:rimever:20181231161234p:plain

これならば、行けそうですね。

datalore.plotのAPI仕様についてはドキュメントがないのですが、ggplotにインスパイアされたとあります。

ggplotはRのライブラリです。 R言語をやったことがある方ならば、とっつきやすいかもしれません。(実は、Pythonでもggplotを使うことは可能です)

私は、ありません。勉強しなければならないですね。

ggplotについては下記の記事を参考にしました。

ggplotの使い方 | Memo on the Web

RとPythonの違うため代入は<-ではなく=に置き換える必要はありますが、引数については同じっぽい気がします。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datalore.plot import *
from sklearn.datasets import load_iris
import pandas as pd

iris_bunch = load_iris()
print(iris_bunch['DESCR'])
iris_df = pd.DataFrame(iris_bunch.data, columns=iris_bunch.feature_names)
iris_df['target'] = pd.Series(pd.Categorical.from_codes(iris_bunch.target, categories=iris_bunch.target_names))

p = ggplot(iris_df, aes(x='sepal length (cm)', y='sepal width (cm)'))
p + geom_point()

f:id:rimever:20190102093815p:plain

表示されました。

f:id:rimever:20190102094026p:plain

立て続けにこんな風にいけますね。

f:id:rimever:20190102094614p:plain

マウスオーバーでラベルが表示されるんですね。

なるほど。

ggPlotと同じノリでいけそうですね。

使用時間120時間ってどんなもん?

フリーだと月120時間までですが、私の現在使用状況は下記です。

f:id:rimever:20190102094303p:plain
0ドルです

12/21から10日間で21時間。30日間に換算すると63時間。

月120時間ならプライベートで使うならば十分そうですね。

フリーだから0ドルですね。問題ない。

その他、 Dataloreで気づいたこと

  • Safariだと入力出来なくないですか?