seabornの使い方

seabornはmatplotlibを補助する可視化モジュールだ。

seabornのメリットは、使用頻度の高いグラフを素早く、短いコードで書けることだ。

細かい調整は難しく、matplotlibを用いる方が無難だが、大まかに情報を把握したい場合は非常に有用だ。

import pandas as pd

titanic_df = pd.read_csv('titanic.csv', encoding="shift-jis")
titanic_df.head(5)
PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
0103Braund, Mr. Owen Harrismale22.010A/5 211717.2500NaNS
1211Cumings, Mrs. John Bradley (Florence Briggs Th…female38.010PC 1759971.2833C85C
2313Heikkinen, Miss. Lainafemale26.000STON/O2. 31012827.9250NaNS
3411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.01011380353.1000C123S
4503Allen, Mr. William Henrymale35.0003734508.0500NaNS

seabornのインポート

import seaborn as sns seabornをインポート SNSと省略される
import matplotlib.pyplot as plt
%matplotlib inline

seabornの数あるメソッドの中でも、使用頻度の高いcatplotを紹介する。

catplotは、特徴量の相関を把握する際に使われる

sns.catplot(x="Sex",y="Survived", data=titanic_df, kind="bar")
  • catplotの代表的な引数
    • data:使用する元のデータ 今回の場合は、titanic_dfに読み込んだデータを入れている
    • x:x軸に使用するデータ。使用する元のデータのカラム名から選択、
    • y:y軸に使用するデータ。使用する元のデータのカラム名から選択
    • kind:作成するグラフの種類を指定。棒グラフや箱ひげ図など様々なグラフを作成できる
    • hue : 次回扱う
  • kindに代入できる代表的な値
    • 棒グラフ:bar
    • 箱ひげ図:box
    • ポイントプロット:point(それぞれの平均値を直線で結んだグラフで、直感的にデータを可視化したいときに使われる)
    • ストリップチャート: strip(散布図、どのようなデータがあるのか単純に表示したいときに使われる)

グラフのカスタマイズ

graph = sns.catplot(x="Sex",y="Survived", data=titanic_df, kind="bar",label=["male","female"])
graph.set_xlabels("Gender")
graph.set_ylabels("Survived Probability")

plt.title("Graph")
plt.show()
  • x軸名を指定する : 対象となるグラフ.set_xlabels(指定したい名前)
  • y軸名を指定する : 対象となるグラフ.set_ylabels(指定したい名前)

気になる点としては、set_xlabelsのsだろうか。

実はset_xlabelsは、複数のグラフに使うことが基本想定されているのである。ただし、1つのグラフであっても使うことができるので安心してほしい。

コメント

タイトルとURLをコピーしました