pandasでは、グラフを描画するためのメソッド(plot()
)が、DataFrameとSeriesに用意されています。
pandasは内部でグラフ描画ライブラリーのMatplotlibを利用しており、plot()
メソッドで簡易的にグラフ描画できます。
本パートでは、折れ線グラフ、棒グラフ、散布図、箱ひげ図の描画方法を学びます。
%matplotlib inline
DataFrameであるdf
のグラフを描画するには、下記のように実行します。下記を実行すると、横軸(x軸)がインデックス、縦軸(y軸)がdf
の数字の列の折れ線グラフを描画します。また、列名の凡例も表示します。
df.plot()
具体的な例を見てみましょう。
ファイルdataset/attendances.csv
に、6月の出社人数(Office
)と、リモート勤務人数(Tele
)が記録されています。
各列の値は以下の通りです。
- Date:日付
- Offce:出社した人の数
- Tele:リモート勤務した人の数
このCSVをdf
に読み込んで、先頭の3行を確認すると以下のようになります。
df = pd.read_csv('dataset/attendances.csv')
df[:3]
Date | Office | Tele | |
---|---|---|---|
0 | 2019-06-03 | 19 | 21 |
1 | 2019-06-04 | 2 | 38 |
2 | 2019-06-05 | 11 | 29 |
df
に格納したデータを使ってグラフを描画してみましょう。
次のコードを実行すると、数字の列である列Office
と列Tele
の折れ線グラフが描画されます。
縦軸が各列の数値、横軸がインデックスです。
df.plot();
補足
Jupyterのセルにdf.plot()
と書いて実行すると、グラフと一緒に<AxesSubplot:>
のような文字列が出力されます。
この出力を出さないために、写経ではdf.plot();
のように「;
(セミコロン)」をつけています。
セミコロンをつけることで、余計な出力をしないようになります。
pandasのplot()
メソッドを使うには、実行環境にMatplotlibライブラリーがインストールされている必要があります。
ローカル環境で実行する場合は、pip
でインストールして使いましょう。
$ pip install matplotlib
コメント