Dataframeでグラフ plot()

pandasでは、グラフを描画するためのメソッド(plot())が、DataFrameとSeriesに用意されています。
pandasは内部でグラフ描画ライブラリーのMatplotlibを利用しており、plot()メソッドで簡易的にグラフ描画できます。

本パートでは、折れ線グラフ、棒グラフ、散布図、箱ひげ図の描画方法を学びます。

https://images.pyq.jp/repo/prod/pydata_plot_first_v2/pandas_plot.jpg
%matplotlib inline

DataFrameであるdfのグラフを描画するには、下記のように実行します。下記を実行すると、横軸(x軸)がインデックス、縦軸(y軸)がdfの数字の列の折れ線グラフを描画します。また、列名の凡例も表示します。

df.plot()

具体的な例を見てみましょう。
ファイルdataset/attendances.csvに、6月の出社人数(Office)と、リモート勤務人数(Tele)が記録されています。

各列の値は以下の通りです。

  • Date:日付
  • Offce:出社した人の数
  • Tele:リモート勤務した人の数

このCSVをdfに読み込んで、先頭の3行を確認すると以下のようになります。

df = pd.read_csv('dataset/attendances.csv')
df[:3]
DateOfficeTele
02019-06-031921
12019-06-04238
22019-06-051129

dfに格納したデータを使ってグラフを描画してみましょう。
次のコードを実行すると、数字の列である列Officeと列Teleの折れ線グラフが描画されます。
縦軸が各列の数値、横軸がインデックスです。

df.plot();
https://images.pyq.jp/repo/prod/pydata_plot_first_v2/plot_first1.jpg

補足

Jupyterのセルにdf.plot()と書いて実行すると、グラフと一緒に<AxesSubplot:>のような文字列が出力されます。
この出力を出さないために、写経ではdf.plot();のように「;(セミコロン)」をつけています。
セミコロンをつけることで、余計な出力をしないようになります。

pandasのplot()メソッドを使うには、実行環境にMatplotlibライブラリーがインストールされている必要があります。
ローカル環境で実行する場合は、pipでインストールして使いましょう。

$ pip install matplotlib

コメント

タイトルとURLをコピーしました