python code

Dataframe

sort_values:列を基準にしたソート

データ分析では、データを並べ替えて確認したり処理したりしたい場面があります。たとえば、次のようなケースです。顧客のデータを、総購入金額が高い順で並べ替えて確認する毎日の売上のデータを、日付が新しい順で並べ替えて確認する試験結果のデータを、点...
Dataframe

value_count 種類ごとの出現割合

value_counts()では下記のように引数によっていろいろな数え方ができます。引数normalize=True:出現割合を取得引数ascending=True:少ない順(昇順)に取得引数subset=列名や列名のリスト:特定の列の結果...
Dataframe

Value_count 種類ごとの出現回数

種類ごとに何回出現しているかを取得します。具体例で確認しましょう。前問と同じく、惣菜店の販売履歴を表した以下のdfを使います。DateItemNum02022/04/02弁当A212022/04/02中華B322022/04/03中華B13...
Dataframe

データの確認:ユニークな値

大量のデータをそのまま見ると、どのような種類の値があるかがわかりにくいです。このような時、ユニークな値を確認することで、データの種類を把握しやすくなります。具体例で確認しましょう。惣菜店の販売履歴を表した以下のdfを使います。DateIte...
Dataframe

plot.box 箱ひげ図の作成

箱ひげ図はデータのばらつきをわかりやすく表現するための統計図です。青の四角い箱の「下辺、緑の線、上辺」が、「第1四分位数、第2四分位数、第3四分位数」を表しています。第3四分位数+1.5×IQRを超えるか、第1四分位数-1.5×IQR未満の...
Dataframe

plot.scatter 散布図の作成

散布図は、縦軸と横軸に2種類の量や大きさなどを対応させ、データを点でプロットしたグラフです。2種類の値の関係を確認したいときに利用します。散布図の描画は、DataFrameであるdfに対し以下のように実行します。df.plot.scatte...
Dataframe

plot.bar 棒グラフ作成

DataFrameでは、以下のようにbar()メソッドを使うと棒グラフを描画できます。デフォルトでは、x軸はインデックス、y軸は数字が格納された全ての列が使われます。df.plot.bar(オプション)bar()にはさまざまなオプションを指...
Dataframe

Seriesにplot()を使う

DataFrame同様、Seriesにもplot()メソッドがあります。いくつかオプションの違いはありますが、使い方はDataFrameのplot()とほぼ同じです。Seriesのインデックスがx軸に、Seriesの値がy軸になります。#指...
Dataframe

plot()のオプション

DataFrameのplot()では、多くの引数を指定できます。本問では、x軸で使用する列、y軸で使用する列、タイトル、x軸の値の表示角度、凡例の表示を指定してグラフを描画します。dfをDataFrameとしたとき、使い方は下記のようになり...
Dataframe

Dataframeでグラフ plot()

pandasでは、グラフを描画するためのメソッド(plot())が、DataFrameとSeriesに用意されています。pandasは内部でグラフ描画ライブラリーのMatplotlibを利用しており、plot()メソッドで簡易的にグラフ描画...