Dataframe Dataframeでグラフの描写 plot.<グラフのメソッド名>のように、グラフの種類の名前がついたメソッドを呼ぶことで、対応するグラフを描画できます。たとえば、以下のようなメソッドがあります。折れ線グラフ:plot.line()棒グラフ:plot.bar()散布図:pl... 2022.04.05 Dataframe
python code グループに分ける 「グループごとに何かを計算したい」 場面では、pandas.groupby() が使えます。df.groupby(列名).処理のように書くことで、指定した列の値でグループ分けして処理を行います。たとえば、df.groupby("カテゴリ")... 2022.04.05 python code
python code Dataframの統合 実務では、分析したいデータは複数のファイルやDBのテーブルに分かれていることが多いです。pandasは、このような複数のデータを統合する機能をいろいろ備えています。たとえばconcat()を使うと、DataFrameを縦また横方向に連結でき... 2022.04.05 python code
python code 列の追加 データ処理の過程では、既存の列の値を使って新しい列を作りたいケースが多々あります。たとえば、次のようなケースです。列"身長(cm)"から、単位を変換した列"身長(m)"を作りたい列"稼働人数"と列"稼働期間"から、新しい列"工数"(稼働人数... 2022.04.04 python code
python code 欠損値の置換 pandasで特定のデータを置換するには、たとえば次のようなメソッドがあります。mask(条件式,置換後の値):指定した条件に一致するデータを置換するwhere(条件式,置換後の値):指定した条件に一致しないデータを置換するapply(関数... 2022.04.04 python code
python code 欠損値の除去 pandasには、欠損値の確認や対応のための機能がいろいろ備わっています。たとえば、次のような関数です。欠損値を確認する: info(), isna()など欠損値を含む行を削除する: dropna()欠損値を他の値で置換する: fillna... 2022.04.04 python code
python code Pandas の基本操作 抜き出し。最大値最小値など#前回のプログラムの読込%run1.ipynbdfNameHeightWeight0佐藤170601田中160502鈴木16558#身長列のデータを取り出しますheights=df['Height']heights... 2022.04.04 python code
python code Pandas データクリーニング データのクリーニングで行うチェックには、次のようなものがあります。データのチェックの例:データの最大値・最小値を確認し、期待する範囲外の値がないか確認する欠損値の有無を確認するデータの種類を確認し、意図しない値や表記揺れがないか確認するデー... 2022.04.02 python code
python code Pandasでデータの絞り込み pandasのDataFrameでは、dfのように書くことで条件に一致する行を絞り込めます。たとえばdf>=30]とすると、「列Aが30以上の行」だけを絞り込みます。条件式にはPythonの比較同様、==、!=、>、<、>=、<=などが使え... 2022.04.02 python code
python code Dataframeの基本情報 pandasでは、DataFrameの基本情報を確認するための機能が多数用意されています。たとえば、次のようなものです。DataFrameの先頭数行を表示(head())DataFrameの末尾数行を表示(tail())DataFrameの... 2022.04.02 python code