Dataframe グループごとの変換 rank() 「変換」ではグループごとに 個々のデータ に対して処理を行う点が特徴です。そのため、次のようにグループごとにデータの個数分の結果が出ます。変換処理の方法次のようにgroupby()の結果(DataFrameGroupByオブジェクト)と変換... 2022.05.05 Dataframe
Dataframe agg()を用いた演習 importpandasaspd#ジムの利用履歴データを読み込みdf=pd.read_csv("dataset/gym_log.csv",index_col="ログID")#先頭5行を確認df.head()利用者ID利用日利用時間(分)ログ... 2022.05.03 Dataframe
Dataframe agg()で関数を用いて集約する方法 agg()では、集約方法として関数を指定することも可能です。そのため、指定する関数次第で柔軟な集約処理が行えます。#指定した列でグループ化grouped=df.groupby(列名)#指定した関数の処理を使って集約grouped.agg(関... 2022.05.03 Dataframe
Dataframe agg() 複数の集約値を一括で計算 複数の集約値を一度に出したいときはagg()が便利です。次のように、集約方法のリストを渡すことで複数の集約値を一度に計算します。#指定した列でグループ化するgrouped=df.groupby(列名)#グループごとに複数の方法で集約するgr... 2022.05.03 Dataframe
Dataframe 集計の方法 次のようにgroupby()の結果(DataFrameGroupByオブジェクト)と集約メソッドを組み合わせることで、グループごとの集約ができます。#指定した列でグループ化するgrouped=df.groupby(列名)#グループごとに集約... 2022.05.03 Dataframe
Dataframe groupsを使った各グループの内訳を確認 DataFrameGroupByには各グループを確認するためのいろいろな機能があります。たとえば、次のようなものですメソッド説明get_group(グループ名)指定したグループのデータ(DataFrame)を取得head(行数)各グループの... 2022.04.30 Dataframe
Dataframe groupby()の使い方 次のようにDataFrameのgroupby()メソッドを使うと、指定した列の値に応じてデータがグループ化されます。#指定した列でグループ化df.groupby(列名)DataFrameをグループ化した結果(df.groupby(列名)の実... 2022.04.30 Dataframe
Dataframe itertuplesの使い方 勉強時間を記録するアプリケーションのログについて考えてみます。「勉強開始」「勉強終了」「一時停止」「再開」のイベント種別と、イベントが発生した日時が記録されています。日時イベント02022/1/113:00勉強開始12022/1/113:4... 2022.04.28 Dataframe
Dataframe diff() 階差の使い方 この「1つ前のデータとの差分」のことを階差と呼びます。pandasでは、diff()を使うと階差を簡単に計算できます。ABC05510115-151002105-10510Seriesのdiff()の結果はSeriesになります。列Aについ... 2022.04.28 Dataframe
Dataframe rank()の使い方 DataFrameやSeriesのrank()を使うと、順位を計算できます。具体的な例を見てみましょう。次のような、あるゲームのユーザーごとのスコアについて考えます。スコアは、値が小さいほど良いものとします。ユーザーIDスコアuser15u... 2022.04.26 Dataframe