python code

Dataframe

agg() 複数の集約値を一括で計算

複数の集約値を一度に出したいときはagg()が便利です。次のように、集約方法のリストを渡すことで複数の集約値を一度に計算します。#指定した列でグループ化するgrouped=df.groupby(列名)#グループごとに複数の方法で集約するgr...
Dataframe

集計の方法

次のようにgroupby()の結果(DataFrameGroupByオブジェクト)と集約メソッドを組み合わせることで、グループごとの集約ができます。#指定した列でグループ化するgrouped=df.groupby(列名)#グループごとに集約...
Dataframe

groupsを使った各グループの内訳を確認

DataFrameGroupByには各グループを確認するためのいろいろな機能があります。たとえば、次のようなものですメソッド説明get_group(グループ名)指定したグループのデータ(DataFrame)を取得head(行数)各グループの...
Dataframe

groupby()の使い方

次のようにDataFrameのgroupby()メソッドを使うと、指定した列の値に応じてデータがグループ化されます。#指定した列でグループ化df.groupby(列名)DataFrameをグループ化した結果(df.groupby(列名)の実...
Dataframe

itertuplesの使い方

勉強時間を記録するアプリケーションのログについて考えてみます。「勉強開始」「勉強終了」「一時停止」「再開」のイベント種別と、イベントが発生した日時が記録されています。日時イベント02022/1/113:00勉強開始12022/1/113:4...
Dataframe

diff() 階差の使い方

この「1つ前のデータとの差分」のことを階差と呼びます。pandasでは、diff()を使うと階差を簡単に計算できます。ABC05510115-151002105-10510Seriesのdiff()の結果はSeriesになります。列Aについ...
Dataframe

rank()の使い方

DataFrameやSeriesのrank()を使うと、順位を計算できます。具体的な例を見てみましょう。次のような、あるゲームのユーザーごとのスコアについて考えます。スコアは、値が小さいほど良いものとします。ユーザーIDスコアuser15u...
Dataframe

累積和

DataFrameやSeriesのcumsum()を使うと、累積和を計算できます。累積和とは、次の図のように各地点までのデータの総和を計算したものです。メソッド名の cumsum は「cumulativesum(累積和)」の略です。ABC0...
Dataframe

strアクセサ

strアクセサとは、文字列が格納されたSeriesやIndexで使える機能です。strアクセサを介することで、「文字数をカウントする」「指定した文字列を置換する」といった文字列処理でよくある操作を簡潔に記述できます。具体的な例を見てみましょ...
Dataframe

applyの使い方 演習②

変数result_srの作成:各科目の列(国語、 数学 、理科、社会)について 「勉強時間の合計/勉強した日数」 を計算して、結果のSeriesを変数result_srに格納してください。importpandasaspd#科目ごとの勉強時間...