2022-04

Dataframe

groupsを使った各グループの内訳を確認

DataFrameGroupByには各グループを確認するためのいろいろな機能があります。たとえば、次のようなものですメソッド説明get_group(グループ名)指定したグループのデータ(DataFrame)を取得head(行数)各グループの...
Dataframe

groupby()の使い方

次のようにDataFrameのgroupby()メソッドを使うと、指定した列の値に応じてデータがグループ化されます。#指定した列でグループ化df.groupby(列名)DataFrameをグループ化した結果(df.groupby(列名)の実...
Dataframe

itertuplesの使い方

勉強時間を記録するアプリケーションのログについて考えてみます。「勉強開始」「勉強終了」「一時停止」「再開」のイベント種別と、イベントが発生した日時が記録されています。日時イベント02022/1/113:00勉強開始12022/1/113:4...
Dataframe

diff() 階差の使い方

この「1つ前のデータとの差分」のことを階差と呼びます。pandasでは、diff()を使うと階差を簡単に計算できます。ABC05510115-151002105-10510Seriesのdiff()の結果はSeriesになります。列Aについ...
Dataframe

rank()の使い方

DataFrameやSeriesのrank()を使うと、順位を計算できます。具体的な例を見てみましょう。次のような、あるゲームのユーザーごとのスコアについて考えます。スコアは、値が小さいほど良いものとします。ユーザーIDスコアuser15u...
Dataframe

累積和

DataFrameやSeriesのcumsum()を使うと、累積和を計算できます。累積和とは、次の図のように各地点までのデータの総和を計算したものです。メソッド名の cumsum は「cumulativesum(累積和)」の略です。ABC0...
Dataframe

strアクセサ

strアクセサとは、文字列が格納されたSeriesやIndexで使える機能です。strアクセサを介することで、「文字数をカウントする」「指定した文字列を置換する」といった文字列処理でよくある操作を簡潔に記述できます。具体的な例を見てみましょ...
Dataframe

applyの使い方 演習②

変数result_srの作成:各科目の列(国語、 数学 、理科、社会)について 「勉強時間の合計/勉強した日数」 を計算して、結果のSeriesを変数result_srに格納してください。importpandasaspd#科目ごとの勉強時間...
Dataframe

df.apply() の関数の考察

1.関数は列方向に作用するdf.max()→列ごとの最大値がリターンする。2.関数を組み合わせると、列ごとに関数の計算が行われる。defcalc_range(column):#最高点と最低点の差を計算する関数#引数columnには各列のSe...
Dataframe

DataFrame apply() 一つ一つのセルの値を参照

importpandasaspd#科目ごとの勉強時間データの読み込みdf=pd.read_csv("dataset/exercise_study_log.csv")df日付国語数学理科社会02022/1/1143245012022/1/20...