Dataframe

Dataframe

累積和

DataFrameやSeriesのcumsum()を使うと、累積和を計算できます。累積和とは、次の図のように各地点までのデータの総和を計算したものです。メソッド名の cumsum は「cumulativesum(累積和)」の略です。ABC0...
Dataframe

strアクセサ

strアクセサとは、文字列が格納されたSeriesやIndexで使える機能です。strアクセサを介することで、「文字数をカウントする」「指定した文字列を置換する」といった文字列処理でよくある操作を簡潔に記述できます。具体的な例を見てみましょ...
Dataframe

applyの使い方 演習②

変数result_srの作成:各科目の列(国語、 数学 、理科、社会)について 「勉強時間の合計/勉強した日数」 を計算して、結果のSeriesを変数result_srに格納してください。importpandasaspd#科目ごとの勉強時間...
Dataframe

df.apply() の関数の考察

1.関数は列方向に作用するdf.max()→列ごとの最大値がリターンする。2.関数を組み合わせると、列ごとに関数の計算が行われる。defcalc_range(column):#最高点と最低点の差を計算する関数#引数columnには各列のSe...
Dataframe

DataFrame apply() 一つ一つのセルの値を参照

importpandasaspd#科目ごとの勉強時間データの読み込みdf=pd.read_csv("dataset/exercise_study_log.csv")df日付国語数学理科社会02022/1/1143245012022/1/20...
Dataframe

applyの使い方演習

演習①来場日来場者の年齢割引利用02022/1/120450円12022/1/112なし22022/1/249500円32022/1/260200円42022/1/330なし列割引額の追加:次のルールにしたがって新しい列割引額を追加してくだ...
Dataframe

apply/axis=0 行方向への使用

行方向の処理を行いたいときは、引数axisに0を指定します。なお引数axisのデフォルト値は0なので、未指定の場合も自動的に行方向の処理になります。以下に、行方向の処理と列方向の処理の違いを再掲します。0:行方向の処理。関数の第1引数には列...
Dataframe

apply()を使って複数の列にデータ処理

複数の列や複数の行の値を使いたい場合はどうすればよいでしょうか。たとえば、次のようなケースです。列支払い総額と列年齢の値に応じて、ユーザーをカテゴリー分けしたい列商品の金額と列購入者数に応じて、商品をカテゴリー分けしたいこのような場合、Da...
Dataframe

列の値への関数の適応 Seriesのapply

列支払い総額の値に応じて、複雑な条件で顧客区分を求める。列住所の文字列から、都道府県の部分だけを抽出する。列受験科目の値に応じて、合格点の閾値を変えて合否を求める。このような、より柔軟なデータ処理が必要なケースではapply()が便利です。...
Dataframe

データの置換 map()

データの前処理では、条件ではなく何らかの対応付けにしたがって置換したいことがあります。たとえば、次のようなケースです。アンケートの結果(反対/どちらでもない/賛成)を数値(-1/0/1)に変換する都道府県コード(01、13など)を、人間がわ...