2022-04

Dataframe

applyの使い方演習

演習①来場日来場者の年齢割引利用02022/1/120450円12022/1/112なし22022/1/249500円32022/1/260200円42022/1/330なし列割引額の追加:次のルールにしたがって新しい列割引額を追加してくだ...
Dataframe

apply/axis=0 行方向への使用

行方向の処理を行いたいときは、引数axisに0を指定します。なお引数axisのデフォルト値は0なので、未指定の場合も自動的に行方向の処理になります。以下に、行方向の処理と列方向の処理の違いを再掲します。0:行方向の処理。関数の第1引数には列...
Dataframe

apply()を使って複数の列にデータ処理

複数の列や複数の行の値を使いたい場合はどうすればよいでしょうか。たとえば、次のようなケースです。列支払い総額と列年齢の値に応じて、ユーザーをカテゴリー分けしたい列商品の金額と列購入者数に応じて、商品をカテゴリー分けしたいこのような場合、Da...
Dataframe

列の値への関数の適応 Seriesのapply

列支払い総額の値に応じて、複雑な条件で顧客区分を求める。列住所の文字列から、都道府県の部分だけを抽出する。列受験科目の値に応じて、合格点の閾値を変えて合否を求める。このような、より柔軟なデータ処理が必要なケースではapply()が便利です。...
Dataframe

データの置換 map()

データの前処理では、条件ではなく何らかの対応付けにしたがって置換したいことがあります。たとえば、次のようなケースです。アンケートの結果(反対/どちらでもない/賛成)を数値(-1/0/1)に変換する都道府県コード(01、13など)を、人間がわ...
Dataframe

データの置換

データの前処理では、何らかのルールに基づいてデータを置換したい場面が多々あります。たとえば、次のようなケースです。ある値以上のデータは外れ値として扱い、上限値で置換したい。コード番号(01、13など)で表現されているデータを、人間が見て意味...
Dataframe

queryメソッドを使って条件を組み合わせる

query()メソッドを使って複数の条件を組み合わせる書き方を学びます。NameHeightWeight0佐藤172531田中160502鈴木165583長谷川16065「Weightが55以上、かつ、Heightが160以下」の行は以下の...
Dataframe

条件1または条件2

「条件1、または、条件2」は、|を使って次のように書けます。(条件1)|(条件2)Pythonではブール値の「または」にorを使いますが、pandasの絞り込みでは|を使うことに注意してください。※&や~同様、|もビット演算子です。|による...
Dataframe

複数の条件をかつで組み合わせる方法

まずは、2つの条件を「かつ」で組み合わせる方法を学びます。「条件1、かつ、条件2」は、&を使って次のように書けます。(条件1)&(条件2)Pythonではブール値の「かつ」にandを使いますが、pandasの絞り込みでは&を使うことに注意し...
Dataframe

条件の否定

条件の式に「~」(チルダ)をつけることで条件の否定になります。否定とは、TrueとFalseを反転させる演算です。NameAge0Alice171Bob242Carol29前クエストでは、「Ageが20以上」の行を次のように指定して絞り込み...