Dataframe

Dataframe

データの置換

データの前処理では、何らかのルールに基づいてデータを置換したい場面が多々あります。たとえば、次のようなケースです。ある値以上のデータは外れ値として扱い、上限値で置換したい。コード番号(01、13など)で表現されているデータを、人間が見て意味...
Dataframe

queryメソッドを使って条件を組み合わせる

query()メソッドを使って複数の条件を組み合わせる書き方を学びます。NameHeightWeight0佐藤172531田中160502鈴木165583長谷川16065「Weightが55以上、かつ、Heightが160以下」の行は以下の...
Dataframe

条件1または条件2

「条件1、または、条件2」は、|を使って次のように書けます。(条件1)|(条件2)Pythonではブール値の「または」にorを使いますが、pandasの絞り込みでは|を使うことに注意してください。※&や~同様、|もビット演算子です。|による...
Dataframe

複数の条件をかつで組み合わせる方法

まずは、2つの条件を「かつ」で組み合わせる方法を学びます。「条件1、かつ、条件2」は、&を使って次のように書けます。(条件1)&(条件2)Pythonではブール値の「かつ」にandを使いますが、pandasの絞り込みでは&を使うことに注意し...
Dataframe

条件の否定

条件の式に「~」(チルダ)をつけることで条件の否定になります。否定とは、TrueとFalseを反転させる演算です。NameAge0Alice171Bob242Carol29前クエストでは、「Ageが20以上」の行を次のように指定して絞り込み...
Dataframe

locを省略した書き方

#locを使った書き方df.loc[:,列名または列名のリスト]#locを省略した書き方(上記と結果は同じ)df[列名または列名のリスト]pandasでは、このように同じ処理を複数の方法で書けることがあります。次のように書くことで指定した条...
Dataframe

条件で行や列を絞りこんで更新

前問では、df.locとすることで特定の条件で行を取得できることを学びました。同じ記述を使って、次のように新しい値に更新もできます。df.loc[比較結果]=新しい値=1つは定義NameAge0Alice171Bob242Carol29下記...
Dataframe

条件による絞り込み

pandasでは、特定の条件でDataFrameの行を絞り込めます。仕組みは以下のようになります。列と比較演算子を使って、特定の条件から「比較結果」を作成するDataFrame.locを使って、「比較結果」がTrueになる行を取得する具体例...
Dataframe

DataFrameへの列の追加

下記の書き方は、列名が存在していても存在していなくても使えます。df[列名]=...列名が存在するときは、値を更新します。列名が存在しないときは、新しい列を作成します。前クエスト「DataFrameの列の更新」では、計算したBMI(ボディー...
Dataframe

DataFrameに値を代入する

たとえば、DataFrameであるdfのある列に同じ値を代入するとき、下記のように行数分の要素のリストを使います。df[列名]=[同じ値,同じ値,...,同じ値]NamePoint0Alice171Bob242Carol29dfの列Poin...