pandasのDataFrameでは、df[条件式] のように書くことで条件に一致する行を絞り込めます。
たとえばdf[df[“A”] >= 30]とすると、「列Aが30以上の行」だけを絞り込みます。条件式にはPythonの比較同様、==、!=、>、<、>=、<=などが使えます。
import pandas as pd
# データの読み込み
df = pd.read_csv("dataset/physical_measurement.csv")
df[条件式]
という書き方を使って、身長が170cm以上のデータだけを抽出しましょう。実行すると、条件に一致する3行だけが表示されます。
# 身長が170cm以上の行だけを抽出
df_filtering = df[df["Height"] >= 170] df[条件]
df_filtering
Name | Height | Weight | |
---|---|---|---|
0 | 佐藤 | 172 | 53 |
3 | 高橋 | 170 | 59 |
7 | 中村 | 176 | 65 |
条件にあう行だけ取り出される。
コメント