Pandasでデータの絞り込み

pandasのDataFrameでは、df[条件式] のように書くことで条件に一致する行を絞り込めます。

たとえばdf[df[“A”] >= 30]とすると、「列Aが30以上の行」だけを絞り込みます。条件式にはPythonの比較同様、==、!=、>、<、>=、<=などが使えます。

https://images.pyq.jp/repo/prod/pandas_start_02_select/data_filtering_1.jpg
import pandas as pd

# データの読み込み
df = pd.read_csv("dataset/physical_measurement.csv")

df[条件式]という書き方を使って、身長が170cm以上のデータだけを抽出しましょう。実行すると、条件に一致する3行だけが表示されます。

# 身長が170cm以上の行だけを抽出
df_filtering = df[df["Height"] >= 170] df[条件]
df_filtering
NameHeightWeight
0佐藤17253
3高橋17059
7中村17665

条件にあう行だけ取り出される。

コメント

タイトルとURLをコピーしました