Seriesは、要素の型を属性として持っています。たとえば、整数が格納されたSeriesの場合、要素の型はint64になります。
また、Seriesの要素の型は必ず1種類になります。たとえば、整数と浮動小数点数が混じったデータからSeriesを作成した場合、dtypeはfloat64になります。
Seriesの要素の型はdtype属性で確認できます。
演習
import pandas as pd
df = pd.DataFrame(
[["Alice", 17], ["Bob", 24], ["Carol", 29]],
columns=["Name", "Age"],
)
df
Name | Age | |
---|---|---|
0 | Alice | 17 |
1 | Bob | 24 |
2 | Carol | 29 |
print(df.dtypes)
Name object Age int64 dtype: object
1つの列(Series)の型を確認します。
print(df.Age.dtype)
int64
df.Age.dtype
dtype('int64')
Seriesの各要素は、すべて同じ型を持つことを覚えてください。
列Ageには整数の要素が格納されているため、型はint64になりました。int64の詳しい説明は省略しますが、ここでは整数を表す型とだけ知っていれば大丈夫です。
列Nameには文字列の要素が格納されているため、型はobjectになりました。これは「任意の型」を意味しており、文字列のデータの型は、通常、objectになります。
※ str(df.Name.dtype)で文字列化するとobjectですが、repr(df.Name.dtype)による表現はdtype(‘O’)です。dtype(‘O’)は、objectを意味しています。dtype(…)はNumPyで定義されている型ですが、最初は気にしなくて大丈夫です。
コメント