DataFrameの要素の形

Seriesは、要素の型を属性として持っています。たとえば、整数が格納されたSeriesの場合、要素の型はint64になります。
また、Seriesの要素の型は必ず1種類になります。たとえば、整数と浮動小数点数が混じったデータからSeriesを作成した場合、dtypeはfloat64になります。

Seriesの要素の型はdtype属性で確認できます。

演習

import pandas as pd

df = pd.DataFrame(
    [["Alice", 17], ["Bob", 24], ["Carol", 29]],
    columns=["Name", "Age"],
)
df
NameAge
0Alice17
1Bob24
2Carol29
print(df.dtypes)
Name    object
Age      int64
dtype: object

1つの列(Series)の型を確認します。

print(df.Age.dtype)
int64
df.Age.dtype
dtype('int64')

Seriesの各要素は、すべて同じ型を持つことを覚えてください。

列Ageには整数の要素が格納されているため、型はint64になりました。int64の詳しい説明は省略しますが、ここでは整数を表す型とだけ知っていれば大丈夫です。

列Nameには文字列の要素が格納されているため、型はobjectになりました。これは「任意の型」を意味しており、文字列のデータの型は、通常、objectになります。

※ str(df.Name.dtype)で文字列化するとobjectですが、repr(df.Name.dtype)による表現はdtype(‘O’)です。dtype(‘O’)は、objectを意味しています。dtype(…)はNumPyで定義されている型ですが、最初は気にしなくて大丈夫です。

コメント

タイトルとURLをコピーしました