DataFrameは、2つの軸(インデックスと列名一覧)を持っています。
「各軸ごとのサイズをタプルにしたもの」を、pandasではDataFrameの形状といいます。インデックスと列名一覧のサイズなので、行数と列数に相当します。
同様に、Seriesの形状も、各軸ごとのサイズをタプルにしたものです。ただし、Seriesの軸は1つしかないので、形状の要素は1個(値は行数)です。
DataFrameやSeriesの形状(行数や列数)は、shape属性で確認できます。
DataFrameのshape属性は、(行数, 列数)というタプルです。Indexは含まれない
たとえば3行2列のdfの場合、df.shapeは(3, 2)です。
すなわち、行数はdf.shape[0]に、列数はdf.shape[1]になります。
演習
import pandas as pd
df = pd.DataFrame(
[["Alice", 17], ["Bob", 24], ["Carol", 29]],
columns=["Name", "Age"],
)
df
Name | Age | |
---|---|---|
0 | Alice | 17 |
1 | Bob | 24 |
2 | Carol | 29 |
DataFrameの形状を確認します。df
は3行2列なので、(3, 2)
になります。
print(df.shape)
(3, 2)
1つの列(Series)の形状を確認します。df.Age
の要素数は3なので、(3,)
になります。
print(df.Age.shape)
(3,)
コメント