read_csv()
では、引数encoding
を使って文字エンコーディングを指定できます。
# 文字エンコーディングを指定して読み込み
df = pd.read_csv(ファイルパス, encoding=文字エンコーディング)
引数encoding
では、Pythonに標準で用意されている文字列が使えます。
たとえば、次のようなものです。
エンコーディング | 指定する文字列 |
---|---|
UTF-8 | "utf-8" |
Shift_JIS | "shift_jis" |
ASCII | "ascii" |
# エンコーディングを指定して読み込み
df_sjis = pd.read_csv("dataset/physical_measurement_sjis.csv", encoding="shift_jis")
df_sjis
StudentID | Name | Height | Weight | |
---|---|---|---|---|
0 | 1001 | 佐藤 | 172 | 53 |
1 | 1002 | 田中 | 160 | 50 |
2 | 1003 | 鈴木 | 165 | 58 |
3 | 1004 | 高橋 | 170 | 59 |
コメント