[python]CSV読み込み(shift-jis、utf-8、ヘッダー)

Pythonはデータ分析に利用されるプログラミング言語の1つであり、CSVファイルを扱う際にもよく利用されます。CSVファイルはカンマやタブで区切られたテキストファイルで、データの格納や転送に利用されます。

CSVデータをPythonで読み込む方法

Pythonでは、CSVデータを扱うためのライブラリとして「pandas」があります。pandasを使うことで、CSVデータを簡単に読み込むことができます。

import pandas as pd
df = pd.read_csv('sample.csv')
print(df)

このように、read_csv関数を使ってCSVデータを読み込むことができます。

shift-jis形式のCSVデータの読み込み

CSVデータは、様々な文字コードで保存されています。shift-jis形式のCSVデータを読み込む場合は、read_csv関数のencodingオプションに「shift-jis」を指定します。

import pandas as pd
df = pd.read_csv('sample.csv', encoding='shift-jis')
print(df)

utf-8形式のCSVデータの読み込み

utf-8形式のCSVデータを読み込む場合は、read_csv関数のencodingオプションに「utf-8」を指定します。

import pandas as pd
df = pd.read_csv('sample.csv', encoding='utf-8')
print(df)

ヘッダーが存在するCSVデータの読み込み

CSVデータには、ヘッダーと呼ばれる列名が存在する場合があります。ヘッダーが存在するCSVデータを読み込む場合は、read_csv関数のheaderオプションに「0」を指定します。

import pandas as pd
df = pd.read_csv('sample.csv', header=0)
print(df)

ヘッダーが存在しないCSVデータの読み込み

ヘッダーが存在しないCSVデータを読み込む場合は、read_csv関数のheaderオプションに「None」を指定します。また、列名を指定することもできます。

import pandas as pd
df = pd.read_csv('sample.csv', header=None, names=['列1', '列2', '列3'])
print(df)

まとめ

Pythonのpandasライブラリを使うことで、CSVデータを簡単に読み込むことができます。CSVデータの文字コードやヘッダーの有無に応じて、適切なオプションを指定することが重要です。