[python]CSVファイル読み込み(pandas、numpy、リスト、1行ずつ)

CSVファイルは、テキストファイルの一種で、カンマやタブなどの区切り文字でデータを分割した形式で保存されています。Pythonを使ってCSVファイルを読み込む方法について紹介します。

Pythonを使ったCSVファイルの読み込み方法

Pythonには、CSVファイルを読み込むための標準ライブラリcsvが用意されています。csvモジュールを使うと、CSVファイルを簡単に読み込むことができます。

import csv
with open('sample.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

この例では、csv.reader()関数を使ってCSVファイルを読み込み、1行ずつデータを取得しています。

Pandasを使ったCSVファイルの読み込み方法

Pandasは、データ分析に欠かせないライブラリであり、CSVファイルを扱う場合にもよく使われます。Pandasを使うと、CSVファイルをDataFrameという形式で読み込むことができます。

import pandas as pd
df = pd.read_csv('sample.csv')
print(df)

この例では、pd.read_csv()関数を使ってCSVファイルを読み込み、DataFrameとして表示しています。

Numpyを使ったCSVファイルの読み込み方法

Numpyは、科学技術計算に欠かせないライブラリであり、CSVファイルを扱う場合にもよく使われます。Numpyを使うと、CSVファイルをndarrayという形式で読み込むことができます。

import numpy as np
data = np.loadtxt('sample.csv', delimiter=',')
print(data)

この例では、np.loadtxt()関数を使ってCSVファイルを読み込み、ndarrayとして表示しています。

リストを使ったCSVファイルの読み込み方法

リストを使ってCSVファイルを読み込む場合は、csvモジュールを使います。

import csv
data = []
with open('sample.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        data.append(row)
print(data)

この例では、csv.reader()関数を使ってCSVファイルを読み込み、リストとして表示しています。

1行ずつCSVファイルを読み込む方法

CSVファイルを1行ずつ読み込む場合は、csvモジュールを使います。

import csv
with open('sample.csv', 'r') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)

この例では、csv.DictReader()関数を使ってCSVファイルを読み込み、1行ずつデータを取得しています。

各方法の利点と適用シーン

各方法には、それぞれ以下のような利点があります。

  • csvモジュールを使った方法:標準ライブラリであり、簡単に実装できる。
  • Pandasを使った方法:データ分析に欠かせないライブラリであり、データの加工・分析が容易。
  • Numpyを使った方法:科学技術計算に欠かせないライブラリであり、数値データの処理が容易。
  • リストを使った方法:csvモジュールを使った方法よりも柔軟にデータの加工・処理ができる。
  • 1行ずつ読み込む方法:メモリの使用量を抑えられる。

適用シーンは、以下のようになります。

  • csvモジュールを使った方法:小規模なデータの読み込みに適している。
  • Pandasを使った方法:大規模なデータの読み込みや加工・分析に適している。
  • Numpyを使った方法:数値データの処理に適している。
  • リストを使った方法:csvモジュールを使った方法では実現できないような、柔軟なデータの加工・処理が必要な場合に適している。
  • 1行ずつ読み込む方法:メモリの使用量を抑えなければならない場合に適している。

まとめ

Pythonを使ってCSVファイルを読み込む方法について紹介しました。各方法には、それぞれ利点と適用シーンがありますので、目的に応じて適切な方法を選択しましょう。