pandasライブラリでリストを使いこなす方法

pandasはデータ解析に必要な機能を提供するPythonのライブラリです。pandasを使えば、リストといったPythonの基本的なデータ型をpandasのデータ構造に変換することができます。この記事では、pandasを使ってリストをどのように扱えるかについて解説します。

pandasでリストからSeriesを作成する方法

まず、pandasでリストからSeriesを作成する方法を紹介します。Seriesとは、pandasが提供する1次元のデータ構造です。

import pandas as pd
# リストからSeriesを作成する
my_list = [10, 20, 30, 40, 50]
my_series = pd.Series(my_list)
print(my_series)

上記のプログラムを実行すると、以下のような出力が得られます。

0    10
1    20
2    30
3    40
4    50
dtype: int64

リストからSeriesを作成すると、リストの要素がインデックスと値のペアになります。Seriesは、インデックスを指定して要素にアクセスすることができます。

# インデックスを指定して要素にアクセスする
print(my_series[2])

上記のプログラムを実行すると、30という出力が得られます。

pandasでリストからDataFrameを作成する方法

次に、pandasでリストからDataFrameを作成する方法を紹介します。DataFrameとは、pandasが提供する2次元のデータ構造です。

import pandas as pd
# リストからDataFrameを作成する
my_list = [[10, "apple"], [20, "banana"], [30, "orange"]]
my_df = pd.DataFrame(my_list, columns=["price", "fruit"])
print(my_df)

上記のプログラムを実行すると、以下のような出力が得られます。

   price   fruit
0     10   apple
1     20  banana
2     30  orange

リストからDataFrameを作成すると、リストの要素が行になります。columnsパラメータを指定することで、列の名前を指定することができます。DataFrameは、列名を指定して要素にアクセスすることができます。

# 列名を指定して要素にアクセスする
print(my_df["fruit"][1])

上記のプログラムを実行すると、以下のような出力が得られます。

banana

リストを用いたpandasのデータ操作方法

pandasでは、リストを使ってデータを操作することができます。

pandasでリストによるデータのフィルタリング方法

リストを使って、pandasのDataFrameから条件に合うデータをフィルタリングすることができます。

import pandas as pd
# DataFrameを作成する
my_list = [[10, "apple"], [20, "banana"], [30, "orange"]]
my_df = pd.DataFrame(my_list, columns=["price", "fruit"])
# priceが20以上のデータをフィルタリングする
filtered_df = my_df[my_df["price"] >= 20]
print(filtered_df)

上記のプログラムを実行すると、以下のような出力が得られます。

   price   fruit
1     20  banana
2     30  orange

pandasでリストを用いたデータの集計方法

リストを使って、pandasのDataFrameからデータを集計することができます。

import pandas as pd
# DataFrameを作成する
my_list = [[10, "apple"], [20, "banana"], [30, "orange"], [40, "apple"], [50, "orange"]]
my_df = pd.DataFrame(my_list, columns=["price", "fruit"])
# fruitごとのpriceの平均値を計算する
grouped_df = my_df.groupby("fruit")["price"].mean()
print(grouped_df)

上記のプログラムを実行すると、以下のような出力が得られます。

fruit
apple     25.0
banana    20.0
orange    40.0
Name: price, dtype: float64

まとめ

pandasを使えば、Pythonの基本的なデータ型であるリストをpandasのデータ構造に変換することができます。リストからSeriesやDataFrameを作成することで、pandasの機能を使ってデータを操作することができます。また、リストを使って、pandasのDataFrameからデータをフィルタリングしたり、集計したりすることができます。