pandasはデータ解析に必要な機能を提供するPythonのライブラリです。pandasを使えば、リストといったPythonの基本的なデータ型をpandasのデータ構造に変換することができます。この記事では、pandasを使ってリストをどのように扱えるかについて解説します。
pandasでリストからSeriesを作成する方法
まず、pandasでリストからSeriesを作成する方法を紹介します。Seriesとは、pandasが提供する1次元のデータ構造です。
import pandas as pd # リストからSeriesを作成する my_list = [10, 20, 30, 40, 50] my_series = pd.Series(my_list) print(my_series)
上記のプログラムを実行すると、以下のような出力が得られます。
0 10 1 20 2 30 3 40 4 50 dtype: int64
リストからSeriesを作成すると、リストの要素がインデックスと値のペアになります。Seriesは、インデックスを指定して要素にアクセスすることができます。
# インデックスを指定して要素にアクセスする print(my_series[2])
上記のプログラムを実行すると、30という出力が得られます。
pandasでリストからDataFrameを作成する方法
次に、pandasでリストからDataFrameを作成する方法を紹介します。DataFrameとは、pandasが提供する2次元のデータ構造です。
import pandas as pd # リストからDataFrameを作成する my_list = [[10, "apple"], [20, "banana"], [30, "orange"]] my_df = pd.DataFrame(my_list, columns=["price", "fruit"]) print(my_df)
上記のプログラムを実行すると、以下のような出力が得られます。
price fruit 0 10 apple 1 20 banana 2 30 orange
リストからDataFrameを作成すると、リストの要素が行になります。columnsパラメータを指定することで、列の名前を指定することができます。DataFrameは、列名を指定して要素にアクセスすることができます。
# 列名を指定して要素にアクセスする print(my_df["fruit"][1])
上記のプログラムを実行すると、以下のような出力が得られます。
banana
リストを用いたpandasのデータ操作方法
pandasでは、リストを使ってデータを操作することができます。
pandasでリストによるデータのフィルタリング方法
リストを使って、pandasのDataFrameから条件に合うデータをフィルタリングすることができます。
import pandas as pd # DataFrameを作成する my_list = [[10, "apple"], [20, "banana"], [30, "orange"]] my_df = pd.DataFrame(my_list, columns=["price", "fruit"]) # priceが20以上のデータをフィルタリングする filtered_df = my_df[my_df["price"] >= 20] print(filtered_df)
上記のプログラムを実行すると、以下のような出力が得られます。
price fruit 1 20 banana 2 30 orange
pandasでリストを用いたデータの集計方法
リストを使って、pandasのDataFrameからデータを集計することができます。
import pandas as pd # DataFrameを作成する my_list = [[10, "apple"], [20, "banana"], [30, "orange"], [40, "apple"], [50, "orange"]] my_df = pd.DataFrame(my_list, columns=["price", "fruit"]) # fruitごとのpriceの平均値を計算する grouped_df = my_df.groupby("fruit")["price"].mean() print(grouped_df)
上記のプログラムを実行すると、以下のような出力が得られます。
fruit apple 25.0 banana 20.0 orange 40.0 Name: price, dtype: float64
まとめ
pandasを使えば、Pythonの基本的なデータ型であるリストをpandasのデータ構造に変換することができます。リストからSeriesやDataFrameを作成することで、pandasの機能を使ってデータを操作することができます。また、リストを使って、pandasのDataFrameからデータをフィルタリングしたり、集計したりすることができます。