PandasはPythonでデータを扱う際に頻繁に使われるライブラリの1つです。Pandasを使うと、表形式のデータ(データフレーム)を扱いやすくなります。
方法1:head()メソッドを使う
データフレームの上から数行を表示するには、最も簡単な方法はhead()メソッドを使うことです。head()メソッドは、デフォルトで上から5行を表示します。
import pandas as pd df = pd.read_csv('data.csv') print(df.head())
上記の例では、data.csvファイルを読み込んで、先頭の5行を表示しています。
head()メソッドの引数に表示する行数を指定することもできます。たとえば、上から10行を表示する場合は、以下のようにします。
print(df.head(10))
方法2:ilocを使って行をスライスする
ilocを使うことで、任意の範囲の行を表示することができます。
print(df.iloc[0:5])
上記の例では、1行目から5行目までの5行を表示しています。
方法3:データフレームの先頭からn行目までを取り出す方法
データフレームの先頭からn行目までを取り出すには、以下のようにします。
n = 10 print(df[:n])
上記の例では、先頭から10行目までの10行を表示しています。
実践例:実際のデータフレームを使った上から数行の表示方法の適用例
以下は、実際のデータフレームを使った上から数行の表示方法の適用例です。
import pandas as pd # データの読み込み df = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv') # head()メソッドを使って先頭の5行を表示する print(df.head()) # ilocを使って0行目から4行目までの5行を表示する print(df.iloc[0:5]) # 先頭から10行目までの10行を表示する n = 10 print(df[:n])
まとめ
PandasのDataFrameから上位数行を取得する方法を紹介しました。
この方法はデータの内容をまず確認すると気によく使われるので、必要に応じて使ってみましょう。