Pandas Cheatsheet
数ヶ月ぶりにpandasを使うと基本すら忘れていることが多いので、チートシートを残しておきます。 なお、pandas (0.18.1) です。
データの読み込み
csvから読み込む。 先頭行のヘッダは自動で読み込んでくれます。
import pandas as pd df_train = pd.read_csv('train.csv', index_col='id')
numpyからDataFrameに変換する。
import numpy as np import pandas as pd pd.DataFrame(np.random.rand(3,2), index=[10, 11, 12], columns= ['x', 'y'])
Index(行)とColumns(列)
indexとcolumnsを設定する。
df.index = [1, 2, 3] df.columns = ['a', 'b']
columnでsliceする。
new_df = df['b']
新しいcolumnを追加する。
df['c'] = np.array(3)
columnを削除する。
df.drop('c', axis = 1)
データの書き出し
csv
df.to_csv('output.csv')
numpy
df.values