Python備忘録 - まとめ

◎magic keyword

%matplotlib inline グラフをnotebook内に表示

%config InlineBackend.figure_format = 'retina' グラフを高解像度で表示

◎import pattern

import matplotlib.pyplot as plt

import pandas as pd

from sklearn import linear_model

◎python

type(object) 組込関数オブジェクトの型、取得

isinstance(object,型名) 組込関数オブジェクトの型、判定

◎pandas

・pandas.DataFrame

df=pd.read_csv('URL')

df.columns = ['','',''] DF列名設定

df.columns DF列名表示

df.index DFすべての行名

df.groupby(["列名1","列名2"]).mean() 平均

df.groupby(''列名1").size() 各列のサイズ

df.describe() DFの全体像

df.dtypes データ型を調べる

df["新列名"]= df["元となる列名"] 新列名を追加

df["列名"].astype(str) DFの列名のデータの型変換

df["列名"].value DFのデータをarray(行列形式にもなる)

DataFrameはvalues, columns, indexの3つの要素から構成されている。

その名前の通り、valuesは実際のデータの値、columnsは列名（列ラベル）、indexは行名（行ラベル）。

df.loc[:,"列名"] =dt

print(df['name'].str.contains('li'))
# 0     True
# 1    False
# 2     True
# Name: name, dtype: bool

print(df[df['name'].str.contains('li')])
#       name  age state  point
# 0    Alice   24    NY     64
# 2  Charlie   18    CA     70

df[df['列名'].str.contains("文字列")]

・pandas.Series

◎numpy・・・配列を作るのが目的

a=np.array([1,2,3]) 階数1の配列を作成

type(a) np arrayの型、判定

a.shape np arrayの行数と列数

a=np.arange(start値,end値,刻み) 範囲指定の配列を生成

・numpy で乱数を生成

np.random.seed(seed=32) シードを32に設定して乱数を出力

np.random.rand() 　一様乱数を１個出力

np.random.rand(3)　　　　　一様乱数を3個出力

np.random.rand(3,4) 　一様乱数を3×4の行列出力