Python備忘録
◎magic keyword
%matplotlib inline グラフをnotebook内に表示
%config InlineBackend.figure_format = 'retina' グラフを高解像度で表示
◎import pattern
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import linear_model
type(object) 組込関数 オブジェクトの型、取得
isinstance(object,型名) 組込関数 オブジェクトの型、判定
◎pandas
・pandas.DataFrame
df=pd.read_csv('URL')
df.columns = ['','',''] DF列名設定
df.columns DF列名表示
df.index DFすべての行名
df.groupby(["列名1","列名2"]).mean() 平均
df.groupby(''列名1").size() 各列のサイズ
df.describe() DFの全体像
df.dtypes データ型を調べる
df["新列名"]= df["元となる列名"] 新列名を追加
df["列名"].astype(str) DFの列名のデータの型変換
df["列名"].value DFのデータをarray(行列形式にもなる)
DataFrame
はvalues
, columns
, index
の3つの要素から構成されている。
その名前の通り、values
は実際のデータの値、columns
は列名(列ラベル)、index
は行名(行ラベル)。
df.loc[:,"列名"] =dt
print(df['name'].str.contains('li')) # 0 True # 1 False # 2 True # Name: name, dtype: bool print(df[df['name'].str.contains('li')]) # name age state point # 0 Alice 24 NY 64 # 2 Charlie 18 CA 70
df[df['列名'].str.contains("文字列")]
・pandas.Series
◎numpy・・・配列を作るのが目的
a=np.array([1,2,3]) 階数1の配列を作成
type(a) np arrayの型、判定
a.shape np arrayの行数と列数
a=np.arange(start値,end値,刻み) 範囲指定の配列を生成
・numpy で乱数を生成
np.random.seed(seed=32) シードを32に設定して乱数を出力
np.random.rand() 一様乱数を1個出力
np.random.rand(3) 一様乱数を3個出力
np.random.rand(3,4) 一様乱数を3×4の行列出力