Python備忘録

◎magic keyword

%matplotlib inline             グラフをnotebook内に表示

%config InlineBackend.figure_format = 'retina'   グラフを高解像度で表示

 

import pattern

import matplotlib.pyplot as plt

import pandas as pd

from sklearn import linear_model

 

 

python

type(object)                      組込関数      オブジェクトの型、取得

isinstance(object,型名)     組込関数       オブジェクトの型、判定

 

◎pandas

・pandas.DataFrame

df=pd.read_csv('URL')

df.columns = ['','','']          DF列名設定

df.columns                       DF列名表示

df.index                            DFすべての行名

 

df.groupby(["列名1","列名2"]).mean()      平均

df.groupby(''列名1").size()    各列のサイズ

df.describe()                    DFの全体像

df.dtypes                         データ型を調べる

df["新列名"]= df["元となる列名"] 新列名を追加

df["列名"].astype(str)      DFの列名のデータの型変換

 df["列名"].value             DFのデータをarray(行列形式にもなる)

DataFramevaluescolumnsindexの3つの要素から構成されている。

その名前の通り、valuesは実際のデータの値、columnsは列名(列ラベル)、indexは行名(行ラベル)。

df.loc[:,"列名"] =dt

 

print(df['name'].str.contains('li'))
# 0     True
# 1    False
# 2     True
# Name: name, dtype: bool

print(df[df['name'].str.contains('li')])
#       name  age state  point
# 0    Alice   24    NY     64
# 2  Charlie   18    CA     70

df[df['列名'].str.contains("文字列")]

  

 ・pandas.Series

 

 

 

 

numpy・・・配列を作るのが目的

a=np.array([1,2,3])           階数1の配列を作成

type(a)                              np arrayの型、判定

a.shape                             np arrayの行数と列数

 

a=np.arange(start値,end値,刻み)      範囲指定の配列を生成

・numpy で乱数を生成

np.random.seed(seed=32)   シードを32に設定して乱数を出力

np.random.rand()                  一様乱数を1個出力

np.random.rand(3)     一様乱数を3個出力

np.random.rand(3,4)             一様乱数を3×4の行列出力