パターン認識と機械学習の疑問点

P1.

機械学習では、まず訓練集合と呼ぶN個の手書き数字の大きな集合{x1,....,xN}をつかって、モデルのパラメータを適応的に調節する。ただし訓練集合の手書き数字のカテゴリは、あらかじめ人間が手で1つ1つラベル付けすることなどにより既知とする。

→教師データを作る。全部答え合わせ。

 

P2.

機械学習アルゴリズムによって得られるのは関数y(x)である。この関数に新たに数字の画像xを入力すると、目標ベクトルと符号化の仕方が等しい出力ベクトルyが出力される。この段階を訓練段階または学習段階と呼ぶ。

・長方形の小領域における画像強度の平均値は非常に効率的に計算できるので、そのような特徴集合は高速に顔を検出するのに極めて有効である。

 

P5.

・y(x,w) = w0 + w1*x + w2*x^2 + ... + wm*x^m

多項式y(x,w)はxの非線形関数であるものの、係数wの線形関数であることに注意。

多項式のように、未知のパラメータに関して線形であるような関数は非常に重要な性質を持つ。それらは線形モデルと呼ばれる。

・二乗和誤差の値が0になるのはy(x,w)が全訓練データをちょうど通るとき、またその時に限ることを注意。

・誤差関数は係数wの2次関数だから、その係数に関する微分はwの要素に関して線形になり、通常、誤差関数を最小にするだ1つの解を持つ。



二乗和を2で割る理由

・後で便利になる → 微分した際にでてくる2を打ち消すため。