はじめのパターン認識第一章まとめ

学習の流れ



  • 人間の認識は、単にモノを見るだけではなくそのモノの特徴を捉えて、それが何であるかを認識している。

  • モノの特徴と結論との関連付け(識別規則)を「学習」する。

  • みにくいアヒルの子定理

    • 特徴量に対して重みを考慮しないといけない。やみくもに特徴をとればいいってもんじゃないよ。



ポイント

特徴抽出は大切。


特徴の種類


それぞれの特徴の和と差の意味がないもの


  • 名義尺度:ラベル(名前、地名)で表すもの。
    解析方法: 最も頻出しているものは?  表現方法: 文字列、ダミー変数


  • 順位尺度:1位、2位、3位など
    解析方法: 最も出現する順位は? 表現方法: 数値



和と差に意味を持つが変動の日に意味がないもの


  • 間隔尺度:日付、テストの点数
    ※日付の数値(7日、14日)の差(7日間)には意味を持つが、7と14には意味を持っていない。
    解析方法:平均や分散を計測することが可能
    表現方法:数値


和と差に意味を持ち、かつ変動の比重にも意味を持つ


  • 比例尺度:身長、体重、絶対温度
    解析方法:最も頻出しているもの、差の平均や分散を取得できる
    表現方法:数値


次元の呪い



  • 特徴をとればとるほど、次元が増加⇨特徴がきちんととれなくなる。


第一章まとめ



  • 人間はモノ(オブジェクト)そのものを見て認識しているのではなく、特徴で認識している

  • 特徴を規則に対応させるために「学習」を行う

  • 特徴の尺度が複数あり、それぞれ解析する操作方法がある。

  • 特徴をとりすぎればよいというものではない。

  • 適切な特徴を適切なだけとり、かつ適切な形で解析操作を行うこと


次回からは


はじめてのパターン認識

はじめてのパターン認識