MRI ATR
母音 (vowel)
子音 (consonant)
IPA (国際音声字母) open close
front vowel (前舌母音)
back vowel (後舌母音)
central vowel (中舌母音)
Daniel Jones
人間 50HZ ~ 400HZ
振幅: 声の大きさを表す
音色 = スペクトル (音声認識)
F0 パターン
OQ = A / (A+B)
KF (Kalman Filter)
WF (Wiener Filter)
フォルマント (formant)
formanttrack.m (SELECTED_DATA.dat)
フォルマントの数は ( F1, F2, F3 (周波数小さいから~) )
注意: フォルマントの数は 3 個だけじゃなくて, F4, F5 もありうるが
レポートの作り方 ():
1. あいうえおの .dat ファイルを作る
2. 五母音を二軸にプロットする (http://d.hatena.ne.jp/tihara/20090218/p1)
3. 横軸 X: (フォルマント), 縦軸 Y: (周波数)
参考書: MATLAB マルチメディア信号処理 (上, 下 池原雅章)
wavplay(x1, 10000) 音が聞ける scatter(F1, F2, F3) %formanttrack2.m plot(x1) TGIF (Thank God It’s Friday)
1月6日の実験
舟木は不在です。
wav 形式のファイルを読み込む関数wavread()を利用.
(3) は完成しなくても, 道筋くらいはつけましょう. ある程度まで指導できる比嘉君は16時50分ごろに来ます.
3D フォルマント母音図
注意: a, i, u, e, o の歌声で, 認識にくい.
音声認識における分野では難しいところは:
- ノイズ除去 (難しい)
- からかな (それぞれを分別するのが)
- 中国語だと, 第 1, 2, 3, 4 声を分別するのが難しい.
EMD について調べる.
Empirical Mode Decomposition
EMD を用いた基本周波数推定
Fourier Transform
Hilbert-Huang Transform -> EMD
応用音響学においては: 信号処理 (フーリエ解析, スペクトル推定, サンプリング, etc) 数理統計学 (確率変数, 分布, 推定)
ベクトル量子化 - (高効率符号化の基礎理論) VQ, Vector Quantization
この手法はまずサンプルを N 個ずつ取り込み N 次元のベクトルとする, 全てのサンプルを取り込んだら, 次に符号化する数 K 個に各ベクトルに対してクラスタリングを行う.
LBG (Linde-Buzo-Gray 法) TwinVQ-MPEG-4 の音声圧縮に用いられている.
メタヒューリスティックス (Metaheuristics)
heuristics:
metaheuristics
焼き鈍し法 (SA, Simulated Annealing)
アルゴリズム 物理現象 コスト関数 エネルギレベル 暫定解 物理状態 最適解 基底状態 近傍探索 急冷 焼き鈍し法 徐冷
Temperature Scheduling (温度スケジューリング)
SA には, Temperature Scheduling を決めるのが一番大切
温度並列焼き鈍し法 (TPSA, Temperature-Parallel Simulated Annealing):
1. 複数の温度で並列に焼き鈍し
2. 高温で良い解が見つかれば, 低温の解と交換
3. 温度スケジューリング回避; 並列処理に向く
タブー探索 (TS, Tabu Search) には タブリスト (Tabu List) を維持する必要がある.
単純なタブーリストは記憶量大, 実行可能解の一部で表すと, 全部タブーリストに入れないと局所最適を脱出できない.
タブー寿命の難しさ: タブー寿命 L が短すぎると, 局所最適解周辺でループしやすい. タブー寿命 L が長すぎるとチックの手間が大きくなる. 近傍中にタブーでない解が少なくなる. 最悪の場合, なくなってしまう.
近傍探索, 焼き鈍し, タブー探索のいずれも, 一つの暫定解を改善していくのが原則. 群最適化
粒子群最適化 (Particle Swarm Optimization):
1. 生物の群が, 一匹が見つけた餌に群がるように
2. 多次元空間を粒子が飛び回る
3. 空間の各位置に適応度
4. 粒子は互いに情報交換 (近傍間 + 大域的)
5. 粒子の加速度は以下各項 * 正の乱数の線形和
. 自分が過去に見つけた最良位置の方向へ
. 近傍内の最良の方向へ
. 大域的な最良位置の方向へ
6. よい位置の近傍は [よい] という仮定
組み合わせ最適化のどんなアルゴリズムでも, あらゆるコスト関数に適用した結果を平均すれば同じ性能になる.
問題とするコスト関数の性質を知って, それに適するアルゴリズムを用いるべし.
どんな手法でも近傍の設計が肝要.
乗り合い型交通システム コンビニクル
パターン認識とは 特徴ベクトル テンプレート照合法 線形識別関数 マルチtんプレート照合 NNC と k-NN k-means 法 学習結果の評価
効果的に漢字認識を行うために, よい特徴を抽出しないといけない.
自然は最適を選ぶ –> 変分原理
最適化の世界:
1. オペレーションズリサーチ (Operations Research)
2. 数理計画法 (Mathematical Programming)
モデリング + 理論 + アルゴリズム
Beautiful and Useful
モデリング: 線形近似でも実用上有用 理論: 双対定理 (主問題の最大値 = 双対問題の最小値) アルゴリズム: 単体法 (Simplex)
最適化の発展 (連続変数) 1947年 線形計画 1960年 非線形計画, ニュートン法 1970年 凸解析, 双対理論 1979年 楕円体法 1984年 内点法 1995年 半正定値計画
離散凸解析