講義ノート

WebClass

第 1 回: シラバス (10.14.2010)

英語の Shadowing 勉強法

レポート 1 個

最後の発表

CD を聞くこと

第 2 回: (10.21.2010)

MRI ATR

母音 (vowel)

子音 (consonant)

IPA (国際音声字母) open close

front vowel (前舌母音)

back vowel (後舌母音)

central vowel (中舌母音)

Daniel Jones

第 3 回: (11.04.2010)

人間 50HZ ~ 400HZ

振幅: 声の大きさを表す

音色 = スペクトル (音声認識)

F0 パターン

OQ = A / (A+B)

KF (Kalman Filter)

WF (Wiener Filter)

第 4 回: (11.11.2010)

フォルマント (formant)

第 5 回

第 6 回

formanttrack.m (SELECTED_DATA.dat)

フォルマントの数は ( F1, F2, F3 (周波数小さいから~) )

注意: フォルマントの数は 3 個だけじゃなくて, F4, F5 もありうるが

レポートの作り方 ():

1. あいうえおの .dat ファイルを作る
2. 五母音を二軸にプロットする (http://d.hatena.ne.jp/tihara/20090218/p1)
3. 横軸 X: (フォルマント), 縦軸 Y: (周波数)

参考書: MATLAB マルチメディア信号処理 (上, 下 池原雅章)

wavplay(x1, 10000) 音が聞ける scatter(F1, F2, F3) %formanttrack2.m plot(x1) TGIF (Thank God It’s Friday)

第 7 回

1月6日の実験

舟木は不在です。

  1. iBookで、/a/,/i/,/u/,/e/,/o/,/aiueo/をWAV形式で録音する.
  2. 録音した音声でformanttrackを動かす.

wav 形式のファイルを読み込む関数wavread()を利用.

  1. F1-F2図をPLOTするMatlabプログラムを作成する.
  1. まではやりましょう。

(3) は完成しなくても, 道筋くらいはつけましょう. ある程度まで指導できる比嘉君は16時50分ごろに来ます.

  1. F1, F2, F3 の 3D 散布図を描く

3D フォルマント母音図

注意: a, i, u, e, o の歌声で, 認識にくい.

音声認識における分野では難しいところは:

  1. ノイズ除去 (難しい)
  2. からかな (それぞれを分別するのが)
  3. 中国語だと, 第 1, 2, 3, 4 声を分別するのが難しい.

EMD について調べる.

Empirical Mode Decomposition

EMD を用いた基本周波数推定

Fourier Transform

Hilbert-Huang Transform -> EMD

応用音響学においては: 信号処理 (フーリエ解析, スペクトル推定, サンプリング, etc) 数理統計学 (確率変数, 分布, 推定)

ベクトル量子化 - (高効率符号化の基礎理論) VQ, Vector Quantization

この手法はまずサンプルを N 個ずつ取り込み N 次元のベクトルとする, 全てのサンプルを取り込んだら, 次に符号化する数 K 個に各ベクトルに対してクラスタリングを行う.

LBG (Linde-Buzo-Gray 法) TwinVQ-MPEG-4 の音声圧縮に用いられている.

メタヒューリスティックス (Metaheuristics)

heuristics:

metaheuristics

焼き鈍し法 (SA, Simulated Annealing)

アルゴリズム 物理現象 コスト関数 エネルギレベル 暫定解 物理状態 最適解 基底状態 近傍探索 急冷 焼き鈍し法 徐冷

Temperature Scheduling (温度スケジューリング)

SA には, Temperature Scheduling を決めるのが一番大切

温度並列焼き鈍し法 (TPSA, Temperature-Parallel Simulated Annealing):

1. 複数の温度で並列に焼き鈍し
2. 高温で良い解が見つかれば, 低温の解と交換
3. 温度スケジューリング回避; 並列処理に向く

タブー探索 (TS, Tabu Search) には タブリスト (Tabu List) を維持する必要がある.

単純なタブーリストは記憶量大, 実行可能解の一部で表すと, 全部タブーリストに入れないと局所最適を脱出できない.

タブー寿命の難しさ: タブー寿命 L が短すぎると, 局所最適解周辺でループしやすい. タブー寿命 L が長すぎるとチックの手間が大きくなる. 近傍中にタブーでない解が少なくなる. 最悪の場合, なくなってしまう.

近傍の設計が肝要::
  1. 焼き鈍し法もタブー探索も, 小さな局所最適からは抜け出せるが, 大きな局所最適からは困難.
  2. 近傍をたどるだけで, 大域最適解に近づけるよう, 近傍を上手に設計することが肝要.
  3. 近傍の設計がうまくできていれば, 近傍探索でも良い解を得られる.

近傍探索, 焼き鈍し, タブー探索のいずれも, 一つの暫定解を改善していくのが原則. 群最適化

粒子群最適化 (Particle Swarm Optimization):

1. 生物の群が, 一匹が見つけた餌に群がるように
2. 多次元空間を粒子が飛び回る
3. 空間の各位置に適応度
4. 粒子は互いに情報交換 (近傍間 + 大域的)
5. 粒子の加速度は以下各項 * 正の乱数の線形和
  . 自分が過去に見つけた最良位置の方向へ
  . 近傍内の最良の方向へ
  . 大域的な最良位置の方向へ
6. よい位置の近傍は [よい] という仮定

組み合わせ最適化のどんなアルゴリズムでも, あらゆるコスト関数に適用した結果を平均すれば同じ性能になる.

問題とするコスト関数の性質を知って, それに適するアルゴリズムを用いるべし.

どんな手法でも近傍の設計が肝要.

乗り合い型交通システム コンビニクル

パターン認識とは 特徴ベクトル テンプレート照合法 線形識別関数 マルチtんプレート照合 NNC と k-NN k-means 法 学習結果の評価

効果的に漢字認識を行うために, よい特徴を抽出しないといけない.

自然は最適を選ぶ –> 変分原理

最適化の世界:

1. オペレーションズリサーチ (Operations Research)
2. 数理計画法 (Mathematical Programming)

モデリング + 理論 + アルゴリズム

Beautiful and Useful

  1. Dantzig, J. von Neumann, L.V. Kantorovich

モデリング: 線形近似でも実用上有用 理論: 双対定理 (主問題の最大値 = 双対問題の最小値) アルゴリズム: 単体法 (Simplex)

最適化の発展 (連続変数) 1947年 線形計画 1960年 非線形計画, ニュートン法 1970年 凸解析, 双対理論 1979年 楕円体法 1984年 内点法 1995年 半正定値計画

離散凸解析

最後までの試験とレポート::
1. 2. 3. 4. コンパイラのレポート 5. 数値解析 (非線形方程式を解く) 6. 並列処理のファイナルレポート 7. 人工知能 IPD のレポート 8. 英語の試験 9. 物理の試験

第 8 回

第 9 回

第 10 回

第 11 回

第 12 回

第 13 回

第 14 回

第 15 回

第 16 回