データマイニング班成果発表

Share on:

2020年度後期の3年次実験、データマイニング班の発表を以下の通り実施します。興味のある人はどうぞ参加ください。


  • 日時: 2021年2月2日(火), 4限目。
  • 場所: Zoom, Mattermostのwelcome_random_eventに周知します。
  • プログラム予定:
    • 14:40-14:45, 流れ説明
    • 14:45-15:05, Group 1
    • 15:05-15:25, Group 2
    • 15:25-15:45, Group 3
    • 15:45-16:00, 振り返り、残タスク確認
  • 発表内容
    • Group 1: 機械学習を用いた文字認識
      • 機械学習を用いた文字認識は主に畳み込みニューラルネットワーク(CNN)を用いた方法と、文字の特徴を選択し、識別する方法があることがわかった。そのため本実験では、上記の畳み込みニューラルネットワーク(CNN)を用いた方法と、特徴を選択する方法のK近傍法(KNN)、確率的勾配降下法(SGD)の方法を用いて実験を行い、どのような差があるのか調べた。また、どのような学習方法や処理を行うことで文字認識をしているのか、モデルの改善やパラメータの値の変更によって、精度を上げる方法はあるのかを実験し調べた。
    • Group 2: 3次元に拡張したリバーシの強化学習
      • 本文書は強化学習の中でもDQN(Deep Q-Network)法を用いたリバーシの強化学習を行った報告書である。各局面において置ける箇所にランダムに手を打つプレイヤーと、DQN法を用いて手を打つプレイヤーを対戦させ、ハイパーパラメータの変化によって勝率がどう変化するか実験を行った。実験に用いるリバーシは、一般的な平面のリバーシに高さを追加した3次元のリバーシである。ハイパーパラメータには、バッチサイズ、eの下限値を変化させるとした。
    • Group 3: 指紋認証を用いたCNNの手法についての模索
      • CNNの有用性や使用上の注意点を考察するため、fingerprintデータを用いて指紋認証の正答率を向上させる手法を模索した。指紋認証をするにあたって、公開されているコードを元に指紋認証の手法について理解を深め、その後エポック数やバッチサイズ、活性化関数の取り扱いやシグモイド関数を用いたコードを変更した場合の正答率の変化をみる。これらの変化がどの様な影響をもたらしているかを考察した。公開されているコードの正答率が十分に高く、それゆえ元コードの正答率は超えられなかった。そのため、実質的にCNNの正答率が下がる要因についての考察が主になる。