実験4・データマイニング班の発表会

Jan 28, 2020 イベント告知データマイニング班

試験期間中ですが、データマイニング班の発表会があります。興味のある人はどうぞ〜。

日時：2/4(火), 4限目
場所：地創棟508

Group 1：幸福の定義
概要：kaggleから拾ってきた「世界幸福度調査」を元に,約150ヶ国の幸福度データをとても高い(幸福),高い(準幸福),低い(準不幸),とても低い(不幸)の4つのグループに分類し,機械学習によってどのようにグループ分けされるかを決定木分析によって調査する。拾ってきた初期状態(前処理等をしていない状態)のまま学習させた結果と,前処理(One-hot, 特徴の追加)を行なった後の制度の比較を行い,どのような特徴が幸福度に影響を与えるかを考察する。

Group 2：表情識別実験~リアルタイム表情認識~
概要：今回の実験では「怒り」「嫌悪感」「恐怖」「幸せ」「悲しみ」「驚き」「中立」の７つのクラスのいずれかに属した35,887個のグレースケール画像の含まれたデータセットを用いてリアルタイムでの表情認識実験を行う.機械学習を進めていく際、学習器にCNN、parameterの調整にGAP(Global Average Pooling)、畳み込みの分離を用いて行う.表情認識に加えて、男性女性の識別も同時に行う.

Group G3：人工知能を用いた競馬予測
概要：今回の実験では競馬の順位を予測を目標に、機械学習を行なった。使用したデータは競馬のウェブサイトにあるデータを収集して使用した。実際使用したモデルはlightgbmという決定木アルゴリズムのような学習機をしようし、パラメーターチューニングを行いつつ予測精度の向上を測った。

Group 4：Adversarial 攻撃に抵抗性を持つモデル
概要：Adversarial attackはモデルが予測することを踏まえ、gradient noiseをかけてわざと予測値を妨害する攻撃である。最近プライベートなコミュニティにはイメージに特定のノイズを添加してイメージの流出時にイメージに添加されたノイズを識別子で犯人が誰だか見つけ出す方式のセキュリティ機能を多く使っている。このノイズは普通-3~+3の間のランダムなノイズで構成されていてその中に固有なコードが入っているというふうだ。ためにコミュニティを利用する利用者たちは皆が人間の目にはように見えるが、いずれも微妙に異なったイメージを見ているのだ。お互い違う利用者が持ったようなイメージを機械が同じ分類をしないことを見て、この研究アイデアを着眼することになった。識別子ノイズが偶然gradient noiseと同様になればなるほど、予測に対する妨害が大きくなる。ために、われわれはmodelがあるいはイメージがAdversarial attackに抵抗性を持たせ、ノイズについての備えをしなければならない。

Group 5：機械学習を用いたポケモンのタイプ判定 Season2
概要：前期実験の「機械学習を用いたポケモンのタイプ判定」の引き継ぎをする。前期実験のランダムフォレストとCNNの精度を改善しながら、他の学習器も用いてどのような結果になるか確認する。また、画像データを改造、重さの値を扱って、判定に影響が出るかを実験する。