Archive for the ‘日記’ Category

動作ベースの攻撃検知

火曜日, 3月 26th, 2019

iNetSec MPなお話。トラフィックやりとりの動作のみが対象になりますが、ミラーポート経由で動作ログを蓄積&分析し、異常検知っぽいことをやるらしい。ブラックリスト的なやり方ではないので、実際にまだ知られていないマルウェア(だったかな)検出した例が出始めてるとか。誤検出もあるだろうけども、そのあたりのチューニングどうするのかはまだ良く分からず。というか製品的には「検出=ブロックではない」ので、recallをどこまで高めにしたいかというユーザ側の希望も関わってくるのだろうな。

P.S.
有名だと思うけど知らない人もいるようなので、monument valleyオススメ。

新年度の授業準備

月曜日, 3月 25th, 2019

2019年度前期の担当は、プログラミング1、プログラミング演習1の一部(多分)、実験3(データマイニング班)、3年次向け工学科融合科目のサポート、大学院のデータマイニング論、です。

プログラミング1(Python)は、演習1の方が赤嶺先生に変わることで名目通りの「プログラミングの演習」も盛り込もうとしてくれているので、それに合わせた修正をしていく予定です。課題もそうだし、授業中にやってるペアプロの内容もそうだな。

データマイニング班の方は、このタイミングだとまだ3年次は機械学習の講義受講していないので、基本的には例年通りになる予定。ただし、旧実験班からずっと続けていた「開発依頼し、受託する形」は辞めにしてしまおうかと。主な理由は、「相手の意図を確認する」「こちらの意図を相手に伝える」部分が意図通りには機能していないように思えるのと、このシステムを残してしまうと最低2グループが必要なので人数調整が難しいから。前者の問題点はこちらの指導不足という点につきるのだけど、「実験」としては手を動かしてほしいところもあって、時間的に難しい側面も。とはいえ雑談してる時間はよくある(気分転換は必要だしそこから話が膨らむこともあるのであまり止めることはしない)ので、やっぱりこちらの指導不足なんだよな。

新科目になるデータマイニング(学部3年次向け)の方は、後期開講なのでこれから少しずつ具体的な資料作りをしていくつもり。できれば数週間で1コマ分は仕上げておきたいな。

データマイニングのシラバス検討2

金曜日, 3月 22nd, 2019

[ その1 ]

なるべく差別化をしようとすると、(a)応用編、(b)前処理テクニック、(d)自然言語処理編、(c)実践編あたりに分かれるのかな。

そろそろ大枠を固めようということで、上記(b)+(d)+(a)の組み合わせを想定してシラバス書き始めてます。教科書は指定せず、参考文献を提示し、メインはこちらで資料準備する予定。参考文献として予定しているのは以下の通り。

情報推薦や検索エンジン寄りの話、レビュー分析みたいな話も考慮中ですが、どこかへのおまけとして話すぐらいかしら。

NAL研ミニワークショップ&追い出し食事会

木曜日, 3月 21st, 2019

毎年恒例の「修了生による新配属性向けミニワークショップ」とは少し異なり、今年度は修了生がいない(前学期修了生のみだった)ため、卒業生中心に計画してもらいました。内容は「できるだけ手を動かす内容を含めてほしい」「必修科目以外はばらばらなので、それを踏まえてほしい」ぐらいのリクエストをしつつ、具体的な内容は一任。

当日の内容は、機械学習外観と自然言語処理を例にベクトル空間として表現する話で導入としつつ、ワークの部分はクラスタリング&可視化。何か一つでも響くものがあれば何より。

終了後は、ほぼ全員揃っての初の新配属生歓迎会&卒業生送別会ということで、うちなーイタリアンSOLAでご飯。お疲れ様でした。

卒業式

水曜日, 3月 20th, 2019

卒業式が終了。卒業/修了要件を満たす努力をしてきたことは事実ということで、これからは「あのときに比べれば」とか思い出しながら(?)楽しんでください。まずは自分が幸せに。そして余裕のある範囲で周りを幸せに。卒業=縁の切れ目ではないので、後輩のためにも気軽に遊びに来てください。

以下、卒業式ダイジェスト。

「平成最後の卒業式」
「皆さん、Hello World!」
「これからも繋がりを大切に」
「美味しいもの食べればなんとかなる」
「若気の至り」
「ダメかもしれない」

情報処理学会 第81回全国大会 day3

土曜日, 3月 16th, 2019

今日が全国大会最終日。IPSJ-ONEは学生に譲って、情報システムと社会環境(2)レビューとプログラム解析・修正に参加してきました。


[ 6K-02 対話ボットをベースとした行政と市民の新たなコミュニケーションチャネルの構築 ]

 予め用意したFAQをベースに、チャットボット対応するという話。法整備に伴う変更とかでちょくちょくFAQの内容が変わるので、変更のしやすさも考慮してる(Excel対応、、)らしい。対応がうまくいってるかを人が確認しつつ、必要に応じて不足FAQ整備するとかしてるとのこと。
 個人的には「文書からFAQを自動生成する」「矛盾探し」「常識(出身地毎の常識等)の違い探しに基づいたFAQ生成」みたいなことに興味あるかな。


[ 7N-02 コードレビューにおいて検出可能なプログラム課題の分析 ]
 コードレビューするのは量が増えると大変、レビューを受けてコード修正する側も「求められている修正」が良くわからない場合には大変、それらのコストを削減したいという話。システマチックにやれるところ(パーサーとか)はやるとして、そこ以外を対象にしようとしているようなんだけど、まだまだ難しそう。


[ 7N-03 ソースコード修正履歴を用いた自動バグ修正手法の性能理解 ]
 テスト自体を自動生成するという話もあるし、用意されたテストに対して「テストを通すようなパッチを自動生成する」という話もあるのだけど、今回はその後者をやってて結果としては「パッチ生成がうまくいかないケースは、テスト自体の質が良くないことが多い」という話らしい。人工知能でいうところの常識とか文脈とかのメタ情報をうまく組み込むことができればよいのかしら。


[ 7N-06 イベント駆動型アプリケーション開発のためのAPI使用パターンに関する対話型検索を支援するグラフベース視覚化ツールの検討 ]
 今日一番面白かった発表。APIリファレンスはあるけどそれをどう使うか。大抵は「組み合わせ」が重要で、それはコード例(実コード)を見た方が良いことが多い。が、それを上手く探す方法がないということで、APIの頻度パターンマイニングから包含関係まで抽出して、実コード例まで辿れるようなツールを試作してみたという話。一般的には asset search とか asset navigation と呼ばれるタスクらしい。

情報処理学会 第81回全国大会 day2

金曜日, 3月 15th, 2019

2日目は画像編集/GAN学習支援システム(2)に参加してきました。


[ 4R-02 アニメ画像を対象にした複数のスタイル画像を用いる画風変換の検討 ]

 NAL研M1西山くん発表。前回よりも質問コメント多く貰えてたので、目の付け所は面白いのだろうと思います。主な質問は以下の通り。
 Q: 変換結果良さそうに見えるが、数値的な評価は?
 Q: before/afterが見たい。どれぐらいアウトプットが変わるのか。例えば空だけを入れた場合にどうなる?
 Q: 4パッチ作る時のスタイル画像の位置によってアウトプットのイメージが変わる?
 Q: 従来手法の枠組み内で解こうとしているが、中身に手を入れる方が良いのでは? 例えば1枚入れて変換して、良くない場所は再変換or別変換するとかカスケード処理にするとか。


[ 4R-04 Deep Learning向けData Augmentationの評価手法の提案-Fréchet Inception Distanceに基づく方法- ]

 個人的に今日一番面白かった発表。機械学習する際にデータ不足やバランスの悪さがネックで学習が上手くいかないことが多々あります。これに対する一つのアプローチが「データ拡張」なんですが、拡張方法が多数提案されていること自体はともかく、どういうタスクにおいてどういう手法が向いているかも「やってみないとわからない」。そこをなんとかしたいという切り口で、「学習する前に拡張方法の良し悪しを見積もれないか」ということでFréchet Inception Distanceに基づいた検証を行ってみたという話。
 今回やってみた範囲内では比較的良好(かなり相関が高い)な結果が得られてるらしいけど、そもそものサンプル数が少ないケースでは過学習しそうなアプローチなんだよな。でも考え方はとても好きです。


[ 4R-07 Pix2Pixを用いた古典籍くずし字画像の裏抜け除去 ]

 今日2番目に好きな発表。「文字の芸術的品質とは何か?」という疑問に対して「主観的でわからないなら機械学習したら良いじゃない」的な考え方で取り組んだという話。
 実際問題として、データの与え方やモデルに依存する部分はあるとしても、一定程度の「芸術的品質」を抽出することはできるのだと思います。一つ一つの作品だけでもなく、同年代他作品との比較や、古い作品との比較から「何に影響を受けているか」とかもある程度は見積もれるようになるじゃないかな。それを人間が理解できる形で説明して欲しいよね。


[ 5ZH-05 ゼミ議事録と研究成果物の蓄積と利用の支援システムの開発 ]
 同じことやりたいと思ってて聞いてみたのですが、記録、特にメタデータの部分は人手で作成しているらしい。そこ自動化したいんだけどな。ある程度蓄積した後で自動化目指せば良いというスタンスなのかもしれないし、そこは自動化すべきではない(その過程自体に学びなどの効果がある)というスタンスかもしれないですが。
 ゼミに限らず「小さなコミュニティ」でありがちですが、「その場で通じる略語等の特殊な単語」というのがかなりあって。その辺りはword2vecとかと相性悪そうなんですが、一度wikipediaなりで学習済みモデルをベース+固定にして、層追加学習するだけでもなんとかなるのかしら。

情報処理学会 第81回全国大会 day1

木曜日, 3月 14th, 2019

今日から3日間福岡大学で情報処理学会全国大会。寒い時期の本土は、場所によっては暖房効き過ぎや室内外での寒暖差で気持ち悪くなることあるのがネックだな。

学会発表に限らないけど、外部で自分の機器持ち込む場合には要接続チェック。自分の番になってからうまくいかずにオロオロしてる人多かったな。

1日目はラーニングアナリティクスラーニングアナリティクスの2セッションに参加。どちらも教育に絡めた何かしらのデータ分析をしてる研究。身体や脳活動の計測、誰と誰が向き合ってるか、どのぐらい発話してるかといった様々なセンサ情報を組み合わせてログ分析し、より効果的な学びや反省に活用するとか。そういう話。

個人的に面白かったのは以下の2件。

[ 1ZF-02 プログラミング思考過程に基づくプログラミング時の行動分析と傾向 ]
 ジグソー・コードというタスクがあるらしい。設問と共に「行順番がランダムに入れ替えた正解コード」を用意して、入れ替えだけで正解コードに辿り着くタスク。この際の操作順番や回数、時間等を記録しておき、分析することで「プログラミング思考過程」をしたいということらしい。
 個人的には思考過程とは別のパズル要素が入ってる点と、このパズルを解けることとプログラミングスキルとの間にどのぐらい相関あるのか(高そうだけど)と、抜け落ちてる部分がどこか、が気になるかな。逆に言えば一部の過程は見れているはずで、そういう問題に落とし込んでる点は面白い。

[ 2H-02 プログラミング授業のための可視化システムと初学者の学習分析 ]
 paiza/progateみたいに「サーバ実行環境」用意することで、「どういう風にコードを編集していったか、実行しようとしたか、エラーを出したか」を可視化しやすくするしたという話。授業中はダッシュボード的に全員のログ解析してるので、同じエラーが重複しまくってたら「あ、補足し忘れてた」と教員が気づきやすいとか。用意した課題のどの辺りまで進んでるか俯瞰しやすいとか。
 自動採点はユニットテスト/Jenkins的にやればとも思うのだけど、微妙な違いは吸収したいらしく、クラスタリングベースでやってみてるらしい。

ストーリーが大事

月曜日, 3月 11th, 2019

そろそろ学会出張ということで、学生の発表練習。内容知ってる人が見聞きする分には理解できるのですが、そもそもの目標達成に向けたアプローチの前提話が抜けてたり、それを踏まえたとして何故こういうアプローチに至ったのか、それをどう検証しようとしたのか、といった辺りの一貫したストーリーとして話せていないという点であれこれ指摘。

『メッセージとストーリーのない発表はカスだ!』卒業論文・修士論文 プレゼンテーションの心得は学内発表での話ですが、基本は一緒ですね。ストーリーがわからないと枝葉の話だけになってしまって発表(討論)の意味が薄れてしまう。それでは発表をする側にとって実のあるコメントを貰えないし、発表を聞く側にとっても時間が勿体無い。発表する側の工夫で補える部分は補うべきだし、それが発表する側に求められる責任でもあります。

失敗しても良いんですが、実のある失敗するためにも練習が必要ってことですね。

分野を問わず最終講義は面白い

金曜日, 3月 8th, 2019

大学教授が定年により退官(退職とは呼ばないらしい)する年には、「最終講義」なるものをやることが多いです。絶対ではないし、実際やらなかった先生もみたことあるんですが。個人的には専門性の近さとは無関係に、単純に「その人がどう世界を見てて、それをどう解釈して、歩んできたのか」がとても楽しいので、都合つくときには参加するようにしてます。下手な映画やドキュメンタリーよりよっぽど面白いことが多いし。

今日のは建築系の小倉先生の最終講義「熱帯へのまなざし」。元々は本土出身で、当時たまたま琉大募集があったこと、またそのタイミングではまだ1期生1年目で共通科目しかなかったこと等が重なり、最初は留学しながら研究されてたとか。その際に「沖縄の暑さ」から始まり、根本的に違うこと、それを踏まえた建築を学びたいということでアフリカに興味を持ったらしい。そのために直接そこに行く前に、まずは最先端の何でも知ってるだろうということでイギリスに飛んで関連資料収集、研究者らとの討論。

そこで想定外だったのが、当時の西洋からすると「他はうちらのコピーに過ぎず、研究する価値ない」というのが大多数でそもそも知らないケースの方が多かったという事実。それに対して「イギリス・ルネッサンスはフランスなりのコピーじゃないの?」と言ったら黙ってしまい、コピーはあるにせよそれだけではないこと、環境や歴史的文化的背景に基づいた独自性もあるといった話に納得して貰え、討論が進んだとか。

ちなみに専門家自体はいて、亜熱帯地域における建築物系の最初の教科書を書いた先生らへヒアリングできたらしい(数年後亡くなられたとかで運が良かったのか悪かったのか、とにかくいい経験に)。十分準備ができたところでアフリカへ。行こうとしたら「え、現地行くのは危険すぎるだろ」と止められたとかw。その一方で、本気であることが伝わったらとても協力してくれて、現地の大学・研究所等へのコネクションを活用してあれこれ手配してもらえて、実際の現場活動はかなり助かったとのこと。その後はアジア圏にも進み、亜熱帯地域における自然的特性、認知的傾向、歴史的背景等を踏まえた分析と、それに基づく新しい建造物の設計等をやられてきたようです。

「呼吸する壁」みたいなやつの走りの時代ですね。まだクーラーがなく扇風機の時代だったり、そもそも電力も安定してない場所だったりで如何にして過ごしやすい、快適な建造物を実現するか。雨は通さないが風は通す壁とか、「手品のネタような工夫」と表現されてましたが、そういう設計も含めて楽しまれてきた研究生活だったようです。