Archive for the ‘日記’ Category

万能な表現方法はない

水曜日, 5月 8th, 2019

論文・書籍・解説記事・事例集等、あれこれ何かを学ぶための「教材的なもの」はありますが、どれもこれも一長一短。一般的には人それぞれのそれまでに蓄積した知識であったり応用力であったり抽象力だったり、場合によっては文化的背景や育ってきた環境要因等の外部要因も含めて個々人の立ち位置は異なるので、誰かにとってベストであっても、それが他の人にもそうであるとは限らないのが当然。

「数学ガール」に何度も出てくる「例示は理解の試金石」もそうだし、理解を深めるためには自分で例示したり、それらを俯瞰したり、共通項探してみたり、あれこれ弄り倒すことが必要。別の言い方をすると「インプット(読む)だけでは理解度は深まらない」。

分かりやすく用意された解説記事(のようにみえるもの)がweb上に溢れ、それなりに何かを一点突破するような学習がしやすくなりつつありますが、単に例に触れてるだけだと「ハウツー本的な理解」に留まってしまいがち。極端な例をだすと、ハンマーは釘を打つために使う(それ以外の使い方は想像できない)とか、そういう理解の仕方をしてしまう。

そうならないためにも、教科書なりで「良くわからない表現」が出てきたなら、それがどういうことなのか弄り倒してみよう。

1回目のレポート

火曜日, 5月 7th, 2019

プログラミング1のレポート1回目採点。

print関数使ったり、変数使ったりするぐらいの内容ですが、
・「print(出力したい文字列)」みたいに、クォートを書き忘れたり。
・「name = (‘スライム’)」みたいに、関数呼び出し時の丸括弧との違いに悩んでたり。
・「print(‘ほげ’)」みたいに、全角半角で悩んでたり。
あるあるネタが散らばってます。

レポートにはエラーが出てもそのまま書いて、それをどう解釈してどう解決していったのかを書くようにと伝えてあるので、そこまで書いてあるなら減点なし(むしろ加点)してます。平均点は100点超えかな?。

全角半角問題は、Rictyとか紹介したら良かったか。

GW明け

月曜日, 5月 6th, 2019

今年のGWは体調崩しまくりで、前半はほぼ文字通りの引きこもり生活。眠りも浅くて数時間で目覚めるのを繰り返し。多分肉体的な疲れが足りてないんだろうなとは思いつつ、外で歩く気力なかったのでそのままダラダラしてました。

後半になって体調回復した後のご飯の美味しいこと。やっぱり美味しいご飯がないと人生不幸せだな。

モデル

木曜日, 4月 25th, 2019

デジタル大辞泉でいうところの3番目、「ある事象について、諸要素とそれら相互の関係を定式化して表したもの。」の方。

3年次実験のデータマイニング班で、ツールの一つとして機械学習外観する流れでモデルの話を。概念的な話だけでは伝わらないし、概観したいので、例示として線形回帰を題材に、
・何がモデルで、
・モデルを導入することで何をしたいのか、
・このモデルにおいて何をすることが学習なのか、
・機械的に学習させるにはどうしたら良いのか、
といった話をしてました。

実験なので手を動かす部分も用意しましたが、今はまだ勉強部分がメインですね。

AI人材?

水曜日, 4月 24th, 2019

AI人材25万人育成とか言ってましたが、実際にはその原理を理解するための数学等の基礎教育を広げるという話も耳にしたりして、良くわからないですね。

Azure AIを使うぐらいの話なら「一昔でいうところのOffice使う」に相当するスキルかもしれない。(それを国策としてやるのという疑問はあるけど)

少しはコードを書くレベル、例えば R, Python (Pandas), Octave ぐらいで「データの前処理」するとか、は後処理として好みの可視化を組み立てるとかのレベルもあるかもしれない。

もう少し踏み込むと、特徴量工学まで求められるレベル?。タスクによっては何も考えずにデータ丸投げしてもそれなりの精度を実現できつつあるけど、それなりに特徴抽出できると学習時間が段違いに早くなったり、モデルが小さくなったり(組み込み系でも余裕で動くとか)とかあるので、こちらのスキルはまだ暫くは需要が高いんじゃないかと想像。一方で、どういう特徴が有用なのかは問題次第なので、汎用的な知識としての力にまで結びつくかは怪しい部分もあるか。(使える部分も勿論あるし、むしろそういう「他分野での考え方・視点」が面白いのでもあるけどね)

更に踏み込むなら、機械学習のアルゴリズム自体の設計であったり、現場における実用を見据えたシステム化(スケールアウトするかとか、どういうタイミングでモデル更新するかとか、例外対応をどう組み込むかとか)のためのスキルとか、そのレベルだとまだ20年以上は求められるのかな。多分。

とかいろんなレベルがありますが、国策だか経団連だかが掲げる目標に向かって一斉沈没したとしても誰も反省しないし救済してくれないので、それなら学生個々人の学費支援とか、「何でもいいから学ぶこと支援するぜ」とかやってくれと思ったりもするな。

penalization term against overfitting

火曜日, 4月 23rd, 2019

データマイニング論は留学生いるので英語で輪読。私自身の英語練習になるのも悪くないですが、学生の演習として使って欲しいし、どこで躓くかは人それぞれなので質問して欲しい。ということで強制的に質問させてみてます。

先週は「授業終了後に質問した人をチェック」したこともあって、今週からは質問がそれなりに出てて、いい感じぽい。実際、発表資料では説明飛ばされてる箇所だったり、もしくは教科書でも省略している箇所についての質問が出たりしてて、面白いです。「何でここで log 導入するの?」とか。素朴な疑問から得られる学びは大きいので、どしどしやってください。

過学習の話についてはUnderfitting vs. Overfittingが掴みやすいはず。一つの解決策としてペナルティ項の導入という話については、Plot Ridge coefficients as a function of the regularizationか、Overfitting in Machine Learning: What It Is and How to Prevent It辺りが分かりやすいかな。

似ているモノを探す

月曜日, 4月 22nd, 2019

例えば「似ている文書」を探したい場合。文書に出てくる単語が共通しているほど似ている可能性が高いかな。一方で、「犬が好き」と「犬が好きな訳がない」みたいな文は意味的には真逆で、単純に単語だけでは難しい部分もあるし、主語が明示的でなかったり、その文書を書いた当時の流行だとかの背景情報次第で解釈が変わったりして、「似ている」といっても多種多様な意味合いがあって、理想的には「いい塩梅に処理して欲しい」。

上記は文書の例だけれども、それは対象が変わったとしても同様。機械学習だろうが統計処理だろうがアプローチによらず、蓄積された対象に対する深い理解をした上で何をどう用意(前処理)するかという部分はまだまだタスクが残されていて。その際にはアプローチの特性も踏まえないと困ることもある(困らないこともあるけど)。

AutoML Visionとか、プログラミング不要な機械学習プラットフォームも出てきつつあって、そこで済むタスクがどしどし増えていくのは間違いないでしょう。しかしまだまだ難しいタスクがあるのも事実。

ここ最近は、教育対象というか個人学習を支援するための「似ているものを探す」ことについてあれこれ考えてみてたり、関連技術調べたり、(ほんの少し)触ったり、している日々です。他にやることありすぎて時間なかなかとれないんですがが。

どうやって頑健な社会にする?

金曜日, 4月 19th, 2019

スーパーマンな話を引っ張ってみるなど。

互いに助け合うことで社会(組織)としての頑健性だか持続性だかを高めるとして、具体的にどうやればそういう状況に近づけられるのか。

システマチックな考え方というか、様々な事柄を専門職よろしくタスクとして切り分けることで、「求めている人材」みたいなものを明確にしてそれ以外は他の人の仕事。みたいな考え方も一つの道ではあって、UNIX哲学みたいなやり方で対応すると。

ただしこれには前提があって、「挑戦を称える文化」や「失敗を許容する文化」が大切。そういう「空気」も含めて教育だったりする訳なので、授業での課題レポートとかでは「教えていない取り組み」があったらとりあえず加点するみたいなことしたりしてます。

義務教育やそれ以前のところから、失敗許容する指導だか模索を推奨する指導にしてください〜。

総合職とかあれこれ一通りできるスキルが必要な社会?

木曜日, 4月 18th, 2019

大抵の人は何でもできるスーパーマン(ガール)という訳ではなくて、「平均的な人と比べた場合にはどうしても何かが劣る」ことが普通。そもそも平均値なり中央値なりってそれより上の人も下の人もいるってことだし、あらゆる項目で平均を上回るとなるとレアでしょう。UR引きたいなら金だせってことだし、金積んだとしても物理的な人間は有限なので来てくれるかどうかは分からない。

誰でも劣った部分はあるわけで、社会(組織)としてはそれを前提として助け合うことで可動するように組むのがベター。システム工学的にはフェイルセーフ(障害時に安全側に制御する)フォールトトレラント(一部障害時に不便が起きても全体としては動作する)といった考え方を組み込むべき。

人間社会の例に戻すと、物覚えが悪いとか書類を間違えやすいとか、何かミスしがちな人がいることを前提として、組織を作るべきだし、そのような緩衝材も含めたゆとりのあるリソース(人や時間、もの)があるべき。そうしないとどんどん人材不足になるのは自明ですが、「何でもやれる人じゃないと嫌だとゴネる組織」が少なくない。そもそも私自身含めて何でもできるわけじゃない人のほうが圧倒的に多いのに、そこには目をつぶるという。

大学(に限らないかもだけど)は、財務省だか文科省だかの意向で予算が削られ、その分教職員を削られるけど、学生数が減るわけではないので授業を減らすことはできないし、時代と共に謎のタスクが増やしてくるしでより「ゆとり」がなくなってきて。その中でさらに「選択と集中」とかいう仕事やった感を出したいだけの戦略で何とかしようとする人たちがいて。組織づくりのこと考えられないならせめてゆとりを作ってくれと思うんだけれども。

社会なんだから助け合ってなんぼ。助け合えるだけのゆとりを〜。

ゼミxゼミxゼミ

水曜日, 4月 17th, 2019

水曜日は会議が重なりやすいので、他の予定を入れていないことが多くて。そのかわり、会議が全く入らなかった日は自由度が増します。ということで今日は授業準備&個別ゼミしまくってました。いつかはVRだかに完全移行できるかもしれませんが、なんだかんだでホワイトボードは便利。