Archive for the ‘日記’ Category

(不定期コラム) 「情報」って何だろう?

土曜日, 5月 18th, 2013

m_2013051819403451975aa25c67e

梅雨最中の貴重な晴れ間という一日で外出しやすい日でしたが、気温的には20度前後が過ごしやすいので早く冬が来ないかなという思いで綴る不定期コラム5回目は、大分古いですが「新世紀デジタル講義」からの引用出題です。10年以上前の情報教育関連講義をまとめた文庫本ということもあって古いキーワード/トピックもありますが、「積極的に拾い読み、トバシ読みををすすめるのは、それが、情報が氾濫する現代社会において、情報リッチに生き抜いていくためにまず身につけなければならない情報摂取の基本ワザであるからだ(同書, p.17)」など、現在でも通用する内容も豊富です。

ということで、書籍紹介を兼ねて宿題を引用してみます。

 情報学講義の最初の講義として、そもそも情報とは何なのかという問題を考えてみたいと思います。しかし、実はこれは大変むずかしい問題なんです。むずかしいけど大事な問題です。
 情報の確立された定義はありません。ーーということをまずしっかり認識してください。
 宿題を提出してください。

[宿題が三題提出されている]
 (1) 今日の日経新聞朝刊を読んで、何らかの意味で情報に関係がある記事を赤ペンで囲ってみる。
 (2) 情報という言葉がちがう意味で使われている短文を五つ考える。情報を含む四字熟語を五つ考える。
 (3) 自分なりの情報の定義を考えてみる。

 宿題は、本当にやったかどうか知りたいだけで、内容をチェックするようなことはしません。
こういう作業を自分でやってみることが大事なんです。目的は、情報という概念の広がり、情報と社会の接点の多さ、情報という言葉の定義のしにくさを知ってもらうことです。

(「新世紀デジタル講義」, pp.89-90 より引用)

この宿題は、第1章の講義「情報原論」の導入部分で出てきています。「情報」についての多数の定義例や歴史的背景を踏まえ、情報理論、デジタル、ノイマン型コンピュータ、人間という情報マシン、非ノイマン型、物質・エネルギーと並んで自然を構成する二大要素としての情報、、、と話が進み、「情報原論は、情報というものをこれくらい深くとらえるところからはじめるべきです。」と結んでいます。

斜め読みで構わないので一度は読んでみると良いんじゃないかな。>e13の皆さん

読書&映画を堪能した一日

金曜日, 5月 17th, 2013

m_201305171447055195c459ebc5f m_201305171727265195e9ee21c74

お休みですが普段通りに起きて普段通りに外出。梅雨なので屋内メインなのは確定するとして何しようかと考えたあげく久しぶりに映画鑑賞した以外は、のんびり読書してました。映画は映画館で見なくてもよいやと思う質ではあるんですが、気分転換という意味で年に数回ぐらいは映画館で見てるんじゃないかと。とはいえレンタルショップで探すのは怠いので、ネット宅配で見る方が多いです。

今日見たのは図書館戦争。3月の出張シーズン中に小説版を読んだばかり(当時、帯だかPOPに映画化とか書かれてたような気がしなくもない)の新参者ですが、新参者なりに復習もしてから臨んだこともあって映画冒頭数分で目頭が熱くなる塩梅。ちょっとしたシーンで小説版のあちこちが想起されます。実際には設定変わってたり想像してた人物像と違ってたりもしますが十分堪能できる範疇で楽しめました。続きやるなら絶対見る。アニメ版はまだ見てないのでそれはそれで楽しみにしておこう。

複数メディアで出ている作品として思いつくのは「ブレイブ・ストーリー」。「映画->漫画->小説(原作)」という順番で遡って見るのが個人的にはオススメというか自分がそうだったからそう楽しんだんですが、それぞれの作者・編集者がどこをどういう風に表現したかったかが見れたのが楽しかったです。そういう意味で、順番は違いますが図書館戦争のアニメ版も楽しみ。

合間の時間で読んでたのはやや古めのブルーバックス「変化をさぐる統計学―データで「これから」をどう読むか」。データをグラフ化して見やすくするところから始まり、時系列的なサイクルやトレンドを見つけやすくする均しとかを具体例出しながら回帰モデル、構造変化、ニューラルネットといったアプローチについて「イメージできる」レベルで対話が進んでいきます。タイトルにある「変化をさぐる」ことに興味が持てる人なら副読本として良いんじゃないかと。

データマイニング班6回目は脳裏に「M3」の2文字が明滅した人の話

木曜日, 5月 16th, 2013

m_201305161146295194488501595

明日はお休み! 有給取るのがヘタな人なので、休み取っても仕事したり、そもそも週末にちょこちょこ仕事してたりするんですが、やりたいことだけやれるので「休日の合間にやる」というのは割と捗るし。ここ最近の週末やら平日空いた時間は立ち上げたばかりのデータマイニング班準備ばかりですが、私自身体系的に勉強してきたという訳ではないのでいろいろ勉強になってます。

英語論文の書き方なるセミナーがあるらしい。院生以上が対象ですが、参加してみると良いんじゃないかと。前回と担当者が異なるようですが、こんな感じのセミナーでした。

ま、それはそれとして、明日の休みはどう過ごそうかなー。


データマイニング班の6回目は以下のような中身でした。

宿題やその場で書かせるコードのレビューでは、私自身Python使いまくってる訳じゃないこともあって、「確かにそう書いた方がイイネ!」がでてくるのは、学生的には嬉しいのか悲しいのか怪しい所だな。他の人のコードを見る&見られる機会という点では良いだろうし、そのためにやっているんだけど。

次元の呪い解説記事は10年ちょい前の記事ですが今でも全体としては通用する内容だし、私自身の言葉だけでは欠落してる部分を抑えられるのが良かった。間接的にはこの記事を読んでイメージできる程度の下積みはできつつあるということの確認もできて丁度良い塩梅。もう1,2回ぐらい解説記事を読む場が用意できると良さげか。

英語勉強を兼ねたscikit-learnチュートリアルは時間的に厳しかったので今回はパス。その分、チュートリアルの理解に必要な部分を抽出した例題をやったので、来週は英語やれるんじゃないかと。といいつつ、今回は一人一人チェックする課題を出してるので「課題チェック1時間、ゲストトーク20分」がほぼ確定で、実質的には他のことをやれる時間がどれぐらいあるかは謎だな。

曇りのち雷雨、所により竜巻警報

水曜日, 5月 15th, 2013

m_201305151221215192ff31ce4d5

久しぶりというか年に数回あるかぐらいに轟いてる雷鳴。雨が酷くなる前に帰宅してたので私は大丈夫でしたが、晩ご飯食べてる間に(1時間限定ぽいが)竜巻警報まで出ました。天候の荒れ具合は年々酷くなってる気がするけど、うろ覚えな体感レベルに過ぎないかもしれない。実際の所どうなんだろう。

mosの菜摘バーガーは、サラダもポテトも食べたい時とか、軽めに食べたい時にはアリな選択肢という印象。良く言えばちゃんと美味しい範疇にまとめてくれてるけど、悪く言えば想像の範疇。食べにくさは想定範囲内で収まってるし、そもそも通常版も食べやすい方ではないので気にならないレベルでした。

明日の実験の準備しなくちゃ〜。

P.S.
シュタインズゲートの小説版があることを聞いてAmazonさんでぽちぽちしてたら12冊8,627円分追加した所で「関連オススメ」が出なくなりました。ちょっと気持ちいいかもw

沖縄は避暑地

火曜日, 5月 14th, 2013

m_201305141158265191a85272f8f m_201305141733495191f6eddc731 m_201305141741445191f8c89fa05

各地で真夏日 沖縄は梅雨入りだそうです。蒸し暑いですが、気温的にはまだまだ大したことない中で「内陸を中心に気温がすでに30度前後まで上がっている」みたいなニュースを見るたびに沖縄は避暑地だよなと。県外の人と話す機会がある時にそういう話題を話すと信用されないですが。

先週末に予約を入れた初人間ドックの関連書類が届きました。予定通り5/24(金)なのは良いですが、「脱水予防のため朝6時頃までにコップ1杯の水飲んで」とか、事前に検尿検便が必要とか、アンケートがやたら多いとか既に投げ出したくなってきてます。前日夕飯早めに食べないといけないかと思ってたらそっちは割と時間に余裕があって9時前までなら問題無いらしい。一方で、それ以降はお茶含めて水以外は飲んじゃ駄目というのはちょっとキツい。一度はしっかり受けとこうという気持ちはあったからやりますが、2回目は当分ないなぁ。

久しぶりの通常モードでのゼミは、〆切があるもの以外はまったりモードに。気分一新を兼ねて個別ゼミを復活させようと思いつつ、来週までちょっと時間取りにくいのでやるのは5/27以降の週からだな。

[複雑研全体ゼミ補足記事] 5/13, ZMP姿勢制御、人のイメージに近い区切り方

月曜日, 5月 13th, 2013

m_2013051311531151905597b792d

実験1/スクリプトプログラミングの仮採点結果の通知メールを送付しました。特に問題無ければそのまま採点確定になる予定ですが、質問・相談してくる人がでてくるかは謎です。

ちゃんと出す学生は出しますが、例年の傾向として「再受講している学生は出さない傾向にある」のは相変わらずです。単位を取ること、卒業することが重要じゃないなら時間的にも金銭的にも勿体無いので素直に別の道を歩めば良いのにと思うんですが、そう簡単な話では無いらしい。そういう人の受け皿が社会には必要だとは思うんですが、うーん。

以下は複雑研全体ゼミを終えての補足記事です。


今日の全体ゼミ討論中に出てきたキーワード
 ・稲福政樹: [1] ZMP姿勢制御
 ・福里宏晃: [2] 人のイメージに近い区切り方
での関連話を補足します。

[1] RoboCup用ロボットNAOの姿勢制御, IPSJ 情報処理学会第75回全国大会
[2] 崩れた表記に対応する日本語形態素解析器の開発, 情報処理学会第75回全国大会


>ZMP姿勢制御

まだ特定目的を意図していないようなので、姿勢制御全般について絞り込まずにいくつかピックアップしてみます。

[3]によると、目標の位置姿勢に移動する制御のために絶対位置を論ずるための「地図生成や自己位置推定を同時に行う (通称SLAM)」という立場と、周囲の物体との相対的な位置関係だけで目標姿勢に移動する立場というのがあるようです。[3]自身は後者の相対的位置関係の一例で、視覚センサを用いつつ逆運動学を線形近似することで計算量を抑えつつ高精度に近似する線形ビジュアルサーボ(LVS)を用いた事例のようです。

より近いものだと、ロボット学会にて2足歩行ロボット技術についての特集記事 [4,5] があるようなので、山田先生にお願いしてみると良いんじゃないかと。

[3] 線形ビジュアルサーボによる全方向移動ロボットの位置と姿勢の制御, 日本機械学会論文集C編, Vol. 77 (2011) No. 774 P 460-469, https://www.jstage.jst.go.jp/article/kikaic/77/774/77_774_460/_article
[4] 「2足歩行ロボット技術」特集について, 日本ロボット学会誌, Vol. 30 (2012) No. 4 p. 335, https://www.jstage.jst.go.jp/article/jrsj/30/4/30_30_335/_article/-char/ja/
[5] 2足歩行ロボット技術の現在, 日本ロボット学会誌, Vol. 30 (2012) No. 4 p. 336-343, https://www.jstage.jst.go.jp/article/jrsj/30/4/30_30_336/_article/-char/ja/


>人のイメージに近い区切り方

形態素解析というよりは上記の言葉の方が適切に感じたのでこう書いています。

[6] では「腐女子/地味変/DVD/w」みたいなそもそも日本語と扱うのが適切かどうか良く分からない「語」について、使用者の偏りという点から「自然な日本語の選別」をやってみているようです。

[7] も文学寄りの事例ですが、「おお、そうじゃ、わしが知っておるんじゃ。」と喋らせるとその人は老人という人物像を思い浮かべる。というように、話者の人物像と密接に結びついた話し方の類型(=役割語、ヴァーチャル日本語)についての講演。方言の延長線上にあるようなものも多いけど、その一方では「〜〜だワン」「〜〜イカ?」とか実世界では存在しないものも多く、そういうことについて歴史的、言語学的に取り組んでいるみたい。

[8] は、今回の「平仮名だらけの文」に近いケースだと思いますが、絵本のテキストを対象として KyTea 能動学習してみた事例です。
[9,10] は IME を想定した事例で、内部的には「区切る」部分が出てきています。[10]はGoogle IMEの中の人です。
[11] は論文賞を受賞したもので、「片仮名列から単語列への変換」というタスクを構造予測問題として定式化し、言い換え(e.g., アンチョビソース->アンチョビのソース)や、逆翻字(e.g., ジャンクフード (junk food) と言えば)という事例を利用している事例です。

[6] 頻出語ではなく使用者が多い語が自然な日本語である, 言語処理学会 第19回年次大会 (NLP2013), C5-4,
[7] 役割語研究の現在, 金水 敏, NLP2013 招待講演2, https://ie.u-ryukyu.ac.jp/tnal/archives/3441#invited_talk2
[8] 絵本のテキストを対象とした形態素解析, 言語処理学会 第19回年次大会 (NLP2013), A6-4, 参加メモ: https://ie.u-ryukyu.ac.jp/?s=絵本#A6-4
[9] N-gram と N-pos のアンサンブルによるクラウド仮名漢字変換, 言語処理学会 第18回年次大会 (NLP2012), A1-1
[10] Web上のひらがな交じり文に頑健な形態素解析, 言語処理学会 第18回年次大会 (NLP2012), C5-3
[11] 言い換えと逆翻字を用いた片仮名複合語の分類, 自然言語処理, Vol.19, No.2, https://www.jstage.jst.go.jp/article/jnlp/19/2/19_65/_pdf

(不定期コラム) やって欲しいことを噛み砕いて伝える / プログラミング1

土曜日, 5月 11th, 2013

m_20130511113021518dad3d6e905 m_20130511114630518db1064a7d9 m_20130511115723518db393d84e9

ちょっと長めのコラム記事に対する印象を和らげる(?)ためのお食事写真は、久しぶりの tida cafe でパスタランチ。平日だとご飯ものしかないですが、週末は前菜が固定になる分メニューの幅が広がってて嬉しいです。平日でもランチタイムを外せばいろいろあるんだろうけど。

ということで、閑話休題。


プログラミング1で既に課題が出ているレベルに入ってきているようなので、不定期コラム4回目は趣向を変えてプログラミングを取り上げてみます。

何か仕事を頼む際、頼む相手が人間であれば言語や身振り手振り等を交えて指示を与える(お願いする)ことで目標を達成しようとします。例えば頼みたい仕事が「お茶を買ってきて欲しい」だとして、それを頼んだ相手に「ついでにお茶買ってきて」と伝えた状況を想定してみましょう。このぐらいの「アバウトな指示」でも、友人なり頼まれた人は外出ついでに何かしらお茶をどこかで手に入れて帰ってくることができます。そのお茶をどのように手に入れたら良いのか、販売しているならどこで購入したら良いのか、そこにどうやって辿り着けば良いのか、辿り着いたとして商品をどう探せば良いのか、探せたとしてどう商品を購入したら良いのか、etc., といった細々とした指示を与えることなく、目標を達成してくれるはずです。これは人間が普段の体験から構築蓄積した常識に頼っているからと言えますが、相手がコンピュータだとそのような常識がないため、コンピュータが理解できる言語で一つ一つ噛み砕いて指示する必要があります。

この「コンピュータが理解できる言語」が「プログラミング言語」です。普段使用している「日本語」と勝手が違うため様々な約束事を学ぶ所から出発しているはずですが、仕事を頼む手段は以下の3つが基本になります。

  • 逐次処理
  • 条件分岐
  • 反復処理

どのようなプログラミング言語であっても頼み方は上記3つのみで、これらを組み合わせることで指示を組み上げていきます。そのため、「仕事(やって欲しいこと)」を「3タイプの指示の組み合わせとして考え直す作業=設計(デザイン)」が必要になってきます。

上記を踏まえて、クイズです。

  • プログラミング以外にも「何かを作る」場面では設計が関わってくる。どのような設計手法があるだろうか?
  • 実装(プログラミングでいうならコーディング)の手間を省くため、設計段階でその良し悪しが分かると嬉しい。設計物(設計段階)においてその良し悪しをどのように評価することができるだろうか?
  • 同様にコストダウンという観点からは可能な限り再利用性を高めたい。すなわち、一連のコードを部品とみなして再利用したり、テンプレート化したい。再利用しやすい形で設計、またはコーディングするためにはどのような方法があるだろうか?

参考: プログラミングとはどのような作業か

enPiT説明会

金曜日, 5月 10th, 2013

m_20130510114300518c5eb40d37d m_20130510194303518ccf374f8d8

今日は休みを取るつもりだったんですが、ジブリ展がGWと共に終わってたことに気づいたので平常運転でした。しくしく。と泣くほど興味がある訳ではないですが、なんとなく行ってみたかっただけに残念。

初人間ドックを受診すべく申込してみるものの、手続き説明書と勝手が違って双方で混乱しながらも取りあえず予約はできました。バリウム飲んでみたかったんですが、人気が高い(?)のか空きがありませんでした。

午前中と夕方は空いてたのでレポート採点。「参照したのなら全て参考文献として列挙しろ」ということを毎回言ってますが、今回初めて参考文献として人名を列挙してる事例に遭遇。書式はともかく具体的にどこでどう関わったかとか書いてるしってことで加点しつつ、「こういうときは謝辞として書こう」とコメントするものの、週一の実験レポートでそこまでやるケースがどれぐらいあるのかは謎です。実際問題としては学生間で一緒にやることを推奨してるし、中身理解して書いてくれればそれで良いんですが。週明けには採点結果を通知できそうです。

午後はenPiTなるプロジェクトの説明会。流れとしては「事前学習+集中合宿+分散PBL」という3段階になってるらしく、修士1年生を中心に声かけしてるらしい。学外の学生、学外の先生(多くは民間出身)と一緒にやれるという所に面白みがあって、そういうところに興味を持てない人は自分勝手にやった方が良さそうという印象を受けました。プロジェクト型の演習は既に学内でもあちこちあるし。

How to Make (Almost) Anything (ほぼ何でもつくる方法)みたいな所を目指しているのかもしれませんが、琉大情報工学科が参画予定のenPit BizApp (ビジネスアプリケーション分野)を眺める限りでは、基本は情報系なのかも。それはちょっと残念というか、折角多くの大学巻き込んでやる割には勿体無い話だなと思ったり。一方で、ブルネイやベトナムだったか国外からの参画もあるらしく、そういう点でも興味のある学生は手を挙げてみると良いんじゃないかと。

データマイニング班5回目は具体的な評価の例

木曜日, 5月 9th, 2013

m_20130509123624518b19b913155

献血16回目記念?だかでタンブラーを貰えました。何となく欲しい気がしつつ自分で買うまででもないなという状況だったのでちょっと嬉しいです。使うかどうかは謎なんですが。


データマイニング班の5回目は以下のような中身でした。

詰め込み過ぎの気もしますが、時間的には予定通り早めに終われました。

宿題報告についてはコードを皆で眺めながら「マジックナンバー使うな」「リスト初期化しよう」「コメント書こう」とか補足。で、リスト内包表記についても補足する予定だったんですが、忘れてたのでメールでの補足をしておくことに。

開発的には「ドキュメンテーション(docstring)+ユニットテスト(doctest)+交差検定(のためのランダムなインデックス生成を通した分割と、平均スコア算出)」ぐらいの内容ですね。

来週はscikit-learnのチュートリアル続きを予定していますが、一つずつ丁寧に進めていくか、かいつまんでclassification/regression/clusteringの例を触ってイメージを掴むことを目標にするかぐらいで悩んでます。細かいこと気にせずにとっとと「やりたい具体例」について取り組んでもらう方向もありなんですが。何かしらデータセット構築して、分類学習させてから特徴抽出方法を見直すとか。

会議が長引いた一日

水曜日, 5月 8th, 2013

m_201305081142335189bb99a2fe3

明日の実験内容を考えつつ会議な一日でした。テストコードを卓上デバッグならぬ脳内デバッグしつつ、大雑把な道筋は決めました。具体的な資料をどこまで準備するかは明日の気分次第です。

お昼は大学会館にあるカフェテリアでフィッシュバーガー。数ヶ月前に店舗が入れ替わったという通知がどこかで流れてた気がするんだけど、同じお店でメニューが増えてるぐらいなのね。ご飯ものが結構増えてきてるので、今度はそっちも食べてみよう。献血車が来てたけど今日は時間が取れなかったので、明日やる予定です。

夕方には松田くんの個別ゼミ。「(テキスト文書の)意味や意図に興味がある」という所から出発してあれこれ「テキストに限らず表層的な情報から直接的に処理することが困難なタスク例」をブレスト的に出してみたり、タスクの問題設定例について例示してみたり。

プロジェクトデザインでの学内調査で研究室周り調べてるグループもいるようですが、NAL研の研究室紹介資料は一通り公開してるのでそっちからピックアップするとこういう事例に興味あるよとかあれこれ回答したり。ブログでもNAL研議事録として日々の話を書いてたりするしで、比較的オープンにしているつもりです。