似ているモノを探す

Share on:

例えば「似ている文書」を探したい場合。文書に出てくる単語が共通しているほど似ている可能性が高いかな。一方で、「犬が好き」と「犬が好きな訳がない」みたいな文は意味的には真逆で、単純に単語だけでは難しい部分もあるし、主語が明示的でなかったり、その文書を書いた当時の流行だとかの背景情報次第で解釈が変わったりして、「似ている」といっても多種多様な意味合いがあって、理想的には「いい塩梅に処理して欲しい」。

上記は文書の例だけれども、それは対象が変わったとしても同様。機械学習だろうが統計処理だろうがアプローチによらず、蓄積された対象に対する深い理解をした上で何をどう用意(前処理)するかという部分はまだまだタスクが残されていて。その際にはアプローチの特性も踏まえないと困ることもある(困らないこともあるけど)。

AutoML Visionとか、プログラミング不要な機械学習プラットフォームも出てきつつあって、そこで済むタスクがどしどし増えていくのは間違いないでしょう。しかしまだまだ難しいタスクがあるのも事実。

ここ最近は、教育対象というか個人学習を支援するための「似ているものを探す」ことについてあれこれ考えてみてたり、関連技術調べたり、(ほんの少し)触ったり、している日々です。他にやることありすぎて時間なかなかとれないんですがが。