2014年3月11日火曜日

二つのアルゴリズム

kshara です。今日の私の Mynd "Daily" より、話題の STAP 細胞の記事三つ。


今、話題の STAP 細胞ですが、今日のテーマはこの三つの記事を選んだ推薦エンジンのアルゴリズムについて。

気付いている Mynd ユーザもおられるでしょうが、"Daily" で推薦される記事はある程度、同じジャンルの記事が並んで表示されているはずです。これは、ある種の記事分類が行われているからです。

でも、今日の私の "Daily" では上の三つの記事が、離れた三個所にばらばらに表示されました。つまり分類機はこの三つを違うジャンルに分けたのです。これはなかなか興味深いところで、人間から見ればこの三つは同じ「STAP 細胞疑惑」関連の記事ですが、Mynd エンジンはそう思わなかった、ということですね。

言われてみれば、一番目の記事はディープな電子掲示板への投稿、二番目の記事はマスメディア、三番目の記事は英語のブログです。共通の語 "STAP" などが含まれているものの、違うジャンルだ、と判定することもありうるでしょう。これを同じトピックだと判断するほど我々の分類アルゴリズムは賢くない。

しかし一方で、この三つの記事を私が読みたいだろう、と推薦エンジンは推測し、それは当たっている。これは Mynd にもう一つのアルゴリズムが組込まれているからです。

つまり、記事の性質で粗く分類し、ユーザが好みそうなジャンルの内部で、さらにユーザの嗜好性を反映させる、という二重のアルゴリズムが "Mynd" の味噌。とは言え、今日の例が示すようにまだまだ不完全で、常に改善を目指して試行錯誤が続けられています。

「あなたのほしいニュースを引き寄せる」 Mynd は、ご利用無料。 こちらから
このエントリーをはてなブックマークに追加