Google 日本語入力

GoogleChrome OSで日本語入力どうするんだろう,と思っていたが,自前で作っていたとは.Androidは現在Wnnだと聞いているが,これも今後置き換えるのかな.作者の一人は知人なのだが,20%でこんな物を作れるってのは,すごい.さすが,taiyaki.

この件でちょっとショックなのは,変換に用いる辞書や言語モデルをクロールしたデータからデータマイニングで取得していること.研究レベルでは,似たような話をやっている人たちもいるのだけど,Webをクロールするのも,クロールしたデータを解析するのも自前の資源なので,なかなか研究が進んでいないように見受けられる.大規模データのハンドリングはそれだけで巨大なノウハウが必要な事業で,言語モデルの専門家が片手間にやるのは負担が大きすぎる.

これに対して,Googleの中の人ならクロールしたデータも使えるし,データの解析も共有する資源を使ってMapReduceとかで,がつんとできる.だからといって簡単にできるというわけではもちろんないのだけど,研究という意味でも,はじめからめちゃめちゃ立ち位置が違うわけだ.そして,今後この差が埋まることはなく,どんどん広がり続けるのだろう.

NIIの佐藤一郎さんがコンピュータサイエンスは「終わった」と言っている.この発言の趣旨は,大規模分散システムを研究するには,大規模分散システムを日常的に使える環境にいなければならず,それには,googleamazonかMSにいないとできないよね,ということ.

今回の日本語入力の件は,分散システムだけでなくデータマイニングの分野も,今後はGoogleにいないとできなくなる,という,考えてみれば当たり前のことを端的に示しているわけだ.

最近は優秀な学生が博士課程に進まず,Googleに行っちゃうという話しを大学の先生からよく聞くけど,まあ,研究者,エンジニアとしてよく考えてみれば当たり前の話だ.

今後,どうしたらいいんだろうね?