Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理

Jimmy Lin, Chris Dyer

流行のMapReduce は力技で大量のデータ処理ができるが、だからといってなにも工夫が必要でないわけではない。かいてみると以外に制約も多く、なかなか思った通りのことを書けなかったりする。本書は、そのような場合に適用できるさまざまなテクニックを、具体的なデータアルゴリズムに沿って紹介している。英語版は、PDFがここで公開されている。

原題「Data-Intensive Text Processing with MapReduce」。コードサンプルは擬似コードで書かれているだけで、Hadoopコードは全然出てこない。そのせいで、わずか170ページ程度の本だが、非常に内容が濃い。そのかわり、初学者にはちょっと敷居が高いかもしれない。

著者のJimmy Linとはちょっとお会いしたことがある。若いのにすでにTenureを持っている俊才で、いまはサバティカルTwitterにいるらしい。こういうことができるところが、アメリカのいいところだよなあ。。

監訳者のお一人はノーチラスの「社長」神林さん。