Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理
Jimmy Lin, Chris Dyer
流行のMapReduce は力技で大量のデータ処理ができるが、だからといってなにも工夫が必要でないわけではない。かいてみると以外に制約も多く、なかなか思った通りのことを書けなかったりする。本書は、そのような場合に適用できるさまざまなテクニックを、具体的なデータアルゴリズムに沿って紹介している。英語版は、PDFがここで公開されている。
原題「Data-Intensive Text Processing with MapReduce」。コードサンプルは擬似コードで書かれているだけで、Hadoopコードは全然出てこない。そのせいで、わずか170ページ程度の本だが、非常に内容が濃い。そのかわり、初学者にはちょっと敷居が高いかもしれない。
著者のJimmy Linとはちょっとお会いしたことがある。若いのにすでにTenureを持っている俊才で、いまはサバティカルでTwitterにいるらしい。こういうことができるところが、アメリカのいいところだよなあ。。
監訳者のお一人はノーチラスの「社長」神林さん。
Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理
posted with amazlet at 12.04.19