集合知プログラミング

Toby Segaran

良書.多数のデータからなんらかの情報を導き出す,いわゆるデータマイニングの入門書,ということになるのだけど,よくある入門書とちがって,非常に実践的.Pythonによる実際のアルゴリズムの実装だけでなく,Web 上のデータを取得して,アルゴリズムに入力する方法も示されているので,すぐにでも実際のWebデータを使った実験ができてしまう.

紹介されているアルゴリズムも多彩で,クラスタリング,ニューロ,ベイジアンフィルタサポートベクターマシン,GA, GPまでカバーしている.そのかわり,当然個々のアルゴリズムに関する解説は浅めになってはいるのだが,それは個々の専門書をみればいい.個々のアルゴリズムのメリット,デメリットに関して,数学的詳細に立ち入らずに,直感的にアルゴリズムの概要が把握できるように書かれているので,専門書をいきなり読むよりも分かりやすいぐらいだ.

日本語訳も適切で気になることはほとんどなかった.

実際にデータマイニングをやる場合にはしゃれにならない大容量データを高速に処理するという,まったく別の問題もおこってくるわけだろうけど,その部分はカバーされていない.

サンプルがPythonで書かれている点も(私にとっては)わかりやすかった.数式よりもプログラムのほうが分かりやすいし.Javaとかで書くよりも,プログラムが簡潔なので,アルゴリズムの説明にも適切だ.まあ,べつにRubyでもよかったんだけど.

集合知プログラミング
Toby Segaran
オライリージャパン
売り上げランキング: 3361