Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido

Python機械学習ライブラリ scikit-learn を使って、さまざまな機械学習アルゴリズムの使い方を学ぶ。特徴的なのは、アルゴリズムの詳細には立ち入らず、使い方に重点を置いていること。とはいっても、ライブラリの使い方だけ説明しているということではなく、どういうケースにどのアルゴリズムが適しているかを、実例を交えて詳細に論じている。

モデルの複雑さと過剰適合の関係など、機械学習において基本的な概念もわかりやすく説明している。特徴量の作り方や、パラメータ調整の実際に関しても詳しく述べられている。特に、特殊な扱いが必要なテキスト処理の基礎も示されている。日本語に適用するには、形態素解析など一手間かかるが、これ一冊でゆるい卒論ぐらいまではカバーできそう。scikit-learnも国内ではまだあまり流行っている感じではないが、すごく良くできているので、今後普及するのではないだろうか。

縁あって、翻訳させていただいた。Python機械学習という本はたくさんあるけど、その中でもなかなかの良書かと。よろしければぜひ。