徒然なる日々を送るソフトウェアデベロッパーの記録(2)

技術上思ったことや感じたことを気ままに記録していくブログです。さくらから移設しました。

「機械学習のための特徴量エンジニアリング」を読んで

機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン)

機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン)

通勤電車の中での読書だったので、薄い本であるにも拘わらず、読破に1.5か月
かかってしまった。

機械学習結果の精度および速度を向上させるには良い特徴量を選択する必要が
ある。本書ではテキスト解析、PCA、k-means、画像特徴量を取り上げて解説して
いる。サンプルとして python コードを掲載しているので、説明結果を追体験可能に
なっている。

各章は基礎的なレベルまで掘り下げて解説しているが、アルゴリズムの基本的な
考え方の説明に注力しており、厳密な説明とはなっていない。
とは言うものの、私は本書で SIFT や HOG が何を計算しているのか理解しました。

本書を読んで、適切な特徴量を選択する大切さ、および選択した量が特徴量と
しての性質を満たすか判断する方法はわかったが、どのように特徴量を設定する
のがよいかについてはあまりアイデアを得られなかった。

ここら辺はまだまだ「職人技」なのだと思う。