機械学習の学習
1. データサイエンス養成読本を読んでみる
2. もう少し踏み込んでRと統計学を学んでみる
3. 一回Kaggleにチャレンジしてみる
4. 挫折する
6. Kaggleにチャレンジと統計学・機械学習の勉強を往復する
7. 自称Kagglerになる
機械学習のエッセンスと、仕事ではじめる機械学習を読みました。
写経して、解説読んでの繰り返し。
機械学習のエッセンスは、前半の行列・微積分は、高校数学で乗り切れたものの、後半の機械学習の内容に入ると少々、いや、かなり手こずりながら、読み終えました*1。
機械学習には数学の知識が必要だと言われていましたが、具体的にどのような知識が必要かがピンときていなかったので、体系的に学べた点が非常に良かったです。
ただ数学的な解説が多く、実務でどのように活用されるかに関しては触れられていなかったので、仕事ではじめる機械学習でそうした要素の理解を補いながら、各モデルについての理解を深めていきました。
ネクストステップ
Kaggleにまた取り組み、本で学び直しを繰り返す予定。
またおそらく、前処理、機械学習ライブラリ(LightGBM、scikit-learn)の知識が欠如しているので、その点は重点的に補う必要がありそうです。
併せて、下記の動画を見ながら、環境構築も本格的に行おうかと。
環境構築は辛い印象しかないので、動画でまとめられているの大変ありがたい。
yutori-datascience.hatenablog.com
あと今の所、下記のコンペに取り組んでみようかと思っていたり、
Predicting Red Hat Business Value | Kaggle
Google Analytics Customer Revenue Prediction | Kaggle
また、解約率(チャーンレート)に関連するコンペ・データセットを触ってみるのも面白そうだなあと思っているところです。
これまでの軌跡
*1:理解したとは言っていない