Kaggleに初サブミット
1. データサイエンス養成読本を読んでみる
2. もう少し踏み込んでRと統計学を学んでみる
3. 一回Kaggleにチャレンジしてみる←今ここ
4. 挫折する
6. Kaggleにチャレンジと統計学・機械学習の勉強を往復する
7. 自称Kagglerになる
Kaggleに初サブミットしました。
参考にしたサイトはこちら。
kaggleのチュートリアル。(2018年10月大幅更新しました、2019年4月第3版に更新予定)|カレーちゃん @currypurin|note(ノート) https://t.co/Z853U3WU1v
— YO@Eggineer (@YO37377306) 2019年1月6日
noteを買い、内容を一通り写経し、Kaggleサブミットまでの一連の流れをなんとなく理解。
大事なのは前処理と特徴量作成?のように感じました。
あと現在の自分のレベルがどの程度かもよく分かりました。
具体的には、データをみた時に機械学習のどの手法を用いるか、さっぱり分からないなと。
ランダムフォレストと言われても、「データサイエンティスト養成読本」で見かけたけどなんとなくしか理解できていないレベルであったり、どの手法を用いて自分が分析すればいいか、瞬時に判断できないので、今後はそれを克服する予定です。*2
機械学習にチャレンジ
そのため一旦、機械学習をしっかり学び、その上でチャレンジしたいと考えています。
機械学習の学習テキストはこちらでご紹介されている「機械学習のエッセンス」。
既に少し読んでいて、前半箇所は高校数学の内容が多く、とても懐かしく。
微積分は悪くないが、線形代数はもう少しリハビリしたいといったところ。
ぼちぼち後半部分の機械学習の内容を学んでいきたいと思います。
今月中に納得いくまで読み込めればなと。
1. データサイエンス養成読本を読んでみる
2. もう少し踏み込んでRと統計学を学んでみる
3. 一回Kaggleにチャレンジしてみる
4. 挫折する*3
6. Kaggleにチャレンジと統計学・機械学習の勉強を往復する
7. 自称Kagglerになる
これまでの軌跡
上記の通り、マイペースにKagglerに向けて勉強してきました。
機械学習のエッセンスを写経し終えた後に、また今後の方向性を考えていく予定です。
Photo by Viaggio Routard | Flicker