プチゆる週末PJT

コンサル会社で働きながら、プログラミング学習者の「作ってみた」を応援するサイト「Eggineer」の開発・運営を行なっています

Kaggleに初サブミットしました

Kaggleに初サブミット 

1. データサイエンス養成読本を読んでみる

2. もう少し踏み込んでRと統計学を学んでみる

3. 一回Kaggleにチャレンジしてみる←今ここ

4. 挫折する

5. 多分Python/機械学習の勉強をする

6. Kaggleにチャレンジと統計学機械学習の勉強を往復する

7. 自称Kagglerになる 

Kaggleに初サブミットしました。

といってもタイタニックコンペですが。*1

 

参考にしたサイトはこちら。

noteを買い、内容を一通り写経し、Kaggleサブミットまでの一連の流れをなんとなく理解。

大事なのは前処理と特徴量作成?のように感じました。

あと現在の自分のレベルがどの程度かもよく分かりました。

具体的には、データをみた時に機械学習のどの手法を用いるか、さっぱり分からないなと。

ランダムフォレストと言われても、「データサイエンティスト養成読本」で見かけたけどなんとなくしか理解できていないレベルであったり、どの手法を用いて自分が分析すればいいか、瞬時に判断できないので、今後はそれを克服する予定です。*2

機械学習にチャレンジ

そのため一旦、機械学習をしっかり学び、その上でチャレンジしたいと考えています。

機械学習の学習テキストはこちらでご紹介されている「機械学習のエッセンス」。

tjo.hatenablog.com

既に少し読んでいて、前半箇所は高校数学の内容が多く、とても懐かしく。

微積分は悪くないが、線形代数はもう少しリハビリしたいといったところ。

ぼちぼち後半部分の機械学習の内容を学んでいきたいと思います。

今月中に納得いくまで読み込めればなと。

1. データサイエンス養成読本を読んでみる

2. もう少し踏み込んでRと統計学を学んでみる

3. 一回Kaggleにチャレンジしてみる

4. 挫折する*3

5. 多分Python/機械学習の勉強をする←次ここ

6. Kaggleにチャレンジと統計学機械学習の勉強を往復する

7. 自称Kagglerになる 

これまでの軌跡 

www.eggineer.info

www.eggineer.info

www.eggineer.info

www.eggineer.info

上記の通り、マイペースにKagglerに向けて勉強してきました。

機械学習のエッセンスを写経し終えた後に、また今後の方向性を考えていく予定です。

Photo by Viaggio Routard | Flicker

f:id:YO37377306:20190120185201j:plain

 

*1:タイタニックの乗船者のうち、誰が生存者かを用いて解析・推定する超有名な初心者登竜門的コンペティション。Kaggleに取り組みたいと思ったらまず手始めにタイタニックコンペのチュートリアルを写経すれば間違いないかと思われる。

*2:実際はLightGBMというライブラリを使用する事が多く、そこまで問題にはならないようですが、自分の場合機械学習を学ぶ事が目的のため、手法への理解も深めたいなと。

*3:noteのおかげで挫折はしませんでした笑