本と科学と尊みと

本のこととか科学技術のこととか趣味のこととか書きます

なかむらは、kaggleを始めてみました(2)分析を始める準備

前回記事では、データサイエンティストを目指して、Kaggleに登録し、プロフィールの入力と分析環境の確認を行いました。

www.galleon.blue

今回は、Competitionへ参加して、データ分析を始める準備をしてみます。

Competitionへの参加、といっても、何か費用が発生したりするわけではありません。

データを受け取って、提出して、採点してもらうための枠というか権利を確保する手続きです。

今回は、初心者向けの学習用competitionの定番である、「Titanic: Machine Learning from Disaster」に参加してみます。

Competition への参加

Competitions → 検索窓 → titanic と入力してエンター

表示される「Titanic~」をクリック

右側のKnowledgeとなっていますが、ものによってはここに賞金が表示されます。

Titanicのデータセットについては、賞品は「知識」!

つまりは、勉強用、ということみたいです。

クリックすると、このデータセットでの分析についての画面が開きます。

f:id:galleon_blue:20181205211447p:plain

Titanic: Machine Learning from Disaster | Kaggle

この分析に参加するには、右側のRuleをクリックします。 すると、この分析コンペに関するルールが表示されます。

f:id:galleon_blue:20181205212832p:plain

そして、スクロールダウンした下の方に表示される 「I understand and accept」をクリック。 f:id:galleon_blue:20181205212651p:plain

これで参加完了です。

f:id:galleon_blue:20181205213036p:plain

competitionに関するkernelの表示

なお、上に戻ってkernelをクリックすると、他のkagglerたちが分析した手法を参照することができます。

ここを読み込むと、超勉強になる、らしいです。

f:id:galleon_blue:20181205213219p:plain

試しに一つ開いてみたら、情報量すごかった・・・。

分析の開始

kernelの選択後、右側のNewKernelをクリックすると、jupyterが開いて、分析を開始することができます。

f:id:galleon_blue:20181205215759p:plain

次回は、実際に分析をしてみます。