KAGGLE adalah situs dan platform untuk berlomba membuat model terbaik untuk menganalisa dan memprediksi suatu dataset. Dataset ini diberikan oleh suatu perusahaan, dengan suatu deskripsi masalah tertentu. Misalnya, diberikan data rumah beserta fitur-fiturnya dan harga jualnya, dan deskripsi masalahnya adalah buatlah model untuk memprediksi harga jual berdasarkan fitur-fitur tersebut.
Berikut adalah penjelasan tentang komponen-komponen
Overview
Berisi informasi dasar tentang spesifikasi kompetisi, yaitu deskripsi permasalahan yang hendak dipecahkan serta solusi apa yang diharapkan. Di laman overview ini juga ada laman Tutorials (di menu kiri) yang berisi petunjuk dan link-link ke kernel atau forum diskusi untuk memecahkan masalah di kompetisi ini.
Data/dataset
Sebuah kompetisi akan memberi minimal dua data (dalam bentuk CSV), yaitu data training dan data test. Data training digunakan untuk melatih model Anda, lalu Anda memasukkan hasil prediksi model Anda dalam data test, untuk di-submit dan dinilai oleh platform kompetisi Kaggle.
Kernel
Kernel adalah istilah Kaggle untuk workspace pekerjaan Anda di sebuah kompetisi. Tadinya saya bingung dengan istilah ini, karena kalau di IT biasanya istilah kernel dipakai untuk sesuatu yang menjadi core sebuah sistem.
Sebuah kernel terdiri dari data (yang Anda ambil dari dataset spesifikasi kompetisi di atas), sebuah notebook (Python atau R), kode, dan komentar-komentar/diskusi yang Anda atau anggota tim Anda tuliskan untuk kernel itu. Kernel bisa dibuat dari nol, atau dengan cara mem-fork dari kernel orang lain.
Makasih man teman.... :)