Beberapa bulan yang lalu saya belajar mengenai pembelajaran mesin. Salah satu metode pembelajarannya adalah supervised learning. Lawannya adalah unsupervised learning.
Supervised learning adalah salah satu metode utama dalam machine learning yang digunakan untuk membangun model prediktif. Dalam pendekatan ini, model belajar dari data yang sudah diberi label atau target, sehingga bisa digunakan untuk memprediksi hasil berdasarkan input yang baru.
Konsep ini sangat mendasar dalam banyak aplikasi machine learning, mulai dari prediksi harga rumah hingga deteksi spam pada email. Maksudnya berlabel tuh gimana? ya contohnya kaya deteksi email spam, kita perlu tahu di data aslinya email yang spam itu yang kaya gimana. Sehingga kita akan ngasih pelajaran ke mesinnya sesuai dengan label yang kita kasih.
Secara sederhana, supervised learning melibatkan dua komponen utama: data input (fitur) dan data output (label). Model yang dilatih dalam supervised learning bertujuan untuk menemukan pola atau hubungan antara input dan output yang ada. Dengan kata lain, model tersebut “dipandu” oleh data yang sudah diketahui jawabannya, dan tujuannya adalah untuk memprediksi label pada data baru.
Misalnya, dalam kasus klasifikasi email spam, fitur bisa berupa kata-kata yang ada dalam email tersebut, sementara label adalah apakah email tersebut spam atau bukan. Dengan mempelajari data email yang sudah diberi label, model dapat memprediksi apakah email baru termasuk dalam kategori spam atau bukan.
Oke mungkin itu dulu tulisan mengenai supervised learning. Nanti akan coba saya jabarkan bagaimana cara pakainya di algoritma-algoritma lainnya.
Semoga bermanfaat.