
Dalam era digital ini, analisis perilaku manusia menjadi semakin menarik untuk dijelajahi. Salah satu aplikasi menarik adalah memprediksi tipe kepribadian seseorang berdasarkan perilaku sosial mereka. Pada proyek ini, kita membangun model machine learning untuk mengklasifikasikan seseorang sebagai introvert atau extrovert.
Dataset ini berasal dari Kaggle dan berisi data perilaku individu yang diklasifikasikan sebagai introvert atau extrovert. Dataset mencakup informasi tentang:
Time_spent_Alone
)Stage_fear
)Social_event_attendance
)Going_outside
)Drained_after_socializing
)Friends_circle_size
)Post_frequency
)Dataset ini cocok untuk berbagai aplikasi seperti pengembangan sistem rekomendasi, analisis perilaku pengguna, dan penelitian psikologi sosial.
StandardScaler
Tiga model utama yang dibandingkan:
Model | Akurasi | F1 Introvert | F1 Extrovert |
---|---|---|---|
Logistic Regression | 90.7% | 0.91 | 0.91 |
Decision Tree | 85.9% | 0.86 | 0.86 |
SVM (RBF) | 91.7% | 0.92 | 0.92 |
Model SVM terbukti menjadi yang terbaik, dengan performa seimbang dalam mengklasifikasikan kedua tipe kepribadian.
Dilakukan pencarian grid (GridSearchCV
) dengan kombinasi parameter:
C
: 0.1, 1, 10gamma
: scale, 0.01, 0.1, 1kernel
: ‘rbf’Model terbaik ditemukan pada kombinasi tertentu yang menghasilkan F1-score tertinggi.
Dengan menggunakan data sederhana seputar perilaku sosial, kita dapat membangun model yang cukup akurat untuk memprediksi kepribadian seseorang. Model SVM memberikan hasil terbaik pada dataset ini.
Eksperimen ini menunjukkan potensi besar data sosial untuk memahami karakteristik manusia, dan bisa diperluas ke bidang HR, psikologi, atau platform media sosial.
Cek codenya di sini -> https://www.kaggle.com/code/satriahelmy/extrovert-vs-introvert