930 x 180 AD PLACEMENT

Memprediksi Kepribadian (Introvert vs Extrovert) dengan Machine Learning

750 x 100 AD PLACEMENT

Dalam era digital ini, analisis perilaku manusia menjadi semakin menarik untuk dijelajahi. Salah satu aplikasi menarik adalah memprediksi tipe kepribadian seseorang berdasarkan perilaku sosial mereka. Pada proyek ini, kita membangun model machine learning untuk mengklasifikasikan seseorang sebagai introvert atau extrovert.

Deskripsi Dataset

Dataset ini berasal dari Kaggle dan berisi data perilaku individu yang diklasifikasikan sebagai introvert atau extrovert. Dataset mencakup informasi tentang:

  • Waktu yang dihabiskan sendirian (Time_spent_Alone)
  • Ketakutan berbicara di depan umum (Stage_fear)
  • Frekuensi menghadiri acara sosial (Social_event_attendance)
  • Kebiasaan keluar rumah (Going_outside)
  • Perasaan lelah setelah bersosialisasi (Drained_after_socializing)
  • Ukuran lingkaran pertemanan (Friends_circle_size)
  • Frekuensi posting di media sosial (Post_frequency)

Dataset ini cocok untuk berbagai aplikasi seperti pengembangan sistem rekomendasi, analisis perilaku pengguna, dan penelitian psikologi sosial.

Exploratory Data Analysis (EDA)

  • Distribusi target: Seimbang antara introvert dan extrovert
  • Fitur numerik memiliki distribusi cukup bervariasi
  • Korelasi rendah antar fitur numerik, yang baik untuk model generalisasi

Preprocessing

  1. Imputasi nilai kosong:
    • Fitur numerik: median
    • Fitur kategorikal: modus
  2. Encoding:
    • Kolom “Yes/No” diubah ke 1/0
    • Label “Personality” di-encode (Extrovert = 0, Introvert = 1)
  3. Standardisasi fitur numerik menggunakan StandardScaler

Model dan Evaluasi

Tiga model utama yang dibandingkan:

750 x 100 AD PLACEMENT
  • Random Forest
  • Logistic Regression
  • Support Vector Machine (SVM)
ModelAkurasiF1 IntrovertF1 Extrovert
Logistic Regression90.7%0.910.91
Decision Tree85.9%0.860.86
SVM (RBF)91.7%0.920.92

Model SVM terbukti menjadi yang terbaik, dengan performa seimbang dalam mengklasifikasikan kedua tipe kepribadian.

Hyperparameter Tuning (SVM)

Dilakukan pencarian grid (GridSearchCV) dengan kombinasi parameter:

  • C: 0.1, 1, 10
  • gamma: scale, 0.01, 0.1, 1
  • kernel: ‘rbf’

Model terbaik ditemukan pada kombinasi tertentu yang menghasilkan F1-score tertinggi.

Kesimpulan

Dengan menggunakan data sederhana seputar perilaku sosial, kita dapat membangun model yang cukup akurat untuk memprediksi kepribadian seseorang. Model SVM memberikan hasil terbaik pada dataset ini.

750 x 100 AD PLACEMENT

Eksperimen ini menunjukkan potensi besar data sosial untuk memahami karakteristik manusia, dan bisa diperluas ke bidang HR, psikologi, atau platform media sosial.

Cek codenya di sini -> https://www.kaggle.com/code/satriahelmy/extrovert-vs-introvert

750 x 100 AD PLACEMENT

Leave a Reply

Your email address will not be published. Required fields are marked *

You might also like
930 x 180 AD PLACEMENT