Evaluasi Model Machine Learning – Dalam dunia machine learning, membangun model yang akurat tidak cukup hanya dengan melatihnya menggunakan data.
Kita juga perlu mengevaluasi performa model agar dapat memahami seberapa baik model tersebut dalam melakukan prediksi.
Beberapa metrik yang sering digunakan dalam evaluasi model klasifikasi adalah confusion matrix, precision, recall, F1-score, dan ROC curve.
Confusion Matrix: Dasar Evaluasi Model Klasifikasi
Confusion matrix adalah tabel yang menunjukkan perbandingan antara prediksi model dan nilai sebenarnya. Tabel ini terdiri dari empat komponen utama:
- True Positive (TP): Prediksi positif yang benar
- True Negative (TN): Prediksi negatif yang benar
- False Positive (FP): Prediksi positif yang salah (false alarm)
- False Negative (FN): Prediksi negatif yang salah (kesalahan dalam mendeteksi positif)
Dari confusion matrix, kita bisa menghitung metrik lain seperti accuracy, precision, recall, dan F1-score.
Precision, Recall, dan F1-score
Precision mengukur seberapa banyak prediksi positif yang benar dibandingkan dengan semua prediksi positif yang dibuat oleh model. Rumusnya adalah:
Precision = TP / (TP + FP)
Recall mengukur seberapa banyak data positif yang berhasil dideteksi oleh model. Rumusnya:
Recall = TP / (TP + FN)
F1-score adalah rata-rata harmonik dari precision dan recall, digunakan ketika kita ingin mencapai keseimbangan antara keduanya:
F1-score = 2 * (Precision * Recall) / (Precision + Recall)
ROC Curve dan AUC
Receiver Operating Characteristic (ROC) curve adalah grafik yang menunjukkan hubungan antara True Positive Rate (TPR) dan False Positive Rate (FPR) pada berbagai ambang batas keputusan. Semakin dekat kurva ke sudut kiri atas, semakin baik modelnya.
AUC (Area Under Curve) adalah ukuran numerik dari luas di bawah ROC curve. Nilai AUC berkisar antara 0 hingga 1, di mana nilai mendekati 1 menunjukkan performa model yang sangat baik.
Kesimpulan
Evaluasi model machine learning sangat penting untuk memastikan model yang dibuat dapat bekerja dengan baik dalam dunia nyata.
Menggunakan metrik seperti confusion matrix, precision, recall, F1-score, dan ROC curve membantu kita memahami kekuatan dan kelemahan model sebelum diterapkan secara luas.