Hasil profil yang menunjukkan label terlambat akan membutuhkan proses

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Photo by Roman Mager on Unsplash.

Apa itu confusion matrix dan mengapa kita memerlukan itu ?

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Confusion Matrix
  • True Positive (TP)
    Merupakan data positif yang diprediksi benar. Contohnya, pasien menderita kanker (class 1) dan dari model yang dibuat memprediksi pasien tersebut menderita kanker (class 1).
  • True Negative (TN)
    Merupakan data negatif yang diprediksi benar. Contohnya, pasien tidak menderita kanker (class 2) dan dari model yang dibuat memprediksi pasien tersebut tidak menderita kanker (class 2).
  • False Postive (FP) — Type I Error
    Merupakan data negatif namun diprediksi sebagai data positif. Contohnya, pasien tidak menderita kanker (class 2) tetapi dari model yang telah memprediksi pasien tersebut menderita kanker (class 1).
  • False Negative (FN)Type II Error
    Merupakan data positif namun diprediksi sebagai data negatif. Contohnya, pasien menderita kanker (class 1) tetapi dari model yang dibuat memprediksi pasien tersebut tidak menderita kanker (class 2).

  • Jika diawali dengan True maka prediksinya adalah benar, entah diprediksi terjadi atau tidak terjadi.
  • Jika diawali dengan False maka prediksinya adalah salah.
  • Positif dan negatif merupakan hasil prediksi dari model.

Mengapa kita memerlukan confusion matrix ?

  1. Menunjukkan bagaimana model ketika membuat prediksi.
  2. Tidak hanya memberi informasi tentang kesalahan yang dibuat oleh model tetapi juga jenis kesalahan yang dibuat.
  3. Setiap kolom dari confusion matrix merepresentasikan instance dari kelas prediksi.
  4. Setiap baris dari confusion matrix mewakili instance dari kelas aktual.

Contoh confusion matrix pada klasifikasi biner

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Klasifikasi biner akan menghasilkan ouput dengan dua kelas (0 / 1) untuk data input yang diberikan.
Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Contoh confusion matrix untuk klasifikasi biner

Accuracy

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Confusion matrix yang menggambarkan nilai accuracy.
Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Persamaan nilai accuracy.
Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Menghitung nilai accuracy dari contoh confusion matrix klasifikasi biner.

Precision (Positive Predictive Value)

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Confusion matrix yang menggambarkan nilai precison.
Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Persamaan nilai precision.
Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Menghitung nilai precision dari contoh confusion matrix klasifikasi biner.

Recall atau Sensitivity (True Positive Rate)

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Confusion matrix yang menggambarkan nilai recall.
Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Persamaan nilai recall.

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Menghitung nilai recall dari contoh confusion matrix klasifikasi biner.

Dataset yang Digunakan

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Contoh dataset (menggunakan Pandas.head)

Membagi Dataset dan Membuat Model Prediksi

Evaluasi Model menggunakan Confusion Matrix

Hasil profil yang menunjukkan label terlambat akan membutuhkan proses
Visualisasi dari confusion matrix.

Seberapa baik model kita ?

Referensi