Penghitungan k-NN pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal-Multi Kategori

https://doi.org/10.5614/joki.2017.9.2.5

Authors

  • Sri Rahayu
  • Teguh Bharata Adji
  • Noor Akhmad Setiawan

Keywords:

penghitungan k-NN, ADASYN, imbalanced data, nominal, k-NN, multi categories

Abstract

Pada penelitian ini disajikan tentang contoh proses penghitungan k-NN pada teknik oversampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk mengatasi masalah ketidakseimbangan (imbalanced) kelas pada dataset dengan fitur nominal-multi categories. Percobaan penghitungan k-NN menggunakan contoh dataset yang memiliki 10 instances dengan 4 fitur, yang mana masing-masing fiturnya memiliki 3 kategori (multi-categories). Contoh dataset untuk percobaan penghitungan tersebut terdistribusi ke dalam 2 kelas, yaitu kelas A terdapat 3 instances dan kelas B dengan 7 instances. Selanjutnya hasil penghitungan k-NN tersebut diujikan pada sebuah dataset dengan fitur nominal-multi categories yang memiliki distribusi kelas yang tidak seimbang. Kemudian dataset di-oversampling dengan metode ADASYN-N dan ADASYN-kNN, kemudian dilakukan uji klasifikasi menggunakan metode Random Forests. Hasil klasifikasi dibandingkan akurasinya antara dataset asli dan dataset dengan teknik oversampling ADASYN-N serta ADASYN-kNN dan menunjukkan bahwa teknik oversampling ADASYN-N dapat meningkatkan akurasi klasifikasi sebanyak 9,05% dari dataset asli, sedangkan ADASYN-kNN meningkatkan akurasi klasifikasi sebanyak 7,84% dari dataset asli.

 

References

H. He, Y. Bai, E. A. Garcia, and S. Li, Adaptive Synthetic Sampling Approach for Imbalanced Learning, no. 3, pp. 1322-1328, 2008.

Y. E. Kurniawati, Multiclass Imbalance Learning dengan Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-KNN (Adasyn-KNN) untuk Resampling Data pada Data Hasil Tes Pap Smear, Tesis pada Departemen Teknik Elektro dan Teknologi Informasi, Fakultas Teknik, Universitas Gadjah Mada, 2017.

N. Chawla and K. Bowyer, SMOTE: Synthetic Minority Over-sampling Technique Nitesh, J. Artif. Intell. Res., vol. 16, pp. 321-357, 2002.

N. V. Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, SMOTE: Synthetic Minority Over-Sampling Technique, J. Artif. Intell. Res., vol. 16, pp. 321-357, 2002.

L. Breiman, Random Forests, Mach. Learn., vol. 45, no. 1, pp. 5-32, 2001.

H. He and Y. Ma, Imbalanced Learning: Foundations, Algorithms, and Applications, 1st ed. Wiley-IEEE Press, 2013.

Published

2017-12-29

How to Cite

[1]
S. Rahayu, T. B. Adji, and N. A. Setiawan, “Penghitungan k-NN pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal-Multi Kategori”, JOKI, vol. 9, no. 2, p. 119, Dec. 2017.

Issue

Section

Articles