Perbandingan Kinerja Algoritma Kmeans dengan Kmeans Median pada Deteksi Kanker Payudara

Main Article Content

Siti Mutrofin
Toni Wicaksono
Ali Murtadho

Abstract

Clustering adalah salah satu tugas dari Data Mining berbasis unsupervised learning. Clustering dapat digunakan untuk permasalahan di berbagai bidang, seperti pendidikan, kesehatan, ekonomi, pertanian, hiburan, olah raga, dll. Salah satu algoritma clustering yang sederhana dan umum digunakan pada tipe data numerik adalah Kmeans. Terlepas dari segala kelebihan Kmeans, Kmeans memiliki permasalahan berupa pemilihan pusat awal cluster atau centroid yang dipilih secara acak (random). Karena hasil akhir cluster dari Kmeans sangat sensitif pada pemilihan awal cluster yang dapat menyebabkan konvergensi yang tidak optimal. Pada penelitian ini dilakukan perbandingan antara Kmeans dengan Kmeans Median dalam menentukan centroid awal yang bertujuan untuk mengetahui kinerja kedua algoritma yang paling optimal. Pada Kmeans Median, pemilihan centroid awal dipilih dengan menggunakan nilai median yang diambil dari kelompok data dan akan dicari nilai mediannya. Dataset yang digunakan dalam penelitian ini adalah Breast Cancer Coimbra yang dapat diakses di UCI Machine Learning Repository. Perhitungan jarak untuk kedua algoritma menggunakan euclidean distance. Pengujian pada penelitian ini untuk mengetahui kinerja kedua algoritma menggunakan Davies-Bouldin Index (DBI). Pengujian dilakukan empat kali pada masing-masing algoritma. Dari keempat pengujian tersebut, Kmeans mendapatkan DBI terbaik 0,47 dan terburuk 0,4796. Sedangkan pada Kmeans Median memiliki DBI 0,47 pada keempat pengujiannya. Kinerja Kmeans berdasarkan iterasi antara 3, 5, dan 6. Sedangkan Kmeans Median iterasinya konsisten hanya 4. Berdasarkan komputasinya, Kmeans lebih unggul karena algoritmanya lebih sederhana, hal itu terlihat dari waktu yang dibutuhkan lebih sedikit dibandingkan Kmeans Median.

Article Details

How to Cite
Mutrofin, S., Wicaksono, T., & Murtadho, A. (2023). Perbandingan Kinerja Algoritma Kmeans dengan Kmeans Median pada Deteksi Kanker Payudara. Jurnal Informasi Dan Teknologi, 5(1), 88-91. https://doi.org/10.37034/jidt.v5i1.274
Section
Articles
Author Biographies

Siti Mutrofin, Universitas 17 Agustus 1945 Surabaya

Program Studi Sistem dan Teknologi Informasi

Toni Wicaksono, Universitas Pesantren Tinggi Darul Ulum

Program Studi Sistem Informasi

Ali Murtadho, Universitas Pesantren Tinggi Darul Ulum

Program Studi Sistem Informasi

References

[1] R. Kurniawan, S. Defit, and S. Sumijan, “Prediksi Tingkat Kerugian Peternak Akibat Penyakit pada Sapi Menggunakan Algoritma K-Means Clustering,” J. Inf. dan Teknol., vol. 3, no. 1, pp. 29–35, 2021, doi: 10.37034/jidt.v3i1.87.
[2] C. Yuan and H. Yang, “Research on K-Value Selection Method of K-Means Clustering Algorithm,” J-Multidisciplinary Sci. J., vol. 2, no. 2, pp. 226–235, 2019, doi: 10.3390/j2020016.
[3] S. Nawrin, M. R. Rahman, and S. Akhter, “Exploreing K-Means with Internal Validity Indexes for Data Clustering in Traffic Management System,” Int. J. Adv. Comput. Sci. Appl., vol. 8, no. 3, pp. 264–272, 2017, doi: 10.14569/ijacsa.2017.080337.
[4] T.-S. Xu, H.-D. Chiang, G.-Y. Liu, and C.-W. Tan, “Hierarchical K-means Method for Clustering Large-Scale Advanced Metering Infrastructure Data,” IEEE Trans. Power Deliv., vol. 32, no. 2, pp. 609–616, 2017, doi: 10.1109/TPWRD.2015.2479941.
[5] S. Khanmohammadi, N. Adibeig, and S. Shanehbandy, “An improved overlapping k-means clustering method for medical applications,” Expert Syst. Appl., vol. 67, pp. 12–18, 2017, doi: 10.1016/j.eswa.2016.09.025.
[6] X. Tong, M. Fanrong, and W. Zhixiao, “K-means for optimizing the initial cluster centers,” Comput. Eng. Des., vol. 32, no. 8, pp. 2721–2723, 2011.
[7] H. Sopian, P. Purwanto, and M. A. Soeleman, “Pemilihan Pusat Klaster Awal Pada Metode K-Means Berbasis Median,” J. Intake J. Penelit. Ilmu Tek. dan Terap., vol. 7, no. 2, pp. 93–104, 2016.
[8] Z. Min and D. Kai-Fei, “Improved Research to K-means Initial Cluster Centers,” in Proceedings - 2015 9th International Conference on Frontier of Computer Science and Technology, FCST 2015, 2015, pp. 349–353. doi: 10.1109/FCST.2015.61.
[9] S. A. M. Anaraki, A. Haeri, and F. Moslehi, “A hybrid reciprocal model of PCA and K-means with an innovative approach of considering sub-datasets for the improvement of K-means initialization and step-by-step labeling to create clusters with high interpretability,” Pattern Anal. Appl., vol. 24, pp. 1387–1402, 2021, doi: 10.1007/s10044-021-00977-x.
[10] M. Z. Usman and T. Oktiarso, “Implementasi Algoritma Greedy Untuk Menyelesaikan Travelling Salesman Problem di Distributor PT. Z,” J. Integr. Syst., vol. 1, no. 2, pp. 216–229, Mar. 2018, doi: 10.28932/JIS.V1I2.1049.
[11] M. Patrício et al., “Using Resistin, glucose, age and BMI to predict the presence of breast cancer,” BMC Cancer, vol. 18, no. 1, pp. 1–8, 2018, doi: 10.1186/s12885-017-3877-1.
[12] D. T. Larose and C. D. Larose, Discovering Knowledge in Data: An Introduction to Data Mining. 2014. doi: 10.1002/0471687545.
[13] S. Rustam, “Analisa Clustering Phising dengan K-Means dalam Meningkatkan Keamanan Komputer,” Ilk. J. Ilm., vol. 10, no. 2, pp. 175–181, 2018, doi: 10.33096/ilkom.v10i2.309.175-181.
[14] D. A. I. C. Dewi and D. A. K. Pramita, “Analisis Perbandingan Metode Elbow dan Silhouette pada Algoritma Clustering K-Medoids dalam Pengelompokan Produksi Kerajinan Bali,” Matrix J. Manaj. Teknol. dan Inform., vol. 9, no. 3, pp. 102–109, 2019, doi: 10.31940/matrix.v9i3.1662.
[15] P. Anitha and M. M. Patil, “RFM model for customer purchase behavior using K-Means algorithm,” J. King Saud Univ. - Comput. Inf. Sci., vol. 34, pp. 1785–1792, 2022, doi: 10.1016/j.jksuci.2019.12.011.
[16] G. Douzas, F. Bacao, and F. Last, “Improving imbalanced learning through a heuristic oversampling method based on k-means and SMOTE,” Inf. Sci. (Ny)., vol. 465, pp. 1–20, 2018, doi: 10.1016/j.ins.2018.06.056.
[17] A. F. Khairati, A. . Adlina, G. . Hertono, and B. . Handari, “Kajian Indeks Validitas pada Algoritma K-Means Enhanced dan K-Means MMCA,” in PRISMA, Prosiding Seminar Nasional Matematika, 2019, vol. 2, pp. 161–170. [Online]. Available: https://journal.unnes.ac.id/sju/index.php/prisma/article/view/28906
[18] S. Lukasik, P. A. Kowalski, M. Charytanowicz, and P. Kulczycki, “Clustering using flower pollination algorithm and Calinski-Harabasz index,” in 2016 IEEE Congress on Evolutionary Computation, CEC 2016, 2016, pp. 2724–2728. doi: 10.1109/CEC.2016.7744132.
[19] S. Krey, U. Ligges, and F. Leisch, “Music and timbre segmentation by recursive constrained K-means clustering,” Comput. Stat., vol. 29, pp. 37–50, 2014, doi: 10.1007/s00180-012-0358-5.
[20] K. Laskhmaiah, S. M. Krishna, and B. E. Reddy, “An optimized k-means with density and distance-based clustering algorithm for multidimensional spatial databases,” Int. J. Comput. Netw. Inf. Secur., vol. 13, no. 6, pp. 70–82, 2021, doi: 10.5815/ijcnis.2021.06.06.