Perbandingan Kinerja Algoritma Kmeans dengan Kmeans Median pada Deteksi Kanker Payudara

Siti Mutrofin; Toni Wicaksono; Ali Murtadho

doi:10.37034/jidt.v5i1.274

Download

Published: Feb 28, 2023

DOI: https://doi.org/10.37034/jidt.v5i1.274

Keywords:

Kmeans, Kmeans Median, Centroid, DBI, Davies-Bouldin Index, clustering

Siti Mutrofin

Universitas 17 Agustus 1945 Surabaya

Toni Wicaksono

Universitas Pesantren Tinggi Darul Ulum

Ali Murtadho

Universitas Pesantren Tinggi Darul Ulum

Abstract

Clustering adalah salah satu tugas dari Data Mining berbasis unsupervised learning. Clustering dapat digunakan untuk permasalahan di berbagai bidang, seperti pendidikan, kesehatan, ekonomi, pertanian, hiburan, olah raga, dll. Salah satu algoritma clustering yang sederhana dan umum digunakan pada tipe data numerik adalah Kmeans. Terlepas dari segala kelebihan Kmeans, Kmeans memiliki permasalahan berupa pemilihan pusat awal cluster atau centroid yang dipilih secara acak (random). Karena hasil akhir cluster dari Kmeans sangat sensitif pada pemilihan awal cluster yang dapat menyebabkan konvergensi yang tidak optimal. Pada penelitian ini dilakukan perbandingan antara Kmeans dengan Kmeans Median dalam menentukan centroid awal yang bertujuan untuk mengetahui kinerja kedua algoritma yang paling optimal. Pada Kmeans Median, pemilihan centroid awal dipilih dengan menggunakan nilai median yang diambil dari kelompok data dan akan dicari nilai mediannya. Dataset yang digunakan dalam penelitian ini adalah Breast Cancer Coimbra yang dapat diakses di UCI Machine Learning Repository. Perhitungan jarak untuk kedua algoritma menggunakan euclidean distance. Pengujian pada penelitian ini untuk mengetahui kinerja kedua algoritma menggunakan Davies-Bouldin Index (DBI). Pengujian dilakukan empat kali pada masing-masing algoritma. Dari keempat pengujian tersebut, Kmeans mendapatkan DBI terbaik 0,47 dan terburuk 0,4796. Sedangkan pada Kmeans Median memiliki DBI 0,47 pada keempat pengujiannya. Kinerja Kmeans berdasarkan iterasi antara 3, 5, dan 6. Sedangkan Kmeans Median iterasinya konsisten hanya 4. Berdasarkan komputasinya, Kmeans lebih unggul karena algoritmanya lebih sederhana, hal itu terlihat dari waktu yang dibutuhkan lebih sedikit dibandingkan Kmeans Median.

How to Cite

Mutrofin, S., Wicaksono, T., & Murtadho, A. (2023). Perbandingan Kinerja Algoritma Kmeans dengan Kmeans Median pada Deteksi Kanker Payudara. Jurnal Informasi Dan Teknologi, 5(1), 88-91. https://doi.org/10.37034/jidt.v5i1.274

Issue

2023, Vol. 5, No. 1

Section

Articles

This work is licensed under a Creative Commons Attribution 4.0 International License.

Author Biographies

Siti Mutrofin, Universitas 17 Agustus 1945 Surabaya

Program Studi Sistem dan Teknologi Informasi

Toni Wicaksono, Universitas Pesantren Tinggi Darul Ulum

Program Studi Sistem Informasi

Ali Murtadho, Universitas Pesantren Tinggi Darul Ulum

Program Studi Sistem Informasi

References

[1] R. Kurniawan, S. Defit, and S. Sumijan, “Prediksi Tingkat Kerugian Peternak Akibat Penyakit pada Sapi Menggunakan Algoritma K-Means Clustering,” J. Inf. dan Teknol., vol. 3, no. 1, pp. 29–35, 2021, doi: 10.37034/jidt.v3i1.87.
[2] C. Yuan and H. Yang, “Research on K-Value Selection Method of K-Means Clustering Algorithm,” J-Multidisciplinary Sci. J., vol. 2, no. 2, pp. 226–235, 2019, doi: 10.3390/j2020016.
[3] S. Nawrin, M. R. Rahman, and S. Akhter, “Exploreing K-Means with Internal Validity Indexes for Data Clustering in Traffic Management System,” Int. J. Adv. Comput. Sci. Appl., vol. 8, no. 3, pp. 264–272, 2017, doi: 10.14569/ijacsa.2017.080337.
[4] T.-S. Xu, H.-D. Chiang, G.-Y. Liu, and C.-W. Tan, “Hierarchical K-means Method for Clustering Large-Scale Advanced Metering Infrastructure Data,” IEEE Trans. Power Deliv., vol. 32, no. 2, pp. 609–616, 2017, doi: 10.1109/TPWRD.2015.2479941.
[5] S. Khanmohammadi, N. Adibeig, and S. Shanehbandy, “An improved overlapping k-means clustering method for medical applications,” Expert Syst. Appl., vol. 67, pp. 12–18, 2017, doi: 10.1016/j.eswa.2016.09.025.
[6] X. Tong, M. Fanrong, and W. Zhixiao, “K-means for optimizing the initial cluster centers,” Comput. Eng. Des., vol. 32, no. 8, pp. 2721–2723, 2011.
[7] H. Sopian, P. Purwanto, and M. A. Soeleman, “Pemilihan Pusat Klaster Awal Pada Metode K-Means Berbasis Median,” J. Intake J. Penelit. Ilmu Tek. dan Terap., vol. 7, no. 2, pp. 93–104, 2016.
[8] Z. Min and D. Kai-Fei, “Improved Research to K-means Initial Cluster Centers,” in Proceedings - 2015 9th International Conference on Frontier of Computer Science and Technology, FCST 2015, 2015, pp. 349–353. doi: 10.1109/FCST.2015.61.
[9] S. A. M. Anaraki, A. Haeri, and F. Moslehi, “A hybrid reciprocal model of PCA and K-means with an innovative approach of considering sub-datasets for the improvement of K-means initialization and step-by-step labeling to create clusters with high interpretability,” Pattern Anal. Appl., vol. 24, pp. 1387–1402, 2021, doi: 10.1007/s10044-021-00977-x.
[10] M. Z. Usman and T. Oktiarso, “Implementasi Algoritma Greedy Untuk Menyelesaikan Travelling Salesman Problem di Distributor PT. Z,” J. Integr. Syst., vol. 1, no. 2, pp. 216–229, Mar. 2018, doi: 10.28932/JIS.V1I2.1049.
[11] M. Patrício et al., “Using Resistin, glucose, age and BMI to predict the presence of breast cancer,” BMC Cancer, vol. 18, no. 1, pp. 1–8, 2018, doi: 10.1186/s12885-017-3877-1.
[12] D. T. Larose and C. D. Larose, Discovering Knowledge in Data: An Introduction to Data Mining. 2014. doi: 10.1002/0471687545.
[13] S. Rustam, “Analisa Clustering Phising dengan K-Means dalam Meningkatkan Keamanan Komputer,” Ilk. J. Ilm., vol. 10, no. 2, pp. 175–181, 2018, doi: 10.33096/ilkom.v10i2.309.175-181.
[14] D. A. I. C. Dewi and D. A. K. Pramita, “Analisis Perbandingan Metode Elbow dan Silhouette pada Algoritma Clustering K-Medoids dalam Pengelompokan Produksi Kerajinan Bali,” Matrix J. Manaj. Teknol. dan Inform., vol. 9, no. 3, pp. 102–109, 2019, doi: 10.31940/matrix.v9i3.1662.
[15] P. Anitha and M. M. Patil, “RFM model for customer purchase behavior using K-Means algorithm,” J. King Saud Univ. - Comput. Inf. Sci., vol. 34, pp. 1785–1792, 2022, doi: 10.1016/j.jksuci.2019.12.011.
[16] G. Douzas, F. Bacao, and F. Last, “Improving imbalanced learning through a heuristic oversampling method based on k-means and SMOTE,” Inf. Sci. (Ny)., vol. 465, pp. 1–20, 2018, doi: 10.1016/j.ins.2018.06.056.
[17] A. F. Khairati, A. . Adlina, G. . Hertono, and B. . Handari, “Kajian Indeks Validitas pada Algoritma K-Means Enhanced dan K-Means MMCA,” in PRISMA, Prosiding Seminar Nasional Matematika, 2019, vol. 2, pp. 161–170. [Online]. Available: https://journal.unnes.ac.id/sju/index.php/prisma/article/view/28906
[18] S. Lukasik, P. A. Kowalski, M. Charytanowicz, and P. Kulczycki, “Clustering using flower pollination algorithm and Calinski-Harabasz index,” in 2016 IEEE Congress on Evolutionary Computation, CEC 2016, 2016, pp. 2724–2728. doi: 10.1109/CEC.2016.7744132.
[19] S. Krey, U. Ligges, and F. Leisch, “Music and timbre segmentation by recursive constrained K-means clustering,” Comput. Stat., vol. 29, pp. 37–50, 2014, doi: 10.1007/s00180-012-0358-5.
[20] K. Laskhmaiah, S. M. Krishna, and B. E. Reddy, “An optimized k-means with density and distance-based clustering algorithm for multidimensional spatial databases,” Int. J. Comput. Netw. Inf. Secur., vol. 13, no. 6, pp. 70–82, 2021, doi: 10.5815/ijcnis.2021.06.06.

Article Sidebar

Main Article Content

Abstract

Article Details

Siti Mutrofin, Universitas 17 Agustus 1945 Surabaya

Toni Wicaksono, Universitas Pesantren Tinggi Darul Ulum

Ali Murtadho, Universitas Pesantren Tinggi Darul Ulum

References

Most read articles by the same author(s)