KARDİYOVASKÜLER HASTALIK TAHMİNİNDE MAKİNE ÖĞRENMESİ SINIFLANDIRMA ALGORİTMALARININ KARŞILAŞTIRILMASI


Creative Commons License

Kaba G., KALKAN S. B.

İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, cilt.21, sa.42, ss.183-193, 2022 (Hakemli Dergi) identifier

Özet

Makine öğrenmesi teknikleri, günümüzde birçok alanda kullanılmakta olup veri yığınlarını sınıflandırmaya ve tahmine dayalı analizler ile veriden faydalı bilgiler çıkarmamıza olanak sağlamaktadır. Gelişen teknoloji ile sağlık alanında kayıt altına alınan veri sayısında ciddi artışlar yaşanmaktadır. Sağlık sektöründe oluşan veri yığınlarının makine öğrenmesi yöntemleri ile analiz edilerek yorumlanması, birçok hastalığın erken teşhisinde önem arz etmektedir. Bu çalışmada Kardiyovasküler Hastalığın erken teşhisine katkı sağlamak için makine öğrenmesi algoritmaları ile çalışmada kullanılan veriler üzerinde en başarılı sınıflandırma tahminini yapan algoritmaya ulaşmak hedeflenmiştir. Naive Bayes, Lojistik Regresyon, Rastgele Orman, K-En Yakın Komşu ve Destek Vektör Makineleri olmak üzere beş farklı makine öğrenmesi yöntemi kullanılarak performansları karşılaştırılmıştır. En başarılı performansı veren yöntem tespit edilmiştir. Olası bir kalp hastalığı tahmini üzerine yapılacak olan çalışmalar için makine öğrenmesi algoritmalarından analize uygun yöntem seçiminde fikir vermek amaçlanmıştır. Aynı zamanda, sağlık alanında yapılacak olan benzer çalışmaların güncel tutulması hastalığın erken teşhisine ve tedavisine katkı sağlayabilmektedir.
Machine learning techniques are used in many fields nowadays and allow us to classify data piles and extract useful information from data with predictive analysis. With developing technology, there is a significant increase in the number of recorded data in the field of health. With the machine learning methods, analysing and interpreting the data stacks in the field of health is important for the early diagnosis of many diseases. In this study, it is aimed to reach the algorithm that makes the most successful classification prediction on the data used in the study with machine learning algorithms in order to contribute to the early diagnosis of Cardiovascular Disease. The performances were compared by using five different machine learning methods; Naive Bayes, Logistic Regression, Random Forest, K-Nearest Neighbor and Support Vector Machines. The method that gives the most successful estimation performance has been determined. It is aimed to give an idea in the selection of the appropriate method from machine learning algorithms for the studies to be made on the prediction of a possible heart disease. At the same time, keeping up-to-date similar studies in the field of health can contribute to the early diagnosis and treatment of the disease.