Ayrıştırım Tabanlı Yöntemler İle Medikal Görüntülerin Sınıflandırılması
Citation
EREN, Furkan, Ayrıştırım Tabanlı Yöntemler İle Medikal Görüntülerin Sınıflandırılması, Fatih Sultan Mehmet Vakıf Üniversitesi Lisansüstü Eğitim Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı Bilgisayar Mühendisliği Programı, Yayımlanmamış Yüksek Lisans Tezi, İstanbul 2021.Abstract
Bu çalışmada dünya çapında tüm sektörleri etkileyen ve sağlık açısından insan hayatını tehdit eden COVİD-19 virüsünün göğüs X-ışını görüntüleri üzerinden teşhisi problemi ele alınmıştır. Koronavirüs ile enfekte olan hastaların çoğu akciğer enfeksiyonu kaynaklı solunum problemleri yaşamaktadır. Sağlık alanında hızlı teşhis ve tedavi hayat kurtaran önemli bir unsurdur. Bu çalışmada akciğer ile ilişkili hastalıkların teşhisinde hızlı görüntüleme süresi ve düşük maliyeti nedeniyle gögüs röntgen filmleri tercih edilmiştir. Tercih edilen veri kümesinde 2 sınıf bulunmaktadır. Veri kümesi, COVID-19 virüsü ile enfekte olan ve olmayan hastaların X-ışını akciğer görüntülerini içermektedir.
Hastalığın teşhisi için yapay zeka tekniklerinden derin öğrenme ve makine öğrenmesi yöntemleri kullanılmıştır. Çalışmanın hedefi en hızlı ve güvenilir sonuçları veren yeni bir özellik çıkarımı yöntemi geliştirmektir. Bu yeni özellik çıkarımı yöntemi, literatürde matris ayrıştırma yöntemi olarak geliştirilen “Çokdeğişkenliliği Yükseltilmiş Çarpımlar Üçköşegencil Dizey Gösterimi (ÇYÇÜDG)” yöntemi temeline dayanmaktadır. Dizeyi yinelemeli bir şekilde sadece bütüncül olarak ele alan ÇYÇÜDG yöntemi, baskınlığı giderek azalan özellikler ortaya çıkarmaktadır. Bu çalışmada “Bölütlenmiş Çokdeğişkenliliği Yükseltilmiş Çarpımlar Üçköşegencil Dizey Gösterimi (BÇYÇÜDG)” olarak adlandırılan yeni yöntem, dizeyi sadece bütüncül olarak ele almayıp bölütleme işlemi ile dizeyin alt parçalarını ortaya çıkarmaktadır. Bölütleme sonrası elde edilen alt parçalara ve dizeyin kendisine ÇYÇÜDG yöntemi uygulanmaktadır. Bu işlemler sonucunda geliştirilen BÇYÇÜDG özellik çıkarımı yöntemi ile dizey üzerinden genelden özele doğru bir yaklaşım ile ayırt ediciliği yüksek özellikler elde edilmektedir. Bu çıktılara ek olarak ÇYÇÜDG, BÇYÇÜDG sayesinde paralel programlamaya daha elverişli hale gelmektedir.
Geliştirilen yeni yöntemin performansını değerlendirmek için bilinen 4 farklı özellik çıkarım yöntemi ile karşılaştırılmıştır. Karşılaştırma için “Tekil Değer Ayrışımı (TDA)”, “Ayrık Dalgacık Dönüşümü (ADD)” , “Ayrık Kosinüs Dönüşümü (AKD)” ve temel alınan yöntem kullanılmıştır. Bunlara ek olarak bu çalışmada “FSMCov”, FSMCov-L” ve FSMCov-N” olarak adlandırılan özellik çıkarım yöntemleri ile uyumlu 3 derin öğrenme modeli geliştirilmiştir. Geliştirilen modeller haricinde literatürde bilinen “VGG-16”, “Alex-Net” ve “Lenet-5” modelleri de bu çalışmada kullanılmıştır. COVID-19 teşhisi için derin öğrenme modelleri ve özellik çıkarım yöntemleri kullanılarak yapılan sınıflandırmada, FSMCov-N modeli ve BÇYÇÜDG özellik çıkarım yöntemi %99.8 doğruluk oranı ile en başarılı sonucu veren ikili olmuştur. Geliştirilen BÇYÇÜDG yöntemi, derin öğrenme modelleri haricinde makine öğrenmesi yöntemlerinden “Destek Vektör Makinesi (DVM)” ve “Rassal Orman (RO)” algoritması ile de değerlendirilmiştir. DVM kullanılarak COVID-19 teşhisi için yapılan sınıflandırmada %99.1 doğruluk oranına, %97.3 duyarlılık ve %100 kesinlik değerleri ile ulaşılmıştır. Benzer şekilde “Rassal Orman” algoritması ile %99.1 doğruluk oranı elde edilmiştir. Elde edilen sonuçlar gösteriyor ki geliştirilen yeni yöntem ile göğüs X-ışını görüntüleri üzerinden COVID-19 teşhisi, güvenilir bir şekilde yapılabilmektedir. In this study, the problem of diagnosis of the COVID-19 virus, which affects all sectors worldwide and threatens human life in terms of health, through chest X-ray images is taken into consideration. Most patients infected with coronavirus experience respiratory problems due to lung infection. Rapid diagnosis and treatment in the field of health is an important element that saves lives. In this study, chest X-ray films were preferred in the diagnosis of lung-related diseases because of the rapid imaging time and low cost. This dataset includes 2 classes: X-ray lung images of patients infected with COVID-19 virus and non-infected patients.
Deep learning and machine learning methods from artificial intelligence techniques were used for the diagnosis of the disease. The aim of the study is to develop a new feature extraction method that gives the fastest and most reliable results. This new feature extraction method is based on Tridiagonal Matrix Enhanced Multivariance Products Representation (TMEMPR) which is known in literature as a matrix decomposition method. The TMEMPR method, which considers the matrix as a whole and decomposes recursively, reveals features whose dominance is gradually decreasing. In this study, the new method called Partitioned Tridiagonal Matrix Enhanced Multivariance Products Representation does not only consider the matrix as a whole, but also reveals the sub-parts of the matrix with the segmentation process. The TMEMPR method is applied to the sub-segments obtained after segmentation, and to the matrix itself. With the Partitioned TMEMPR feature extraction method developed as a result of these processes, highly distinctive features are obtained with an approach from general to specific over the matrix. In addition to these outputs, TMEMPR becomes more convenient for parallel programming thanks to Partitioned TMEMPR.
In order to evaluate the performance of the novel cfeature extraction method, it was compared with four different feature extraction methods which are "Singular Value Decomposition (SVD)", "Discrete Wavelet Transform (DWT)", "Discrete Cosine Transform (DCT)". In addition to these, three deep learning models named “FSMCov”, FSMCov-L” and FSMCov-N” were proposed in this study. Apart from the proposed models, “VGG-16”, “Alex-Net” and “Lenet-5” models which are well-known in the literature were also used in this study. In the classification using deep learning models and feature extraction methods for the diagnosis of COVID-19, the FSMCov-N model and Partitioned TMEMPR feature extraction method were the most successful pair with 99.8% accuracy.
The developed Partitioned TMEMPR method was also evaluated with the machine learning methods,"Support Vector Machine (SVM)" and "Random Forest (RF)" algorithm, apart from deep learning models. In the classification for the diagnosis of COVID-19 using SVM, the accuracy rate of 99.1%, sensitivity of 97.3% and precision of 100% was achieved. Similarly, with the "Random Forest" algorithm, an accuracy rate of 99.1% was obtained. The results indicate that with the proposed method, the diagnosis of COVID-19 can be reliably diagnosed on chest X-ray images.