Derin öğrenme ile mammogram görüntülerindeki lezyonların tespiti ve sınıflandırılması
Citation
Biçici, Yavuz. (2023). Derin öğrenme ile mammogram görtüntülerindeki lezyonların tespiti ve sınıflandırılması. (Yayımlanmamış yüksek lisans tezi). Bilecik Şeyh Edebali Üniversitesi, Fen Bilimleri Enstitüsü, Bilecik.Abstract
İnsan yaşamında sık görülen kanser türlerinden biri olan meme kanseri erkeklere göre kadınlarda daha sık görülmektedir. Bu kansere neyin sebep olduğu tam olarak bilinmese de kişinin beslenme şekli, regl durumu, doğum ve doğum kontrol hapları gibi birçok nedenlerin olabileceği düşünülmektedir. Meme kanserinin erken teşhisi tedavisinde oldukça önemlidir. Çok farklı meme kanseri tespit yöntemleri vardır. Bunlardan biri de Manyetik Rezonans (MR) ile görüntüleme teknikleridir. Bu çalışmada, Mammogram görüntüleri üzerinde lezyon tespiti ve sınıflandırmasında Faster R-CNN derin öğrenme yöntemi ile birlikte önceden eğitilmiş üç farklı CNN modeli Inception V2, Resnet101 ve Resnet-50 kullanılmıştır. Mammografi taraması görüntüleri içeren “The Digital Database for Screening Mammography – DDSM” açık kaynaklı sayısal veri tabanın kanserli ve normal görüntülerden oluşan toplamda 500 adeti alınarak oluşturulmuştur. Alınan bu görüntülerin 400 adedi radyologlar tarafından işaretlenmiş 100 adedi ise işaretlenmemiş vakalara ait mammogram görüntüsüdür. İşaretlenmiş 400 adet kanserli görüntüdeki lezyon bölgeleri LabelImg etiketleme aracı kullanılarak XML dosyası olarak etiketlendi. Daha sonra bu etiketlenen görüntüler eğitim veri seti olarak kullanıldı. Lezyon tespitinde kullanılan Faster R-CNN derin öğrenme yöntemi ile birlikte kullanılan üç adet CNN modelin her birinin eğitimi 300.000 adımda ve batchsize=1 alarak gerçekleştirildi. Bu deneyler sonucunda Inception V2 modeli için %97,16 doğruluk başarımı ve ResNet101 modeli için %94,74 doğruluk başarımı elde edilirken en iyi sonucu veren ResNet-50 modeli için ise %99,63 doğruluk başarımı elde edilmiştir. Elde edilen sonuçlar bu alanda çalışan uzmanlara erken teşhis koymada destek olabilecektir.
Ayrıca tezde ele alınan ön eğitimli CNN modelleri MIAS veri seti kullanılarak sadece iyi huylu ve kötü huylu tümör sınıflandırması yapılmıştır. 2016 adet iyi huylu eğitim ve 4088 adet kötü huylu eğitim seti ve 504 adet iyi huylu ve 1024 adet kötü huylu görüntü doğrulama veri seti olarak kullanılmıştır. Tezde ele alınan ön eğitimli modellerle gerçekleştirilen eğitim sonucunda yine yüksek başarılar elde edildiği görülmüştür. Breast cancer, one of the commonly occurring cancer types in human life, is more prevalent in women compared to men. Although the exact causes of this cancer are not fully understood, various factors such as dietary habits, menstrual status, childbirth, and the use of birth control pills are believed to contribute to its development. Early detection of breast cancer is crucial for effective treatment. There are various methods for detecting breast cancer, one of which involves Magnetic Resonance (MR) imaging techniques. In this study, three different pre-trained CNN models, namely Inception V2, Resnet101, and Resnet-50, were used in conjunction with the Faster R-CNN deep learning method for lesion detection and classification in Mammogram images. A total of 500 mammography screening images, consisting of cancerous and normal images, were obtained from "The Digital Database for Screening Mammography - DDSM," an open-source digital database. Out of these images, 400 were annotated by radiologists, while 100 were unmarked mammogram images of unrelated cases. The lesion regions in the annotated 400 cancerous images were labeled using the LabelImg annotation tool and stored as XML files. Subsequently, these labeled images were used as the training dataset. The training of each of the three CNN models used in lesion detection was performed with 300,000 steps and a batch size of 1, in conjunction with the Faster R-CNN deep learning method. As a result of these experiments, the Inception V2 model achieved an accuracy of 97.16%, the ResNet101 model achieved an accuracy of 94.74%, and the best-performing ResNet-50 model achieved an accuracy of 99.63%. These results can provide valuable support for early diagnosis by medical experts in this field.
Furthermore, in the thesis, pre-trained CNN models were also used for benign and malignant tumor classification using the MIAS dataset. The training set consisted of 2016 benign and 4088 malignant images, while the validation set comprised 504 benign and 1024 malignant images. The training using the pre-trained models showed high success rates, as observed in the results of this study.