| Tez Türü | Doktora |
| Ülke | Türkiye |
| Üniversite | Tokat Gaziosmanpaşa Üniversitesi |
| Enstitü | Lisansüstü Eğitim Enstitüsü |
| Anabilim Dalı | Bilgisayar Mühendisliği Ana Bilim Dalı |
| Tez Onay Yılı | 2025 |
| Öğrenci Adı ve Soyadı | Muhammed ÇELİK |
| Tez Danışmanı | DOÇ. DR. ÖZKAN İNİK |
| Türkçe Özet | Beyin tümörü sınıflandırması, suboptimal hiperparametre optimizasyonu, Evrişimli Sinir Ağları (ESA) ile Transformer mimarilerinin verimsiz entegrasyonu ve veri bağımlılığı gibi temel metodolojik boşluklar nedeniyle önemli zorluklar barındırmaktadır. Bu zorlukları gidermek amacıyla iki yenilikçi çerçeve sunulmuştur. İlk olarak, Hibrit ESA-Makine Öğrenmesi (MÖ) çerçevesi, ESA tabanlı özellikleri, hiperparametreleri Bayesyan Optimizasyon ile sistematik olarak ayarlanmış klasik makine öğrenmesi sınıflandırıcıları ile birleştirmiştir. İkinci ve temel katkı olan Vision Differential Transformer (ViDT) çerçevesi ise, dil modelleri için geliştirilmiş olan Diferansiyel Transformer mimarisini, tıbbi görüntüleme alanına ilk kez uyarlamıştır. Bu kapsamda, saf bir ViDT ve Hibrit ViDT (HViDT) modeli önerilmiştir. Deneysel sonuçlar, optimize edilmiş hibrit modellerden EfficientNetB0-SVM'in %97.93 doğruluğa ulaştığını göstermiştir. En önemli bulgu olarak, HViDT modeli, %99.31 gibi en ileri düzey bir test doğruluğuna ve 5-katlı çapraz doğrulamada %98.66 (±0.0035) gibi son derece kararlı bir ortalama doğruluğa ulaşmıştır. Kritik olarak, bu üst düzey başarım, veri artırımı veya ön-eğitim olmaksızın elde edilmiştir; bu da önerilen mimarinin yüksek veri verimliliğini kanıtlamaktadır. Ayrıca, Grad-CAM analizleri, HViDT modelinin dikkatini klinik olarak anlamlı patolojik bölgelere odakladığını görsel olarak doğrulamıştır. Sonuç olarak, sunulan yaklaşımlar, beyin tümörü sınıflandırması için yeni bir başarım ölçütü (benchmark) belirlemekte ve diferansiyel dikkat mekanizmasını, medikal görüntü analizi için güçlü, veri verimli ve yorumlanabilir bir araç olarak ortaya koymaktadır. |
| İlgilizce Özet | Brain tumor classification presents significant challenges stemming from key methodological gaps, including suboptimal hyperparameter optimization, inefficient integration of Convolutional Neural Networks (CNNs) and Transformer architectures, and heavy reliance on data-dependent processes. To address these challenges, two innovative frameworks are introduced. The first, a Hybrid CNN-Machine Learning (ML) framework, combines CNN-based features with classical machine learning classifiers whose hyperparameters are systematically tuned using Bayesian Optimization. The second and primary contribution, the Vision Differential Transformer (ViDT) framework, adapts the Differential Transformer architecture—originally developed for language models—to the field of medical imaging for the first time. Within this context, a pure ViDT and a hybrid ViDT (HViDT) model are proposed. Experimental results demonstrate that among the optimized hybrid models, the EfficientNetB0-SVM combination achieved an accuracy of 97.93%. Most significantly, the HViDT model attained a state-of-the-art test accuracy of 99.31% and a highly stable mean accuracy of 98.66% (±0.0035) in 5-fold cross-validation. Critically, this top-tier performance was achieved without data augmentation or pre-training, underscoring the high data efficiency of the proposed architecture. Furthermore, Grad-CAM analyses visually confirmed that the HViDT model focuses its attention on clinically relevant pathological regions. In conclusion, the presented approaches establish a new performance benchmark for brain tumor classification and introduce the differential attention mechanism as a powerful, data-efficient, and interpretable tool for medical image analysis. |