Difüzyon model tabanlı asimetrik dikkat mekanizmaları kullanılarak kardiyak Mr görüntü verisi arttırımı / Mertcan Özdemir; thesis advisor Osman Eroğul.
Material type:
TextLanguage: Türkçe Publisher: Ankara : TOBB ETÜ Fen Bilimleri Enstitüsü, 2025Description: xviii, 121 pages : illustrations ; 29 cmContent type: - text
- unmediated
- volume
- Diffusion model-based augmentation using asymmetric attention mechanisms for cardiac Mri images
| Item type | Current library | Home library | Collection | Call number | Copy number | Status | Date due | Barcode | |
|---|---|---|---|---|---|---|---|---|---|
Thesis
|
Merkez Kütüphane Tez Koleksiyonu / Thesis Collection | Merkez Kütüphane | Tezler | TEZ TOBB FBE BMM Ph.D’25 ÖZD (Browse shelf(Opens below)) | 1 | Ödünç Verilemez-Tez / Not For Loan-Thesis | TZ01893 |
Tez (Doktora Tezi)--TOBB ETÜ Fen Bilimleri Enstitüsü Aralık 2025
Kardiyovasküler hastalıklar, dünya genelinde en önemli ölüm nedenlerinden birini oluşturmakta ve her yıl yaklaşık 19,8 milyon insanın hayatını kaybetmesine yol açmaktadır. Kardiyak manyetik rezonans (CMR) görüntüleme, kalp hastalıklarının tanısında altın standart olarak kabul edilmekle birlikte, derin öğrenme tabanlı tanı sistemlerinin geliştirilmesi için gerekli büyük ölçekli etiketli veri setlerinin oluşturulması, uzman etiketleme maliyetleri, etik kısıtlamalar ve nadir patolojilerin yetersiz temsili nedeniyle ciddi zorluklarla karşı karşıyadır. Bu tez, kardiyak MR görüntülemede veri yetersizliği problemini çözmek amacıyla asimetrik dikkat mekanizmalı difüzyon modeli tabanlı yeni bir bireşimsel görüntü üretim yöntemi önermektedir. Önerilen yaklaşım, Denoising Diffusion Probabilistic Model (DDPM) çerçevesini temel almakta ve UNet mimarisinde kodlayıcının son iki katmanı ile kod çözücünün ilk iki katmanına stratejik olarak yerleştirilmiş çok başlıklı öz-dikkat mekanizmalarını içermektedir. Bu asimetrik dikkat yerleşimi, hesaplama verimliliği ile anatomik yapı korunumu arasında optimal bir denge sağlamaktadır. Model, 53 sağlıklı gönüllüden elde edilen OCMR (Open Cardiac MR) veri kümesi üzerinde eğitilmiş ve 128×128 piksel çözünürlüğünde bSSFP sekans görüntüleri ile çalışılmıştır. Kapsamlı deneysel değerlendirmeler, önerilen modelin mevcut yöntemlere kıyasla üstün performans sergilediğini ortaya koymuştur. Model, 77,78 FID skoru ile VAE (325,26), WGAN-GP (235,51) ve StyleGAN2-ADA (117,70) modellerine göre anlamlı ölçüde daha iyi sonuçlar elde etmiştir. Yapısal benzerlik metrikleri açısından 0,720 SSIM ve 0,925 MS-SSIM değerleri, üretilen görüntülerin yüksek anatomik tutarlılığını doğrulamaktadır. Ablasyon çalışmaları, asimetrik dikkat yerleşiminin tekdüze dağılıma göre FID skorunda %8,8 iyileşme sağladığını göstermiştir. Üç deneyimli radyolog tarafından gerçekleştirilen klinik Turing testinde %60 doğruluk oranı elde edilmesi, bireşimsel görüntülerin gerçek görüntülerden ayırt edilmesinin zorluğunu ortaya koymuştur. Ayrıca, sol ventrikül, sağ ventrikül ve miyokard yapılarının piksel oranları ile şekil özellikleri açısından gerçek ve bireşimsel görüntüler arasında istatistiksel olarak anlamlı bir fark bulunmamıştır (p > 0,05). Bu tez, kardiyak MR görüntü sentezinde difüzyon modelleri için asimetrik dikkat mekanizması optimizasyonu konusunda özgün bir katkı sunmakta ve üretilen bireşimsel verilerin klinik uygulanabilirliğini kapsamlı bir değerlendirme çerçevesiyle ortaya koymaktadır. Sonuçlar, önerilen yaklaşımın veri artırma, gizlilik korumalı veri paylaşımı ve tıp eğitimi gibi alanlarda önemli potansiyel taşıdığını göstermektedir.
Cardiovascular diseases constitute one of the leading causes of mortality worldwide, claiming approximately 19.8 million lives annually. Although cardiac magnetic resonance (CMR) imaging is considered the gold standard for diagnosing heart diseases, the development of deep learning-based diagnostic systems faces significant challenges due to expert labeling costs, ethical constraints, and inadequate representation of rare pathologies in creating large-scale labeled datasets. This thesis proposes a novel synthetic image generation method based on a diffusion model with asymmetric attention mechanisms to address the data scarcity problem in cardiac MR imaging. The proposed approach is built upon the Denoising Diffusion Probabilistic Model (DDPM) framework and incorporates multi-head self-attention mechanisms strategically placed in the last two layers of the encoder and the first two layers of the decoder within the UNet architecture. This asymmetric attention placement achieves an optimal balance between computational efficiency and anatomical structure preservation. The model was trained on the OCMR (Open Cardiac MR) dataset obtained from 53 healthy volunteers, working with bSSFP sequence images at 128×128 pixel resolution. Comprehensive experimental evaluations demonstrated that the proposed model exhibits superior performance compared to existing methods. The model achieved an FID score of 77.78, significantly outperforming VAE (325.26), WGAN-GP (235.51), and StyleGAN2-ADA (117.70). Structural similarity metrics of 0.720 SSIM and 0.925 MS-SSIM confirm the high anatomical consistency of the generated images. Ablation studies showed that the asymmetric attention placement provides an 8.8% improvement in FID score compared to uniform distribution. A clinical Turing test conducted by three experienced radiologists yielded a 60% accuracy rate, demonstrating the difficulty in distinguishing synthetic images from real ones. Furthermore, no statistically significant differences were found between real and synthetic images in terms of pixel ratios and shape features of the left ventricle, right ventricle, and myocardium structures (p > 0.05). This thesis presents an original contribution to asymmetric attention mechanism optimization for diffusion models in cardiac MR image synthesis and demonstrates the clinical applicability of the generated synthetic data through a comprehensive evaluation framework. The results indicate that the proposed approach holds significant potential in areas such as data augmentation, privacy-preserving data sharing, and medical education.
There are no comments on this title.
