0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
TransFuse++: A Hybrid CNN-Transformer Architecture with Cross-Attention, Temporal Modeling, and Uncertainty Estimation for Medical Image Segmentation
Authors :
Masoud Noroozi
1
Sayna Jamaati
2
Hamed Aghapanah
3
Ali Saeeidi Rad
4
Mahsa Asadi Anar
5
Ali Darzi
6
Mahla Shokouhfar
7
Helia Sadat Kazemi
8
Mohammadreza Ghahari
9
Mohammad Saeed Soleimani Meigoli
10
Jafar Majidpour
11
Hossein Arabi
12
Ali Reza Karimian
13
1- گروه مهندسی پزشکی، دانشکده مهندسی، دانشگاه اصفهان
2- دانشگاه صنعتی شریف
3- دانشگاه علوم پزشکی اصفهان
4- گروه مهندسی پزشکی، دانشکده مهندسی، دانشگاه اصفهان
5- دانشگاه علوم پزشکی شهید بهشتی
6- دانشگاه علوم پزشکی شهید بهشتی
7- دانشگاه علوم پزشکی شهید بهشتی
8- دانشگاه علوم پزشکی شهید بهشتی
9- دانشگاه علوم پزشکی تهران
10- دانشگاه علوم پزشکی فسا
11- دانشگاه راپارین
12- دانشگاه ژنو
13- گروه مهندسی پزشکی، دانشکده مهندسی، دانشگاه اصفهان
Keywords :
Hybrid CNN-Transformer Architecture،Medical Image Segmentation،Cross-Attention Mechanism،Temporal Modeling،Uncertainty Estimation،Deep Learning
Abstract :
Similar to any automated image analysis, precise and credible segmentation is indispensable; however, current convolutional or transformer-based networks alone cannot produce the necessary satisfactory spatial resolution, paired with anatomical global thought and volumetric consistency, in medical practice. We introduce TransFuse++, a promising step that offers incremental improvements to the TransFuse architecture, which closely integrates a CNN branch for local texture representation and a Vision Transformer branch for long-term context encoding. The model is further improved with three new modules: a cross-attention mechanism that explicitly aligns the slices, a model with a gated recurrent unit (GRU) that propagates time through stacked sequences, and Monte Carlo dropout that produces pixel-based uncertainty maps. Furthermore, context-dependent cross-skip attention fusion, along with an enhanced BiFusion head, enables more precise boundary delineation without a notable increase in computational cost in the default (no-MC) configuration. When trained in an end-to-end manner on a cardiac X-ray (1,717 frames), a lung CT (6,766 slices) and MR of cirrhotic liver (more than 600 volumes) datasets with an identical 5-fold cross validation protocol, we observe improvements of up to 4.1 percentage points in terms of Dice coefficient and 4.3 percentage points in terms of mIoU, obtaining Dice = 0.972 ± 0.002 (X-ray), 0.989 ± 0.001 (CT) and 0.923 ± 0.061 (MRI). The analysis using Spearman correlation revealed that the per-image Dice coefficients of competing models were either not related to each other (|ρ| ≤ 0.06, Bonferroni-adjusted p > 0.005) or that they introduced complementary specific errors in addition to existing architectures. Ablation experiments validate that cross-attention, temporal modeling, and cross-skipping fusion are key contributors to these incremental improvements. Meanwhile, the uncertainty maps help identify ambiguous areas, making TransFuse++ a promising step toward a confidence-aware segmentation approach for multimodal radiology.
Papers List
List of archived papers
معرفی معیار کمیسازی الگوهای متیلاسیون DNA در ژنوم
نغمه سادات ناظر کاخکی - نرجس الهدی محمدزاده - محیا مهرمحمدی
بررسی روش های تشخیص فیشینگ با استفاده از یادگیری ماشین
حامد منکرسی - غلامرضا احمدی
تشخیص حملات اینترنتی با مدل های زبانی بزرگ تقطیری در شبکه های توزیع شده
جواد جهانگیری درزه کنانی - امین بابازاده
بررسی رابطه بین توانایی مدیران و تاخیر قیمت سهام شرکتهای پذیرفتهشده در بورس اوراق بهادار تهران
حمیدرضا عزیزی
تاثیر تجربه و شایستگی حسابرس بر اثربخشی حسابرسی با نقش میانجی گری توسعه حرفه ای حسابرسان
امین صفری - آرش درخشان مهر - مسعود احمدی منصورآباد
یادگیری عمیق مبتنی بر مکانیسم توجه جمعیت برای تحلیل احساسات بلادرنگ در چتهای زنده یوتیوب
علی فرزین
Mapping Epileptic Networks: IED-Triggered Hemodynamic Changes Identified via Simultaneous EEG-fMRI Recordings
Elias Ebrahimzadeh - Mostafa Asgarinejad - Melika Akbarimehr - Hamid Soltanian-Zadeh
A Telemedicine Approach to Therapist-Free VR Exposure Therapy for Acrophobia: A pilot study
Arya Gholipoor Hanizi - Samaneh Minakhani - Poorya Gholipoor
Argeted Cancer Treatment Through Tissue Engineering and Biomaterial-Based Drug Delivery Systems:
Laleh Etemad-Ghazani - Mina Saddi-Khelejan - Mahdi Hasanpour
Optimal Control and Emergence of Kinematic Synergies in Underactuated Biped Locomotion
Mahdi Alipoor - Masoud Yousefi - Farzam Farahmand
more
Samin Hamayesh - Version 42.4.6