0% Complete
English
صفحه اصلی
/
دومین کنفرانس ملی عصر انفجار تکنولوژی؛ هوش مصنوعی، تحولی در صنعت، تجارت و زنجیره تامین و دومین کنفرانس ملی علم داده در کاربردهای مهندسی
A Multi-Stage Ranking Pipeline for High-Precision Medical Information Retrieval
نویسندگان :
Asa Shabanian
1
Alireza Asl Nemati
2
Morteza Mohammadi Zanjireh
3
1- دانشگاه بین الملل امام خمینی
2- دانشگاه بین الملل امام خمینی
3- دانشگاه بین الملل امام خمینی
کلمات کلیدی :
Information Retrieval،Hybrid Search،Re-ranking،Large Language Models (LLMs)
چکیده :
Effective retrieval of biomedical information presents a significant challenge due to terminological complexity and semantic ambiguity. Traditional keyword-based methods like BM25 often fail to capture the user's semantic intent. To address this, we propose and empirically evaluate a multi-stage ranking architecture designed for high-precision retrieval. Our pipeline initiates with two parallel retrieval stages: a sparse lexical retriever (BM25) and a dense semantic retriever using a Bi-Encoder model (multi-qa-MiniLM-L6-cos-v1). The resulting candidate lists are then fused using Reciprocal Rank Fusion (RRF) to leverage their complementary strengths. In the final stage, a more powerful Cross-Encoder model (ms-marco-MiniLM-L-6-v2) re-ranks the top 100 candidates from the fused list to achieve fine-grained relevance scoring. Evaluated on the standard TREC-COVID dataset, our complete pipeline demonstrates substantial performance gains at each stage, culminating in a final Precision@10 of 0.808 and an nDCG@10 of 0.754. This represents a significant relative improvement of 68% and 69%, respectively, over the BM25 baseline. These results validate the efficacy of a cascaded retrieve-fuse-rerank architecture. Our work underscores the synergistic value of combining sparse, dense, and cross-attention models, providing a robust framework for developing high-performance information retrieval systems in specialized domains.
لیست مقالات
لیست مقالات بایگانی شده
Multiclass ICU Length-of-Stay Prediction Using Tree-Based Machine Learning Techniques
Mahyar Mohammadian - Somayeh Afrasiabi
A vortex-promoting cross-junction microchannel for efficient hydroporation in immunotherapy applications
Soheil Mahdavi - Zohre Nazemi Dehkordi - Ali Abouei Mehrizi
بررسی رهایش هوشمند داروی زولدرنیک اسید از نانوذره پلی دوپامین
پیام ردایی - فریبا گنجی - شهره مشایخان - منیژه مختاری دیزجی - سید ابراهیم واشقانی فراهانی - فاطمه باقری
Robust Binary Differentiation of ALL vs. AML Using Deep Graph Convolutions
Mahsan Rahmani - Saeed Meshgini - Reza Afrouzian
Region-Specific EEG Channel-Based Emotion Detection using Bi-directional Deep Neural Networks
Mahdi Jafari Asl - Sina Shamekhi - Fatemeh Shalchizadeh
نوآوری در امنیت هوشمند: طراحی سیستمهای AI با مقاومت ذاتی در برابر تهدیدات سایبری
علی غلام نتاج - محمد عرفان رحمانیان کوشککی - امیدرضا حمیدی نیا - محمد مهدی افتخاری
Evaluation of Mechanical and Biological Properties of PCL-coated Magnesium Scaffolds
Fatemeh Sharifabadi - Sayed Khatiboleslam Sadrnezhaad
Topology Optimization for Optimal Design of Human Tibial Fixation Plates toward Improving Biomechanical Compatibility
Aida Ahmadi - Taha Goudarzi
بررسی تاثیر انعطاف پذیری مالی بر رابطه بین مدیریت ریسک و اجتناب مالیاتی
علیرضا عظیمی ثانی - رضا پورتقی
پیشبینی نمرات دروس دانشگاهی با استفاده از الگوریتم رگرسیون خطی در یادگیری ماشین
سجاد یوسفی - مریم پورنجف - هانیه شیری
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.4.1