0% Complete
English
صفحه اصلی
/
دومین کنفرانس ملی عصر انفجار تکنولوژی؛ هوش مصنوعی، تحولی در صنعت، تجارت و زنجیره تامین و دومین کنفرانس ملی علم داده در کاربردهای مهندسی
A Multi-Stage Ranking Pipeline for High-Precision Medical Information Retrieval
نویسندگان :
Asa Shabanian
1
Alireza Asl Nemati
2
Morteza Mohammadi Zanjireh
3
1- دانشگاه بین الملل امام خمینی
2- دانشگاه بین الملل امام خمینی
3- دانشگاه بین الملل امام خمینی
کلمات کلیدی :
Information Retrieval،Hybrid Search،Re-ranking،Large Language Models (LLMs)
چکیده :
Effective retrieval of biomedical information presents a significant challenge due to terminological complexity and semantic ambiguity. Traditional keyword-based methods like BM25 often fail to capture the user's semantic intent. To address this, we propose and empirically evaluate a multi-stage ranking architecture designed for high-precision retrieval. Our pipeline initiates with two parallel retrieval stages: a sparse lexical retriever (BM25) and a dense semantic retriever using a Bi-Encoder model (multi-qa-MiniLM-L6-cos-v1). The resulting candidate lists are then fused using Reciprocal Rank Fusion (RRF) to leverage their complementary strengths. In the final stage, a more powerful Cross-Encoder model (ms-marco-MiniLM-L-6-v2) re-ranks the top 100 candidates from the fused list to achieve fine-grained relevance scoring. Evaluated on the standard TREC-COVID dataset, our complete pipeline demonstrates substantial performance gains at each stage, culminating in a final Precision@10 of 0.808 and an nDCG@10 of 0.754. This represents a significant relative improvement of 68% and 69%, respectively, over the BM25 baseline. These results validate the efficacy of a cascaded retrieve-fuse-rerank architecture. Our work underscores the synergistic value of combining sparse, dense, and cross-attention models, providing a robust framework for developing high-performance information retrieval systems in specialized domains.
لیست مقالات
لیست مقالات بایگانی شده
شناسایی و رتبه بندی عوامل موفقیت در بهبود فروش در مدیریت زنجیره تأمین پنجرههای upvc با استفاده از AHP فازی Fuzzy
محمد اخشابی
Geometry-Aware Anisotropic Total Variation Regularization for Limited-View Photoacoustic Tomography
Amirreza Jodeiry - Zahra Kavehvash
Chondrocyte-Imprinted Substrates: Promoting MSC Chondrogenesis and Regulating Inflammatory Gene Expression
Parisa Madani - Sara Derhanbakhsh - Nasrin Salehi - Farzaneh Safshekan - Javad Mohammadi - Shahin Bonakdar
نوآوری در مدیریت ترافیک: راهبندهای هوشمند برای مسیرهای اختصاصی اتوبوسها
رضا حبیب زاده
کاربردهای پیشرفته هوش مصنوعی در تحول تجارت الکترونیک: از شخصیسازی تا تصمیمگیری شناختی
علی غلامنتاج - محمد عرفان رحمانیان کوشککی - امیدرضا حمیدی نیا - عباسعلی میرزایی فرد
HEALTH: Hyperbolic Embedding and Acoustic-based Learning for Topological Hierarchies in Parkinson’s Disease
Saghar Shafaati - S. Hossein Erfani
بررسی تأثیر اطلاعات محیطی شرکت و ریسک عدم بازپرداخت بدهیها بر ریسک سقوط قیمت سهام با توجه به نقش تعدیلگر بحران کمآبی
زهره حاجیها - شهرام کامکار
چارچوب احراز هویت مبتنی بر بلاکچین برای حفظ حریم خصوصی کاربران در شبکههای مخابراتی
رضا دانش
بررسی و مقایسه روشهای تشخیص جوامع در شبکههای اجتماعی با همافزایی الگوریتمهای تکاملی و یادگیری ماشین
زهرا انیسی نسب - محمد مصلح
عوامل موثر بر یکپارچه سازی سیستم مالی شرکت ها: مرور و تحلیل مبانی نظری و ادبیات علمی
محمدرضا مهربان پور - سپیده رهبر
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.2