0% Complete
English
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model
نویسندگان :
Mehrdad Ghassabi
1
Pedram Rostami
2
Hamidreza Baradaran kashani
3
Amirhossein Poursina
4
Zahra Kazemi
5
Milad Tavakoli
6
1- دانشگاه اصفهان
2- دانشگاه تهران
3- دانشگاه اصفهان
4- دانشگاه علوم پزشکی اصفهان
5- دانشگاه اصفهان
6- دانشگاه اصفهان
کلمات کلیدی :
persian medical question answering،small language model،medical language models،data crawling
چکیده :
The rapid advancement of language models has demonstrated the potential of artificial intelligence in the healthcare industry. However, small language models struggle with specialized domains in low-resource languages like Persian. While numerous medical-domain websites exist in Persian, no curated dataset or corpus has been available—making ours the first of its kind. This study explores the enhancement of medical knowledge in a small language model by leveraging accessible online data, including a crawled corpus from medical magazines and a dataset of real doctor-patient Q&A pairs. We fine-tuned a baseline model using our curated data to improve its medical knowledge.Benchmark evaluations demonstrate that the fine-tuned model achieves improved accuracy in medical question answering and provides better responses compared to its baseline. This work highlights the potential of leveraging open-access online data to enrich small language models in medical fields, providing a novel solution for Persian medical AI applications suitable for resource constrained environments.
لیست مقالات
لیست مقالات بایگانی شده
HEALTH: Hyperbolic Embedding and Acoustic-based Learning for Topological Hierarchies in Parkinson’s Disease
Saghar Shafaati - S. Hossein Erfani
Graph Convolutional Network–Based Surrogate Modeling for MRI-EEG Connectivity Analysis
Arshia Rezaei - Bahareh Abbaszadeh
بررسی تأثیر مالکیت نهادی بر رابطه بین انحراف استراتژیک شرکت از صنعت و گزارشگری پایداری
ناصر مست چمن - محمد پورکریم
بررسی عوامل موثر و پیامدهای افشاگری تقلب در میان شاغلین حسابداری
زهره عارف منش - زهرا سادات خاشعی
Parkinson’s Disease Classification Using EEG and a Hybrid EEGNet–LSTM Architecture
Pouya Taghipour Langrodi - Amirsadra Khodadadi - Ali Sadat Modaresi - Mohammad Ahadzadeh - Mostafa Rostami - Sadegh Madadi
شناسایی پیشرانهای حسابداری مسئولیت اجتماعی شرکتی در ایران: بررسی عوامل مؤثر و چالشها
امیر محبی - فرزین رضایی - مهدی بشکوه - غلامرضا کردستانی
مروری بر ترجمه زبان های ناشناخته یا باستانی با استفاده از یادگیری عمیق
علی عبدالعظیمی - سید حسن مرتضوی
EEG Graph Construction: A Comparative Analysis for Classification Application
Kiana Kalantari - Mohammad Bagher Shamsollahi
چالشهای اخلاقی استفاده از هوش مصنوعی در پیشبینی رفتار مصرفکننده: مطالعه موردی در تجارت الکترونیکی
علی نادرزاده ینگجه
تاثیر مولفه های هوش معنوی بر قضاوت حرفه ای حسابرسان
علیرضا عظیمی ثانی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.4.1