0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model
Authors :
Mehrdad Ghassabi
1
Pedram Rostami
2
Hamidreza Baradaran kashani
3
Amirhossein Poursina
4
Zahra Kazemi
5
Milad Tavakoli
6
1- دانشگاه اصفهان
2- دانشگاه تهران
3- دانشگاه اصفهان
4- دانشگاه علوم پزشکی اصفهان
5- دانشگاه اصفهان
6- دانشگاه اصفهان
Keywords :
persian medical question answering،small language model،medical language models،data crawling
Abstract :
The rapid advancement of language models has demonstrated the potential of artificial intelligence in the healthcare industry. However, small language models struggle with specialized domains in low-resource languages like Persian. While numerous medical-domain websites exist in Persian, no curated dataset or corpus has been available—making ours the first of its kind. This study explores the enhancement of medical knowledge in a small language model by leveraging accessible online data, including a crawled corpus from medical magazines and a dataset of real doctor-patient Q&A pairs. We fine-tuned a baseline model using our curated data to improve its medical knowledge.Benchmark evaluations demonstrate that the fine-tuned model achieves improved accuracy in medical question answering and provides better responses compared to its baseline. This work highlights the potential of leveraging open-access online data to enrich small language models in medical fields, providing a novel solution for Persian medical AI applications suitable for resource constrained environments.
Papers List
List of archived papers
هوش مصنوعی در توسعه علوم پایه: راهکارهای عملی برای تحقق تحول علمی و صنعتی
سارا سهیلی
سامانه ی یکپارچه و کمهزینه برای ثبت پتانسیلهای میدانی محلی (LFP) همگام با ویدئو و تحریک الکتریکیِ مغز بهکمک برچسبگذاری نوریِ کُدگذاریشده ی رخداد
حنیف صولت نیا - بیژن وثوقی وحدت
پیشبینی وقوع سکته مغزی با استفاده از دادههای پروندههای الکترونیکی مراقبتهای بهداشتی بیماران و شبکههای عصبی
عارفه یعقوبی - افشین ابراهیمی - پیوند قادریان
تحلیل و بررسی الگوریتمهای جستجوی رشته
مجید عبدالرزاق نژاد
Excessive and Variable Center of Mass Motion Characterizes Gait Instability In Women with Obese Knee Osteoarthritis
Diba Chegini - Behzad Yasrebi - Siamak Haghipour - Farhad Farhad Tabatabai Ghomsheh - Aliakbar Pahlevanian
بررسی میزان آشنایی پزشکان با هوش مصنوعی
بهارک یادگار جمشیدی - آرزو صدری - یوسف صادقمند - علیرضا مجد خیابانی
Magnetic Catheter Robot with Reduced Friction for Endovascular Minimally Invasive Access
Sina Eskandary - Mohammad Amin Salati - Rezayat Parvizi - Farhang Abbasi
نقش کلان داده در رویه ها و ابزارهای حسابداری مدیریت و مدیریت استراتژیک
یونس بادآور نهندی - مهدی زینالی - مینا فرنود احمدی
تحلیل نقش رایانش ابری در چابکی زنجیره تأمین
دکتر غلامرضا جمالی - توحید بهزادی فرد - حسن ایزدی فر
DMAEMA-based photocrosslinkable hydrogels with injectable capabilities for smart drug delivery systems in implant infections
Fatemeh Haj Sadeghi - Vahid Haddadi Asl - Hanie Ahmadi
more
Samin Hamayesh - Version 43.6.0