0% Complete
English
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
نویسندگان :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
کلمات کلیدی :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
چکیده :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
لیست مقالات
لیست مقالات بایگانی شده
شناسایی عوامل موثر بر تمایل به فرار مالیاتی با در نظر گرفتن عوامل فرهنگی با رویکرد تحلیل مضمون
نیما صدری نوبر زاد - پریسا صدری نوبر زاد
ارزیابی ساختار بازار حسابرسی در ایجاد ارزش افزوده اقتصادی در صنعت فولاد
کریم ستاری - محمدرضا عباسی استمال
تاثیر رویکرد حسابداری و مالی بر قضاوت وتصمیم گیری اثر خود هویتی سبز بر تغییر قصدخرید با نقش میانجی ارزش ادراکی و تعدیل کنندگی خودهمسویی ( مورد مطالعه :مشتریان فروشگاه اینترنتی جوپزی)
حسین بوذری
استفاده از هوش مصنوعی در پزشکی و تشخیص بیماری
مهیار زهرابی
راهکارهای عملی برای اجرای موفق پروژههای هوش مصنوعی در ایران
ملینا عبدلی
Evaluation of Mechanical and Biological Properties of PCL-coated Magnesium Scaffolds
Fatemeh Sharifabadi - Sayed Khatiboleslam Sadrnezhaad
Physics-Informed Neural Networks for Cardiac Flow Estimation in 2D Simplified Human Right Ventricular Geometry
Mohammadmahdi Sekhavatpisheh - Nasser Fatouraee
روش ترکیبی مبتنی بر ماشین بردار پشتیبان با الگوریتم بهینه سازی کلاغ برای دسته بندی متون
آیسودا علیزاده - فرهاد سلیمانیان قره چپق
تبیین عوامل مؤثر بازاریابی محتوای دیجیتال و هوش مصنوعی بر روابط شرکتها با برندها
حسین بوذری
نقش هوش مصنوعی در بهینهسازی مدیریت و بهرهبرداری از منابع در رایانش ابری
احمد محسن پورگلروئیه - مهدی رضاپورمیرصالح
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.2