0% Complete
English
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
نویسندگان :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
کلمات کلیدی :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
چکیده :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
لیست مقالات
لیست مقالات بایگانی شده
Data Mining in the Age of Information Explosion: An Intelligent Analysis Tool for Social Media
Hossein Bodaghi Khajeh Noubar - Seyed Meead Hosseini - Shiva Mohammadi
علم داده به عنوان شتابدهنده نوآوری در صنعت مهندسی
رامین احمدپور
ارزیابی و وقوع تئوری آشوب با ماهیت تصادفی در سیستم های هوشمند
مهران جوانی
Recent Advances and Open Challenges in Explainable AI for Deep Learning-based Recommender Systems
Narjes Badpar - Azita Shirazipour - Seyed Javad Mirabedini
تحلیل نقش رایانش ابری در چابکی زنجیره تأمین
دکتر غلامرضا جمالی - توحید بهزادی فرد - حسن ایزدی فر
نقش حسابداری مدیریت استراتژیک در تصمیمگیری استراتژیک
محمدرضا مهربان پور - جواد محمدی مهر
کاربرد هوش مصنوعی در ارتقای امنیت اینترنت اشیاء: از الگوریتمهای یادگیری عمیق تا استراتژیهای سازمانی
علی غلام نتاج - محمدعرفان رحمانیان کوشککی - امیدرضا حمیدی نیا - عباسعلی میرزایی فرد
مروری بر نظام مسئله پیشبینی محبوبیت اخبار و الگوریتمهای ارائه شده برای آن
مجتبی ولی پور - مجید عبدالرزاق نژاد
High-throughput microfluidic electroporation system using 3D-hydrodynamic focusing
Zohre Nazemi Dehkordi - Ali Abouei Mehrizi
Ultimate Failure Load of Plate-Based Fixation and a Suture Anchor for Rotator Cuff Repair Across Polyurethane Bone Densities
Parviz Ahangar - Solmaz Mojadam Mofrad - Amir Nourani - Amirhasan Amini - Erfan Ahmadpour Joeini - Mohammad nasir Naderi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.4.1