0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
Authors :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
Keywords :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
Abstract :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
Papers List
List of archived papers
تاثیر کیفیت گزارشگری مالی بر مالی سازی شرکت با تاکید بر هزینه های نمایندگی
حیدر محمدزاده سالطه - محمد احسانی - سید علی موسوی
کلیات قوانین و مقررات مرتبط با هوش مصنوعی
مجید حسن نژاد - مهدی خلفی
تاثیر هوش مصنوعی و فناوری های نوین بر بهبود بودجهبندی دولتی و کنترل مالی
مهدی زینالی - بهزاد محمودی - سمیه علیمرادی اشقلو
Transforming Sentiment Analysis with a New LLM Architecture
Hossein Gholamalinejad - Tahoora Ramezanimoghaddam
Gait-Triggered Neuromuscular Electrical Stimulation with Unloader Knee Braces: A Feasibility Study
Mohadeseh Jafarian - Reza Khosrozadeh Sarijalou - Amin Komeili - Kourosh Barati - Navid Arjmand
آینده پژوهی فرصتها و چالشهای احتمالی در صنعت بیمه ایران
حسین خانلو
مطالعه کامپوزیتهای سرامیکی هیدروکسیآپاتیت جهت استفاده در کاشتنیهای استخوانی
میلاد بدر - مهدیه سلطانعلیپور - جعفر خلیلعلافی
کاربردها، تکنیکها، چالشها و ملاحظات اخلاقی و اجتماعی در سیستمهای پیشنهاددهنده
کیانا رحیمی - سمانه شیبانی
Finite Element Analysis of Lumbar Spine Biomechanics Following Cement Augmentation with Different PMMA Volumes: A Comparison with Intact Spine
Reihane Yazdani - Mohammdjavad (Matin) EinaAfshar - Azadeh Ghoochani - Nima Jamshidi
یادگیری عمیق برای ادراک رباتیک مقاوم در محیط های غیرساختارمند
سجاد یوسفی - مریم پورنجف - سمیرا حسینی - سوسن نصرتی - سمیه باقری
more
Samin Hamayesh - Version 42.4.6