0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
Authors :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
Keywords :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
Abstract :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
Papers List
List of archived papers
Leveraging Normal White Matter Hyperintensity Context for Enhanced Pathological Segmentation via Multi-Class Deep Learning
Mahdi Bashiri Bawil - Mousa Shamsi - Ali Fahmi Jafargholkhanloo - Abolhassan Shakeri Bavil
گام بلند هوش مصنوعی در توسعه ارتباطات انسانی
کامیار لاوه ای
پیش بینی پیک بار تهران به کمک الگورتیم های یادگیری ماشین ترکیبی
مسعود ابراهیمی کاشف - حسین اقبالی - محمدعلی اقبالی
تاثیر قابلیت های فناوری اطلاعات بر کیفیت حسابرسی با نقش میانجی پذیرش هوش مصنوعی
حسین نیک آسا - حیدر محمدزاده سالطه
ارزیابی ریسک ملی و فراملی ( ریسک غیر مالی) (مطالعه موردی درکرواسی)
شبنم بالازاده قره باغی - فرهاد خداکرمی - امیرحسین باقری - مهتاب رنجبران
بررسی اثر ضد سرطانی لیپوزوم پگیله حاوی ترکیب جنسینوساید Rh2 بر سرطان روده بزرگ در مدل آزمایشگاهی و حیوانی
محسن زارع - ناهید حسن زاده نعمتی - هادی زارع زردینی
سواد مالی و رونق گردشگریT مطالعه موردی گردشگران شهر یزد
محمدعلی فیض پور - مهدیه پیروی - ریحانه بابائی - جمال برزگری خانقاه
Predictive Modeling of Astronaut Skin Microbiome Changes Using Machine Learning on NASA Multi-Omics Data
Mahdi Ansari - Abolfazl Hajihashemi - Mohammad Rafienia
Preparation and Characterization of Silicone Hydrogel Contact Lenses Based on TRIS-HEMA
Mahdiyeh Sedghi - Hakimeh Ghaleh - Sina Hajibababzadeh
3D Printing of Novel Bioactive Polycaprolactone Nanocomposites for Prospective Osteoporotic Bone Defect Engineering
Fateme Fathi - Hengameh Zolala - Farhad Esmailzadeh - Shohreh Mashyekhan - Irinia Kurzina
more
Samin Hamayesh - Version 42.5.2