0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
Authors :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
Keywords :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
Abstract :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
Papers List
List of archived papers
ارتباط بین روابط سیاسی و افشای مسئولیت پذیری اجتماعی شرکت
بیتا دلنواز اصغری - مهنا پیرایه جو - نیما رضااوغلی سقا - مائده خاکسار
بررسی نقش شفافیت اطلاعات مالی و حسابرسی مالیاتی در بهبود تمکین مالیاتی و تأثیر آن بر رشد اقتصادی پایدار
الهه آقاخانی - مرتضی خانلاری
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model
Mehrdad Ghassabi - Pedram Rostami - Hamidreza Baradaran kashani - Amirhossein Poursina - Zahra Kazemi - Milad Tavakoli
Towards Accurate Multimodal Defformable Image Registration via Image Translation and Weak Supervision
Maryam Nasr - Mohammadreza Yazdchi - Mohsen Safdari
بررسی رابطه عملکرد اجتماعی، زیست محیطی با عملکرد مالی شرکت های بورس اوراق بهادار تهران
بنفشه فهیمی نیری - حسین بوداقی خواجه نوبر
Machine Learning and Deep Learning Approaches for Fake News Detection: A Comprehensive Survey
Arian Hajati - Azita Shirazipour - Seyed Javad Mirabedini
بررسی کاربرد تکنیک های هوش مصنوعی در سیستم های توصیه گر
آسیه یاوری - علی اکبر نقابی
تاثیر سوء گیری مالی بر قابلیت مقایسه اطلاعات مالی با تاکید بر کیفیت حسابرسی
ابراهیم نویدی عباسپور - صالح بهروز گجین
تاثیر ابزارهای هوش مصنوعی بر عملیات حسابداری و حسابرسی در ایران با در نظر گرفتن نقش تعدیلگری حاکمیت فناوری اطلاعات
میلاد تابع اصفهانی - زهره زیودار
مروری برسیاست های مالیاتی ارزهای دیجیتال : چالش ها و فرصت ها در دنیای اقتصاد نوین
نعمت رستمی مازویی - بهروز رادپور
more
Samin Hamayesh - Version 42.5.2