0% Complete
English
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
نویسندگان :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
کلمات کلیدی :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
چکیده :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
لیست مقالات
لیست مقالات بایگانی شده
A Real-Time Integrated Framework for Face Detection, Gender, and Emotion Recognition Using Convolutional Neural Networks
Mostafa Asgarinejad - Elias Ebrahimzadeh - Vida Mirabolfathi - Lila Rajabion - Hamid Soltanian-Zadeh
رابطه میان ماکیاولیسم و بی طرفی حسابرس
میر امید یوسفی شارمی - بهمن بنی مهد - مهدی مرادزاده فرد - بهرام همتی
بررسی و تحلیل محتوای تغییرات حسابداری در بستر بلاکچین
زهرا شیخی - سپیده زارع خورمیزی
ارتباط بین عملکرد پایداری و سرمایه گذاری بیشتر و کمتر از حد
سعید انور خطیبی - علی زارع بهتاشی
محاسبه نیروی عضلانی اندام تحتانی و نیروی تماسی مفصل زانو در بیماران مبتلا به استئوآرتریت زانو
مجتبی صفری - محمد نجفی آشتیانی - فاطمه السادات علوی
Magnetic Catheter Robot with Reduced Friction for Endovascular Minimally Invasive Access
Sina Eskandary - Mohammad Amin Salati - Rezayat Parvizi - Farhang Abbasi
کاربرد هوش مصنوعی در پیشبینی دمای هوای ماهیانه
مریم حدادی
Microfluidic Generation of Core-Shell Breast Tumor Spheroids for Evaluating Dose-Dependent Responses to Quercetin
Fatemeh Zarei - Mohammad Hashem Molayemat - Amir Shamloo - Mohammad Mehdi Sadeghian
Development of an Explainable Random Forest-Based Algorithm for EEG-Based Sleep–Wake Classification Toward Sleep Apnea Detection
Pargol Sharifi - Mohammad Fakharzadeh
EEG Graph Construction: A Comparative Analysis for Classification Application
Kiana Kalantari - Mohammad Bagher Shamsollahi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.2