0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
Authors :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
Keywords :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
Abstract :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
Papers List
List of archived papers
تاثیر قابلیت های فناوری اطلاعات بر کیفیت حسابرسی با نقش میانجی پذیرش هوش مصنوعی
حسین نیک آسا - حیدر محمدزاده سالطه
شناسایی و اولویت بندی قابلیت های پویای حسابداری دایره ای بر مبنای جریان های مواد در اقتصاد دایره ای
ایران فخری نژاد
ایجاد پوشش کامپوزیتی HA-TiO₂ بر روی آلیاژ زیستتخریبپذیر منیزیم به روش رسوبدهی الکتروفورتیک
سید محمد مکی - حسن جعفری - فاطمه سادات پیشبین - سلیمان خوشرو
مروری بر توسعه نرمافزار برای دستگاههای اینترنت اشیا
سجاد یوسفی - مریم پورنجف - ایدا اسدی
بررسی استقرار مدیریت دانش در شرکت آب و فاضلاب استان خراسان جنوبی
محدثه مشفقی - محسن صفاریان - محمد کاظمی - مهدی کیخای مقدم - نسیبه موحدفر
هوش مصنوعی و آینده بشریت با رویکرد مالی و اقتصادی
مهدی زینالی - شبنم بالازاده قره باغی - مهدیه نامی بسیط
شناسایی عوامل موثر بر انتخاب حسابرس با تاکید بر عدم اطمینان محیطی
امین بلوری - عیسی ابیضی - محدثه نعیمی
نقش هوش مصنوعی در چابکی زنجیره تامین بر اساس دیدگاه زنجیره تامین بشردوستانه
اسماعیل محبی کندسری
علیت بین توسعه مالی و نوع ابزارهای مالی از نظر مدیریت پرتفولیو
فاطمه خسروی
Hierarchical Task-Structured GNN Meta-Learning for Few-Shot EEG Motor Imagery Decoding
Mohammad Armin Dehghan - Mohammad Mohammadianbisheh - Mohammad Bagher Shamsollahi
more
Samin Hamayesh - Version 43.6.0