سامانه همایش‌ها TSTA | ثبت‌نام و ارسال مقاله کنفرانس‌ها و کنگره‌های ملی

فارسی

Home / سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران

Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football

Authors :

Mohammad Pashaei¹ Amirhossein Tayebi² Hadi Amiri³ Ali Fahim⁴

1- Department of Engineering Science, University of Tehran, Tehran, Iran 2- Department of Engineering Science, University of Tehran, Tehran, Iran 3- Department of Engineering Science, University of Tehran, Tehran, Iran 4- Department of Engineering Science, University of Tehran, Tehran, Iran

Keywords :

Reinforcement Learning،Multi-agent systems،Soccer Simulation

Abstract :

Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.

List of archived papers

نقش هوش مصنوعی در شخصی‌سازی تجربه مشتری: بررسی رفتار مصرف‌کننده در فروشگاه‌های آنلاین

بهزاد بالازاده - حسین بوداقی - نازلی قراچورلو

نوآوری در مدیریت ترافیک: راهبندهای هوشمند برای مسیرهای اختصاصی اتوبوس‌ها

رضا حبیب زاده

Simulation of Mechanical Property Changes in Biodegradable Scaffolds under Various Loading Conditions

ELNAZ ABEDINI - Mehdi Mehri

مروری بر نظام مسئله پیش‌بینی محبوبیت اخبار و الگوریتم‌های ارائه شده برای آن

مجتبی ولی پور - مجید عبدالرزاق نژاد

بررسی تأثیر بالقوه فناوری بلاکچین بر کاهش مدیریت سود در شرکتهای بورسی: یک تحلیل مبتنی بر نگرش کارشناسان و متخصصین

ضرغام داداش زاده

ساخت و مشخصه یابی چسب زیست‌الهام برپایه ژلاتین با اتصالات دوگانه آرژنین و اسید کافئیک برای هموستاز سریع

غزل یعقوبی - مهشید خرازیها

کاربرد هوش مصنوعی در ایجاد شبکه های صنعتی تولیدکنندگان قطعات خودرو

بهاره رضاپور - حسین بوداقی خواجه نوبر

بهبود عملکرد سیستم‌های شناسایی بدافزار با تلفیق شبکه‌های عصبی کانولوشن و الگوریتم جنگل تصادفی

بهزاد شاه پسندی - مجید مزینانی

Adaptive neuro-fuzzy inference system (ANFIS) for prediction the gibbs energy of formation

Aboozar Khajeh

نوآوری در امنیت هوشمند: طراحی سیستم‌های AI با مقاومت ذاتی در برابر تهدیدات سایبری

علی غلام نتاج - محمد عرفان رحمانیان کوشککی - امیدرضا حمیدی نیا - محمد مهدی افتخاری

more

Samin Hamayesh - Version 44.4.0