0% Complete
English
☰
صفحه اصلی
کنفرانسهای فعال
مدیریت منابع انسانی پایدار
حسابداری
بازاریابی و برندینگ در عصر هوش مصنوعی
هوش مصنوعی:نوآوری، کسبوکار و آموزش
ارشیو کنفرانسها
اولین کنفرانس ملی هوش مصنوعی
دومین کنفرانس ملی هوش مصنوعی
اولین کنگره ملی حسابداری، مالی و مالیاتی
32کنفرانس بین المللی زیست پزشکی
راهنمای شرکت
نحوه ثبتنام
ثبت نام مدیریت منابع انسانی پایدار
ثبت نام دومین کنگره ملی حسابداری
ثبت نام سومین کنفرانس ملی هوش مصنوعی
ثیت نام بازاریابی و برندینگ در عصر هوش مصنوعی
ثبت نام زنجیره ارزش نفت گاز و پتروشیمی
ارسال مقاله
فرمت مقالات مدیریت منابع انسانی پایدار
فرمت مقالات سیستم های هوشمند حسابداری
فرمت مقالات ملی بازاریابی و برندینگ در عصر هوش مصنوعی
فرمت مقالات سومین کنفرانس هوش مصنوعی
سوالات متداول
اخبار و رویدادها
درباره ما
تماس با ما
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
نویسندگان :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
کلمات کلیدی :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
چکیده :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
لیست مقالات
لیست مقالات بایگانی شده
هوش مصنوعی و مفاهیم مالی و حسابداری با تاکید برحاکمیت شرکتی
مهدی زینالی - رعنا کمالی
پیشنهاد درمان شخصیسازیشده برای بیماران OCD با یادگیری تقویتی
سمیه حسینی زنوزی
تأثیر فعالیت های بازاریابی تجربی بر تجربه مشتری در متاورس: نقش واسطه ای سهولت درک شده و سودمندی درک شده و تأثیر آن بر عشق به برند
آیسان خضرلو - سید جعفر زنوزی
همآوایی در شبکهای جهانکوچک و متشکل از نورونهای ممریستوری
محمدمهدی شیرزاد - مهتاب مهراب بیک - سجاد جعفری
بررسی فرآیند مدیریت منابع انسانی بر عملکرد کارکنان سازمان مالیاتی با میانجی رضایت شغلی و تعدیلگری تعهد شغلی (مورد مطالعه: اداره امور مالیاتی تبریز)
پریسا صدری نوبرزاده - نیما صدری نوبرزاده
بررسی تاثیر کیفیت خدمات، ارزش درک شده و تصویر شرکت بر رویکرد نگرشی مشتریان در بانکداری
امیر محمدپور - یاسین فخیم عبدالهی - محمد همت زاده
بررسی تاثیر انعطاف پذیری مالی بر رابطه بین مدیریت ریسک و اجتناب مالیاتی
علیرضا عظیمی ثانی - رضا پورتقی
Experimental Framework for Quantifying Muscle Force-Length Behavior in Dynamic Exercise
Erfan Farahani - Manizheh Zakeri - Mohammad-Reza Sayyed Noorani
نوآوری فناورانه در هوش مصنوعی و آینده حرفه حسابداری: بررسی مسیرهای شغلی از جایگزینی تا دگرگونی
شبنم بالازاده قره باغی - سعید مصدق
هیدروژل های طبیعی مبتنی بر زیستمواد برای بهبود زخم: طراحی، پیشرفتهای اخیر و دیدگاههای مهندسی بافت
محمد عرب چم چنگی - میلاد زارع - سولماز خلیق فرد
بیشتر
19 اردیبهشت 1405
راهنمای انتخاب کنفرانس معتبر برای چاپ مقاله علمی
19 اردیبهشت 1405
چرا شرکت در کنفرانسهای علمی برای مصاحبه دکتری اهمیت دارد؟
21 اردیبهشت 1405
پذیرش سریع مقاله در کنفرانسهای علمی مهندسی و فناوری آغاز شد
21 اردیبهشت 1405
آغاز ثبتنام در همایشهای بینالمللی مدیریت و حسابداری
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.9.0