مشخصات دوره
سطح
مدت
مدرک
تاریخ به روز رسانی
قالب دوره
میزان محبوبیت
هدف کلی این دوره ایجاد یک سیستم هوشمند است که بتواند تصمیمهای بهینهای را در محیطی پویا و تعاملی اتخاذ کند. در یادگیری تقویتی، یک عامل با استفاده از آزمون و خطا و ارتباط با محیط، اقداماتی را یاد میگیرد که بیشترین پاداش را در طول زمان کسب کند.
دستاوردهای پایان دوره
درک عمیق مفاهیم یادگیری تقویتی:
درک اصول اساسی، مدلها و روشهای یادگیری تقویتی، مانند فرآیندهای تصمیمگیری مارکوف (MDP)، الگوریتمهای Q-learning و Policy Gradient.
توانایی پیادهسازی مدلهای یادگیری تقویتی:
بهکارگیری دانش برای حل مسائل واقعی با استفاده از مدلهای یادگیری تقویتی، برنامهنویسی و توسعه الگوریتمهای مرتبط.
کاربرد یادگیری تقویتی در حل مسائل پیچیده:
استفاده از یادگیری تقویتی در زمینههای متنوعی مانند رباتیک، بازیهای رایانهای، خودروهای خودران، تجارت الکترونیک و بسیاری دیگر.
مخاطبین
دانشجویان علوم کامپیوتر و مهندس
محققان و دانشمندان داده
توسعهدهندگان نرمافزار و متخصصان IT
پیشنیاز
آشنایی با برنامهنویسی پایتون (گذراندن دوره « برنامهنویسی پایتون» در آکادمی همراه)
آشنایی با دروس یادگیری ماشین ( گذراندن دورههای یادگیری ماشین نظارت شده و یادگیری ماشین بدون نظارت در آکادمی همراه )
آشنایی با دروس یادگیری عمیق (گذراندن دورههای یادگیری عمیق در آکادمی همراه)
نحوه ارزیابی
۵۰ درصد پروژه پایانی
۵۰ درصد آزمون پایانی
حسین حسنی
1,000,000 تومان
13 ساعت
و
31 دقیقه
پیشرفته
دارد
1404/08/27
خودخوان
(32 رای)