image

یادگیری تقویتی

هدف از یادگیری تقویتی، یادگیری نحوه تعامل با محیط در یک فرایند تصمیم‌گیری متوالی با هدف بیشینه کردن مجموع پاداش‌های دریافتی از محیط است. این نحوه مدل‌سازی از مقوله یادگیری، انطباق بالایی با بسیاری از مسائلی از جنس تصمیم‌گیری دارد که در طول زندگی با آن‌ها مواجه هستیم

مشخصات دوره

سطحپیشرفته
مدت13 ساعت
مدرکدارد
تاریخ به روزرسانی۱۴۰۳/۳/۲۳
قالب دورهمهارت محور
۱٬۰۰۰٬۰۰۰
تومان

مطالب دوره

1. مقدمه
1.1 مقدمه
28' : 21''
2. مرور یادگیری ماشین
3. Markov Decision Process(MDP)
4. dynamic programming
5. model-free method: گرادیان سیاست
6. model-free method: روش های مبتنی بر ارزش
7. model-free method:‌ روش های actor-critic
8. model based method
9. یادگیری تقویتی مبتنی بر مدل
10. Imitation learning
11. یادگیری تقویتی برون خطی
12. یادگیری تقویتی با بازخورد انسانی (RLHF)
13. multi armed bandit
14. کدنویسی بخش روش مبتنی بر ارزش
15. کدنویسی بخش روش مبتنی بر ارزش۲
16. کدنویسی بخش روش مبتنی بر مدل
17. کدنویسی بخش multi armed bandit

اطلاعات تکمیلی دوره

هدف کلی این دوره ایجاد یک سیستم هوشمند است که بتواند تصمیم‌های بهینه‌ای را در محیطی پویا و تعاملی اتخاذ کند. در یادگیری تقویتی، یک عامل با استفاده از آزمون و خطا و ارتباط با محیط، اقداماتی را یاد می‌گیرد که بیشترین پاداش را در طول زمان کسب کند.


دستاوردهای پایان دوره

درک عمیق مفاهیم یادگیری تقویتی: 

درک اصول اساسی، مدل‌ها و روش‌های یادگیری تقویتی، مانند فرآیندهای تصمیم‌گیری مارکوف (MDP)، الگوریتم‌های Q-learning و Policy Gradient.

توانایی پیاده‌سازی مدل‌های یادگیری تقویتی: 

به‌کارگیری دانش برای حل مسائل واقعی با استفاده از مدل‌های یادگیری تقویتی، برنامه‌نویسی و توسعه الگوریتم‌های مرتبط.

کاربرد یادگیری تقویتی در حل مسائل پیچیده: 

استفاده از یادگیری تقویتی در زمینه‌های متنوعی مانند رباتیک، بازی‌های رایانه‌ای، خودروهای خودران، تجارت الکترونیک و بسیاری دیگر.


مخاطبین

دانشجویان علوم کامپیوتر و مهندس

محققان و دانشمندان داده

توسعه‌دهندگان نرم‌افزار و متخصصان IT

 

پیش‌نیاز

آشنایی با برنامه‌نویسی پایتون (گذراندن دوره « برنامه‌نویسی پایتون» در آکادمی همراه)

آشنایی با دروس یادگیری ماشین ( گذراندن دوره‌های یادگیری ماشین نظارت شده و یادگیری ماشین بدون نظارت در آکادمی همراه )

آشنایی با دروس یادگیری عمیق (گذراندن دوره‌های یادگیری عمیق در آکادمی همراه)

 
نحوه ارزیابی

۵۰ درصد پروژه پایانی

۵۰ درصد آزمون پایانی

مدرس دوره

حسین حسنی
حسین حسنی

دوره‌های پیشنهادی

هوش مصنوعی

هوش مصنوعی

هوش مصنوعی