campaign mobile
image

هوش مصنوعی چندوجهی (Multimodal AI)

دوره‌ی هوش مصنوعی چندوجهی (Multimodal AI) با هدف آموزش نسل جدید مدل‌های هوش مصنوعی طراحی شده است؛ مدل‌هایی که توانایی پردازش و ترکیب داده‌های متنی، تصویری و ویدیویی را دارند. این دوره به‌صورت پروژه‌محور برگزار می‌شود و فراگیران ضمن آشنایی با مفاهیم کلیدی مانند CLIP، SigLIP، Gemma3  و  Qwen VL، توانایی به‌کارگیری آن‌ها در وظایف عملی مانند تشخیص اشیا، توصیف تصویر، درک ویدیو و طبقه‌بندی Zero-shot را کسب می‌کنند. همچنین بخش‌های تخصصی شامل روش‌های Fine-tuning با  LoRA، QLoRA  وPEFT  و استفاده از Diffusion Models  برای تولید و ویرایش تصویر به‌صورت عملی پوشش داده خواهد شد.

مشخصات دوره

سطحمقدماتی
مدت7 ساعت
مدرکدارد
تاریخ به روزرسانی۱۴۰۴/۷/۲۱
قالب دورهمهارت محور
میزان محبوبیت
4.3
(3 رای)
۷۰۰٬۰۰۰
تومان

مطالب دوره

1. مقدمه
1.1 مقدمه‌ای بر VLM و مدل‌های چندوجهی (MultiModal)
11' : 55''
2. CLIP
3. VLM (Vision-Language Models)
4. Fine-tune کردن و تکنیک PEFT
5. Diffusion Model

اطلاعات تکمیلی دوره

مخاطبین

  • دانشجویان علوم کامپیوتر و هوش مصنوعی
  • پژوهشگران و دانشمندان داده 
  • توسعه‌دهندگان نرم‌افزار و متخصصان یادگیری ماشین
  • علاقه‌مندان به مدل‌های چندوجهی و کاربردهای  VLM 
  • فعالان حوزه بینایی ماشین و پردازش زبان طبیعی

پیش‌نیازها

  • آشنایی مقدماتی با یادگیری ماشین و شبکه‌های عصبی
  • تسلط نسبی بر برنامه‌نویسی پایتون
  • تجربه کار با PyTorch یا TensorFlow مزیت محسوب می‌شود
  • آشنایی اولیه با NLP و بینایی ماشین
  • ذهن تحلیل‌گر و توانایی کار تیمی در پروژه‌های عملی

نحوه ارزیابی

  • 50 درصد آزمون نهایی
  • 50 درصد پروژه نهایی

مدرس دوره

علیرضا اخوان پور
علیرضا اخوان پور

دوره‌های پیشنهادی

هوش مصنوعی

رایگان
هوش مصنوعی

هوش مصنوعی