دورهی هوش مصنوعی چندوجهی (Multimodal AI) با هدف آموزش نسل جدید مدلهای هوش مصنوعی طراحی شده است؛ مدلهایی که توانایی پردازش و ترکیب دادههای متنی، تصویری و ویدیویی را دارند. این دوره بهصورت پروژهمحور برگزار میشود و فراگیران ضمن آشنایی با مفاهیم کلیدی مانند CLIP، SigLIP، Gemma3 و Qwen VL، توانایی بهکارگیری آنها در وظایف عملی مانند تشخیص اشیا، توصیف تصویر، درک ویدیو و طبقهبندی Zero-shot را کسب میکنند. همچنین بخشهای تخصصی شامل روشهای Fine-tuning با LoRA، QLoRA وPEFT و استفاده از Diffusion Models برای تولید و ویرایش تصویر بهصورت عملی پوشش داده خواهد شد.
مخاطبین
پیشنیازها
نحوه ارزیابی