این دوره شامل سه پروژهی عملی در حوزهی پردازش گفتار است: تشخیص نواحی گفتاری، شناسایی گویندهی خاص و تشخیص جنسیت گوینده. هدف این مسیر، تثبیت دانش نظری و تقویت مهارتهای عملی در حل مسائل واقعی پردازش گفتار است. پروژهها به گونهای طراحی شدهاند که توانمندی تحلیل، پیادهسازی و ارزیابی سامانههای گفتاری را در سطحی حرفهای در شرکتکنندگان توسعه دهند.
پروژه سه مهارت کلیدی پردازش گفتار را پوشش میدهد:
Voice Activity Detection (VAD): تشخیص نواحی گفتاری از سکوت یا نویز در فایلهای صوتی.
Speaker Diarization: تفکیک خودکار بخشهای مختلف یک فایل صوتی بر اساس تغییر گویندگان بدون نیاز به اطلاعات اولیه از هویت آنها.
Target Speaker Detection: شناسایی حضور یک گوینده مشخص در میان چند گوینده با استفاده از نمونه صدای مرجع.
Gender Detection: پیشبینی جنسیت گوینده بر مبنای تحلیل ویژگیهای صوتی و پیادهسازی مدلهای یادگیری ماشین.
در این دوره، تمرکز اصلی بر توسعهی مهارتهای عملی در کار با دادههای صوتی واقعی، طراحی الگوریتمهای مؤثر، استفاده از مدلهای پیشآموزشدیده، و ارزیابی دقیق سامانههای گفتاری خواهد بود. پروژهها به گونهای تنظیم شدهاند که آمادگی لازم برای ورود به پروژههای تحقیقاتی یا صنعتی در زمینهی پردازش گفتار را فراهم سازند