image

بازشناسی و سنتز گفتار با تمرکز بر توسعه چت بات صوتی

گفتار طبیعی‌ترین و ساده‌ترین روش ارتباطی محسوب می‌شود که قادر به انتقال اطلاعات، احساسات و هدف گوینده است. در سال‌هاي اخیر و با پیشرفت تکنولوژي، رایانه و گوشی موبایل به عنوان ابزارهای ارتباطی معمول مورد توجه قرار گرفته و در همین راستا طراحی واسطی براي تسهیل ارتباط بین انسان و ماشین که از گفتار به عنوان کانال ارتباطی استفاده می‌کند، علاقه زیادي را به سوي خود جلب نمود. دو تکنولوژي اصلی مورد نیاز در این راستا، بازشناسی گفتار و سنتز گفتار می‌باشند. بازشناسی گفتار براي ورود اطلاعات به کامپیوتر نیاز بوده و طی آن اطلاعات مفید از گفتار ورودي استخراج می‌شود. در مقابل، هدف از سنتز گفتار انتقال اطلاعات به خروجی است. تبدیل متن به گفتار شاخه‌اي است که به این مسیر ارتباطی می‌پردازد و می‌توان آن را به عنوان تکنولوژی تبدیل قالب نوشتاری به سیگنال گفتار تعریف نمود که علاوه بر پردازش سیگنال به پردازش زبان طبیعی هم نیازمند است.

مشخصات دوره

سطحپیشرفته
مدت32 ساعت
مدرکدارد
تاریخ به روزرسانی۱۴۰۳/۴/۳
قالب دورهخودخوان
میزان محبوبیت
4.5
(15 رای)
۲٬۴۰۰٬۰۰۰
تومان

مطالب دوره

1. Review of DSP & Review of Probability
1.1 Review of DSP
01 : 11' : 15''
2.1 Review of Probability 1
24' : 06''
3.1 Review of Probability 2
31' : 08''
4.1 Review of Probability 3
36' : 17''
5.1 Review of DSP (Programming Video)
01 : 11' : 51''
2. Phonetics and Phonemics & Speech Recognition Principles
3. Filter Banks & LPC
4. Speech Preprocessing & Workshop 1
5. Pattern Comparison
6. DTW & HMM
7. LVCSR & State Tying & Workshop2
8. SR Search
9. DNN-Based ASR
10. Quality Assessment
11. TTS
12. DNN based TTS

اطلاعات تکمیلی دوره

در حال حاضر روش‌های هوش مصنوعی روزآمد موفق شده‌اند بهبود قابل توجهی در روش‌های کلاسیک بازشناسی گفتار، سنتز گفتار و پردازش طبیعی ایجاد کنند. در این دوره می‌خواهیم بعد از آشنایی با اساس این شاخه‌ها، با نحوه به کارگیری روش‌های جدید هوش مصنوعی در سامانه‌های مرتبط با بازشناسی گفتار و تبدیل متن به گفتار بپردازیم.

 

مخاطبان:
هدف اصلی این دوره آشنایی دانشجویان کارشناسی، کارشناسی ارشد و دکتری با مفاهیم و نیز سامانه‌های مطرح در بازشناسی گفتار و سنتز گفتار است. 

 

پیش‌نیاز:
برنامه نویسی پایتون
آمار و احتمال و مدل‌های احتمالی
پردازش سیگنال 
شبکه های عمیق
یادگیری ماشین

 

نحوه ارزیابی:
100 درصد آزمون نهایی دوره

 

منابع دوره:
•    Fundamentals of Speech Recognition, Rabiner and Juang, Prentice Hall, 1993
•    Automatic Speech Recognition, A Deep Learning Approach, Dong Yu, Li Deng, Springer-Verlag, 2015
•    Spoken language processing, Huang, Acero, Hon, Prentice Hall, 2001
•    Discrete-time processing of speech signals, Deller, Proakis & Hansen, Prentice-Hall, 1999. 
•    Speech and Language Processing, Jurafsky, Martin, 2019

مدرس دوره

حسین صامتی
حسین صامتی

دوره‌های پیشنهادی

هوش مصنوعی

هوش مصنوعی

هوش مصنوعی