پردازش گفتار (Speech Processing) به مجموعهای از فنون و روشهای محاسباتی اشاره دارد که برای پردازش و تحلیل دادههای صوتی (مانند گفتار انسان) استفاده میشود. این فناوری شامل تشخیص گفتار، تبدیل گفتار به متن، تولید گفتار خودکار، تحلیل احساسات و بسیاری از کاربردهای دیگر مرتبط با صدا میباشد. با استفاده از پردازش گفتار، میتوان به صورت خودکار گفتار را تشخیص داد، آن را به متن تبدیل کرد، به صورت خودکار گفتار تولید کرد و یا اطلاعات مرتبط با گفتار را استخراج کرد. برای پردازش گفتار، از الگوریتمهای مختلفی از جمله الگوریتمهای پردازش سیگنال، پردازش زبان طبیعی و شبکههای عصبی عمیق استفاده میشود. هدف از پردازش گفتار، بهبود کیفیت و دقت تحلیل و تفسیر صداهای گفتاری در سیستمهای کامپیوتری است.
1
2
3
4
5
6
7
8
9
10
11
12