TTS语音合成

TTS语音合成技术是实现人机语音通信关键技术之一。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。和语音识别ASR相比,语音合成的技术相对说来要成熟一些,是应用范围较广的技术。
语音合成(Text To Speech)技术把文本转化为声音,其应用范围非常广在电话与计算机集成系统中,利用语音合成技术将文本转化为语音,使用户利用电话终端就可以听取文本的信息,对通信业务经营者和广大用户而言是必然的趋势。
在飞速发展的信息时代,语音技术的应用已经成为信息化的一个必不可少的环节,而在CTI领域内,语音技术的应用需求更加迫切,这里的语音应用不仅对语音合成的质量有较高要求,同时他们更注重大规模的实时应用。
ASR (自动语音识别技术)
语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。语音识别系统的性能大致取决于以下4类因素:1. 识别词汇表的大小和语音的复杂性;2. 语音信号的质量;3. 单个说话人还是多说话人;4. 硬件。