语音合成 tts 参数语音合成技术

阅读数:127 评论数:0

跳转到新版页面

参数合成方法的前提是需要对人类声音信息进行建模，最后通过声学特征可以重建语音波形。它不不需要存储任何语音片段，直接使用参数对语音进行具体的描述。

目前使用较为广泛的是由参数合成方法的发展而衍生出的统计参数合成技术。该方法首先从输入文本中研究语言信息，如时长和韵律等，再通过声学模型进行建模，完成语言信息从语音特殊到声学特征的转换，最后使用声码器重构语音波形。

合成语音机械声明显、自然度较低。

目前主流统计参数合成技术是基于隐马尔科夫（Hidden Markov Model,HMM）模型的语音参数合成模型。

1、三个核心

（1）训练，需要确定HMM参数准则是最大似然准则

（2）计分，在给定模型的输出和台山宾馆序列中计算生成的观察序列的概率，可用来在候选对象中选取最佳匹配。

（3）参数生成，不同的优化策略都会产生不同的观察序列，需根据HMM类型不同，选择不同的算法。