语音合成 tts 语言学基础

阅读数:178 评论数:0

跳转到新版页面

分类

AI

正文

一、概述

国际音标是目前国际上通用的对声音进行标注的方法,其中汉语音单元中主要分为三类:章节、音位和音素,分别表示不同的语音分割状态。

1、音系

音系是针对某一具体语言的,不同的语言有不同的发音系统。

二、音节

音节是自然语音单位,在日常交流发音中,每发出一个字的声音就是一个音节。正常情况下,一句话有多少个字就包含多少个章节,但其中儿话音属于特殊音节,与前一个字共同组成儿化音节。

三、音位

音位是语言中能区分语义的最少语音单位,根据定义它有三个特征:总属于一定的语言、有一定社会属性、能够区别具体含义。

1、音位与音素的区别

虽然这几个字形状不一样,但却都是的表达。 音素就类似于这里具体的字,只要细节上由差异,就是不同的个体。但是对于汉语来说,不论字形怎么变化,都是, 它们整体就是代表了, 于其他的字区分开。这里就把这些细节不同但功能相同的音素归为一个单位:音位

四、音素

音素是最小语音单位,也是语音合成技术中使用最为广泛的语音单位。在发音特征上为分元音和辅音。比如:“你好” 可分解为“n” "i" "h" "a" "o"。

五、现代汉语拼音

现代汉语拼音由声母、韵母、整体认读章节和音调组成。

1、声母

共23个,包括平翘舌立音与零声母。

b

p

m

f

d

t

n

l

g

k

h

j

q

x

西

zh

ch

sh

r

z

c

s

y

W

   

2、韵母

共24个,包括单韵母、复韵母、前鼻韵母和后鼻韵母。

(1)单韵母6个

a

o

e

i

u

ü

       

(2)复韵母8个

ai

ei

ui

ao

ou

iu

ie

üe

(3)前鼻韵母5个

an

en

in

un

ün

           

(4)后鼻韵母4上

ang

eng

的韵母

ing

ong

的韵母

(5)特殊元音韵母

er

           

3、整体认读音节

共16个,每个音节是一个整体,不能单独拆分发音。

zhi(织) chi(吃) shi(狮) ri(日)

zi(字) ci(刺)  si(丝)  yi(衣)

wu(乌)yu(鱼)  ye(爷)  yue(月)  

yuan(圆) yin(因) yun(云) ying(鹰) 

4、声调

共有四个,分别为阴平、阳平、上声和去声。

(1)五度标记法

用于标记声调的一种方法,第一个值描述起点,第二个值描述终端,第三个值描述拐点,从1到5表示音高从低到高分别为低、较低、中音、较高和高。




相关推荐

一、概述 语言是人类最普通、最常用的信息交流方式,而且它还可以传达一些其它的信息,如:人的情感、说话时的态度以及说话人的人性等,因些,可以说语言是最自然、便利和有用的通信方式。 tss(Text to

一、概述 1、简介 非自回归tts模型可以比质量相当的自回归模型更快的合成语音,以前的神经tts模型首先从文本自加归生成mel谱图,然后使用单独训练的声码器从生成的mel谱图合成语音。它们通常存在推理

一、概述 对原始音频进行建模是一个具有挑战的问题,因为数据具有较高的时间采样率,因此代替直接对原始时间音频进行建模,大多数据方法通过对可以从原始时有效地计算的较低采样率表示进行建模来简化该问题。对齐的

一、概述 波形拼接的方法主要是分析通过前端提取出的输入文本中相应信息,比如文本中的韵律信息、声学参数等,而后从语音库中提取相应的语音单元进行拼接,最终合成语音。 二、大语料库 基于大语料库的波形拼接

一、概述 参数合成方法的前提是需要对人类声音信息进行建模,最后通过声学特征可以重建语音波形。它不不需要存储任何语音片段,直接使用参数对语音进行具体的描述。 目前使用较为广泛的是由参数合成方法的发展而衍

一、概述 声音本质上是由振动产生的一种机械波,一个完整的音节由元音和辅音相互组成。 二、元音 当气流经过声带在口腔中没受到一点阻碍或只受到轻微阻碍,称之为元音。 英文中主要包括a、e、i 、o、 u