四、声音信息的表示
* L4 h1 ^9 C7 R (一)数字声音基础1.波形声音的数字化$ x% Y( h& X9 k$ q
声音是一种物理信号,计算机要对它进行处理,其前提是必须用二进制数字的编码形式来表示声音。最常用的声音信号数字化方法是取样-量化法,它分成如下3个步骤:
: e% P c- ~" ~* }0 V. }( v6 t (1)取样(Sampling)8 G( {- U2 c4 ~8 k" b
(2)量化
4 I I8 L" G! y5 ~4 d( V* g (3)编码(Encoding)7 [2 i) |& Y2 E# h5 [- p2 W7 Q5 L' w- m
2.PC机中的声音/ e2 L# |$ }1 b5 C8 C
PC机中的数字声音有两种不同的表示方法。一种称为“波形声音”,通过对实际声音的波形信号进行数字化(取样和量化)而获得,它可表示任何种类的声音。另一种是“合成声音”,它使用符号(参数)对声音进行描述,然后通过合成(Synthesize)的方法生成声音,合成语音(用声母、韵母或清音、浊音、基音频率等参数描述的语音)等。$ Z6 b8 x, [6 R4 X" q$ y
PC机中使用最广泛的波形声音文件采用wav作为扩展名,称为波形文件格式(Wave FileˉFormat).wav文件格式能支持多种取样频率和样本精度,并支持压缩的声音数据。# I9 G# k; _/ y+ c
(二)波形声音
( V/ q9 E' f( V 1.数字语音的压缩编码8 a" G9 `1 E& R1 ]
数字语音的数据压缩方法很多,从原理上可以分成3类:
+ f7 ^- o2 A* h& c5 ? (1)波形编码* d& \9 u1 m/ U& C6 Q/ A. W
(2)参数编码或模型编码( x: [1 ~" w( T; g7 D+ y
(3)混合编码! ~8 U- }: n) {* c1 w8 n; p
2.全频带声音的压缩编码
- S3 E& F6 U9 W- e$ X2 m) @( b: | (1)MPEG-1Audio(ISO/IEC11172-3)+ T* A* J$ y6 @
MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它规定了高质量数字声音的编码方法、存储表示和解码方法,得到了极其广泛的应用。它虽然是MPEG-1标准的一个组成部分,但完全可以独立应用。
8 y) R1 c9 w% m (2)MPEG-2Audio(ISO/IEC13818-3)* w; u" D- \. r2 r' @; ]% m8 D
MPEG-2Audio与MPEG-1Audio标准都使用相同类型的编/解码器,层1、层2和层3的结构也相同。6 D" f7 a% |0 ], I
(3)MPEG-2AAC(ISO/IEC13818-7)/ u7 ~8 }, `; W X0 q
MPEG-2AAC(Advanced Audio Coding)是MPEG-2标准中一种新的先进的声音编码标准。AAC支持的取样频率可从8kHz到96kHz,AAC编码器的输入可以是单声道的、立体声的和多声道的声音。4 Z0 u! B; e* `. L! h
(4)MPEG-4Audio(ISO/IEC14496-3)
% ^# ~# W% o- t9 @! ~/ N$ w MPEG-4Audio的编码对象既可以是自然音频信号(波形声音),也可以是合成的音频信号。
# v' ^( H' n; x: L: A (三)合成声音1.合成音乐与MIDI
. O, L; c' Y9 K7 z% @& B' D. y MIDI(Musical Instrument Digital Interface)是乐器数字接口的缩写,它起源于数字式电子乐器,因为各种产品必须使用统一接口才能进行连接,因些必须规定一种数字乐器相互间的接口标准,特别是数字乐器与计算机的接口标准,这就是MIDI。
0 w5 h; J {! v1 G9 J 2.合成语音4 d% ^; |6 w2 V8 f8 `9 O8 Z# }( x
语音合成目前主要指从文本到语音的合成(Text-to-Speech,简称TTS),也称为文语转换。 |