本研究旨在对梅尔倒频谱与一般倒频谱进行比较。
优点:
(1) 由于梅尔倒频谱中
Y
[
m
]
=
log
(
∑
k
=
f
m
−
1
f
m
+
1
|
X
[
k
]
|
2
B
m
[
k
]
)
{\displaystyle Y[m]=\log \left(\sum _{k=f_{m-1}}^{f_{m+1}}\left|X[k]\right|^{2}B_{m}[k]\right)}
,
|
X
[
k
]
|
2
{\displaystyle \left|X[k]\right|^{2}}
这项的影响.使得其相位(phase)只会有有限的解(finite solutions).
(2)由于梅尔倒频谱中
Y
[
m
]
=
log
(
∑
k
=
f
m
−
1
f
m
+
1
|
X
[
k
]
|
2
B
m
[
k
]
)
{\displaystyle Y[m]=\log \left(\sum _{k=f_{m-1}}^{f_{m+1}}\left|X[k]\right|^{2}B_{m}[k]\right)}
,
∑
k
=
f
m
−
1
f
m
+
1
|
X
[
k
]
|
2
B
m
[
k
]
{\displaystyle \sum _{k=f_{m-1}}^{f_{m+1}}\left|X[k]\right|^{2}B_{m}[k]}
这项相对于单纯的
X
[
k
]
{\displaystyle X[k]}
是以级数的方式做叠加,因此大幅了降低出现0的几率.
(3)梅尔倒频谱的遮罩
B
m
[
k
]
{\displaystyle B_{m}[k]}
其中的
f
1
,
f
2
,
f
3
,
.
.
.
{\displaystyle f_{1},f_{2},f_{3},...}
是以等比级数的形式增加的.符合人耳所感知到的声音.
(4)以离散余弦变化(discrete cosine transform)取代传统的反傅立叶变化(IDFT),大幅减少运算量以及记忆体的使用.
缺点:
失去倒频谱具有的数学特质倒频谱#特性_2 ,
[ 1]
↑ Jian-Jiun Ding, Advanced Digital Signal Processing class note, the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2018.