摘要: 基于人耳听觉模型和汉语语音的短时平稳特性,提出一种鲁棒性的汉语普通话声调提取方法.采用基于人耳听觉模型的相关图来提取语音信号的基频,运用无监督的侧抑制神经网络来模拟人耳侧抑制属性进行基频检测,为了克服在低信噪比情况下侧抑制神经网络的误判问题,引入了相邻语音帧的语音基频的帧间约束.试验表明,该方法在信噪比很低的条件下,仍能较准确地识别出目标语音声调,并能在双话者同时发音的情况下实现各自的声调分离.
中图分类号:
戴明扬, 余凯, 徐柏龄, 余崇智. 强噪声下基于听觉模型的汉语声调提取[J]. 应用科学学报, 2001, 19(2): 121-126.
DAI Ming-yang, YU Kai, XU Bo-ling, YU Chong-zhi. Chinese Tone Extraction in Extremely Noisy Background[J]. Journal of Applied Sciences, 2001, 19(2): 121-126.