应用科学学报 ›› 2014, Vol. 32 ›› Issue (5): 515-522.doi: 10.3969/j.issn.0255-8297.2014.05.013

• 信号与信息处理 • 上一篇    下一篇

一种基于层次结构深度信念网络的音素识别方法

王一1,2, 杨俊安1,2, 刘辉1,2, 柳林3, 卢高4   

  1. 1.电子工程学院404教研室,合肥230037
    2.安徽省电子制约技术重点实验室,合肥230037
    3.科大讯飞公司,合肥230037
    4.77108部队52分队,成都611233
  • 收稿日期:2013-09-08 修回日期:2014-03-28 出版日期:2014-09-23 发布日期:2014-03-28
  • 作者简介:王一,博士生,研究方向:语音信号分析与识别技术等,E-mail:wygggg@126.com;杨俊安,教授,博导,研究方向:信号处理、智能计算等,E-mail:yanjunan@ustc.edu
  • 基金资助:

    国家自然科学基金(No.61272333);安徽省自然科学基金(No.1208085MF94,No.1308085QF99)资助

Hierarchical Structure of Deep Belief Network for Phoneme Recognition

WANG Yi1,2, YANG Jun-an1,2, LIU Hui1,2, LIU Lin3, LU Gao4   

  1. 1. Room 404, Electronic Engineering Institute, Hefei 230037, China
    2. Key Laboratory of Electronic Restriction, Anhui Province, Hefei 230037, China
    3. Anhui USTC iFlytek Corporation, Hefei 230037, China
    4. No.52 Sub Unit, No.77108 Unit, Chengdu 611233, China
  • Received:2013-09-08 Revised:2014-03-28 Online:2014-09-23 Published:2014-03-28

摘要: 针对现有音素识别系统识别准确率不高、建模方法表征能力不强且易陷入局部最优解等问题,提出了一
种基于层次结构深度信念网络(deep belief network, DBN)的音素识别新方法. 该方法由基于层次结构DBN的瓶
颈特征以及基于DBN的音素分类器两部分组成:其中的瓶颈特征能够充分利用DBN能够处理长时段语音、监督
性的提取方法等特性;而基于DBN的音素分类器则具有更强的建模和表征能力. 因此,将两者结合在一起能够在
提取低维、监督性特征的同时,利用DBN更加有效地对音素后验概率进行识别. 在TIMIT数据库上进行的实验结
果表明,所提出的音素识别方法在识别正确率上相对于以往音素识别系统有较大提高.

关键词: 音素识别, 层次结构, 深度信念网络, 瓶颈特征

Abstract: To overcome the problem of poor recognition performance and being prone to be trapped in local
optima, this paper proposes a hierarchical phoneme classification method based on deep belief network (DBN).
The system consists of two parts: a bottleneck feature and a phoneme classifier, both DBN based. The two
parts are combined to form a phoneme recognition system. The system can extract low dimensional and
supervising features, and improve classification accuracy. Experiments on TIMIT corpus suggest that the
proposed system can obtain 18.5% phoneme error rate as compared with existing systems.

Key words: phoneme recognition, hierarchical structure, deep belief network, bottleneck feature

中图分类号: