基于加权全局时频特征的易混淆词识别

应用科学学报 ›› 1998, Vol. 16 ›› Issue (3): 320-325.

基于加权全局时频特征的易混淆词识别

顾明亮, 王太君, 史笑兴, 何振亚

东南大学

收稿日期:1997-04-26 修回日期:1997-10-12 出版日期:1998-09-30 发布日期:1998-09-30
作者简介:顾明亮:博士生,东南大学无线电工程系,南京 210018
基金资助:
国家攀登计划认知科学(神经网络)重大关键资助

WGTF Feature-Based Confusing Word Recognition

GU MINGLIANG, WANG TAIJUN, SHI XIAOXING, HE ZHENYA

Southeast University, Nanjing 210018

Received:1997-04-26 Revised:1997-10-12 Online:1998-09-30 Published:1998-09-30

摘要/Abstract

摘要： 针对易混淆词特征差异小、分类决策困难的特点,提出了一种新的语音识别特征.该特征可以根据待识单词的发音特点,通过选用合适的基函数及加权处理,突出混淆单词特征之间的差异性;同时,根据其矢量维数相等的特点,利用静态神经网络分类决策能力强、容错性好的优点进一步提高系统的识别性能.实验结果表明,所用方法比传统的DHMM方法和其他神经网络语音识别方法具有更好的识别效率.

关键词: 声道模型, 权函数, GTF特征, 语音识别, 神经网络

Abstract: This paper presents a novel feature (Weighted Global Time-Frequency feature, i.e WGTF) for confusing word speech recognition, which enhances the difference among different confusing words by selecting proper base fuctions and weighting functions. Meanwhile, the storng discriminative power of artificial neural network has been used as a classifier to further raise the recognition rate. The experiment shows that the proposed method outperforms the standard DHMM and other ANN-based method.

Key words: vocal tract model, GTF feature, neural network, speech recognition, weighting function

顾明亮, 王太君, 史笑兴, 何振亚. 基于加权全局时频特征的易混淆词识别[J]. 应用科学学报, 1998, 16(3): 320-325.

GU MINGLIANG, WANG TAIJUN, SHI XIAOXING, HE ZHENYA. WGTF Feature-Based Confusing Word Recognition[J]. Journal of Applied Sciences, 1998, 16(3): 320-325.

[1]	王孟轩, 张胜, 王月, 雷霆, 杜渂. 改进的CRNN模型在警情文本分类中的研究与应用[J]. 应用科学学报, 2020, 38(3): 388-400.
[2]	马鑫, 吴云, 鹿泽光. 基于混合神经网络的协同过滤推荐模型[J]. 应用科学学报, 2020, 38(3): 478-487.
[3]	刘伟, 章琬苓, 项世军. 基于LBP-MDCT和CNN的人脸活体检测算法[J]. 应用科学学报, 2019, 37(5): 609-617.
[4]	王灿军, 廖鑫, 陈嘉欣, 秦拯, 刘绪崇. 基于卷积神经网络的面部图像修饰检测[J]. 应用科学学报, 2019, 37(5): 618-630.
[5]	吴韵清, 吴鹏, 陈北京, 鞠兴旺, 高野. 基于残差全卷积网络的图像拼接定位算法[J]. 应用科学学报, 2019, 37(5): 651-662.
[6]	魏巍, 全海燕. 基于单形进化的径向基网络训练算法[J]. 应用科学学报, 2019, 37(4): 459-468.
[7]	靳华中, 刘潇龙, 胡梓珂. 一种结合全局和局部特征的图像描述生成模型[J]. 应用科学学报, 2019, 37(4): 501-509.
[8]	赵云山, 段友祥. 基于Attention机制的卷积神经网络文本分类模型[J]. 应用科学学报, 2019, 37(4): 541-550.
[9]	袁红林, 陆小丹, 徐晨. 基于B-Spline神经网络的宽带通信发射机指纹估计[J]. 应用科学学报, 2019, 37(1): 12-23.
[10]	曾润华, 张树群. 改进卷积神经网络的语音情感识别方法[J]. 应用科学学报, 2018, 36(5): 837-844.
[11]	姜雪莹, 苏成利, 施惠元, 李平, 刘思雨. 采用多变量RBF神经网络的非线性内部迭代预测控制[J]. 应用科学学报, 2018, 36(4): 698-710.
[12]	段友祥, 徐冬胜, 孙歧峰, 李钰. DBN在测井解释中的研究与应用[J]. 应用科学学报, 2018, 36(4): 689-697.
[13]	杨滨, 张涛, 陈先意. 基于深度学习的图像局部模糊识别[J]. 应用科学学报, 2018, 36(2): 321-330.
[14]	史晓裕, 李斌, 谭舜泉. 深度学习空域隐写分析的预处理层[J]. 应用科学学报, 2018, 36(2): 309-320.
[15]	董伟, 王建军. 改进的卷积神经网络用于对比度增强取证[J]. 应用科学学报, 2017, 35(6): 745-753.