摘要: 提出了一种适合于汉英机器翻译的上下文相关汉语自动分词及词法预处理算法.该算法采用正向多路径匹配算法和基于上下文相关知识的歧义切分消解算法,充分利用汉英机译系统词典库中的大量语法和语义等知识进行上下文相关的规则推导消歧,使自动分词的准确率达到了99%以上.同时,该算法还对汉语中意义冗余的重叠词和可以与中心词离合的虚词等进行了词法预处理,从而一方面可以减少系统词典的收词量,另一方面方便于对句子的分析处理.
黄河燕, 李渝生. 上下文相关汉语自动分词及词法预处理算法[J]. 应用科学学报, 1999, 17(2): 148-155.
HUANG HEYAN, LI YUSHENG. Context -Sensitive Automatic Chinese Word Segmentation and Lexical Preprocessing[J]. Journal of Applied Sciences, 1999, 17(2): 148-155.