登录    注册    忘记密码

详细信息

最大熵方法在英语名词短语识别中的应用研究    

Researchon Recognition of English BaseNP Based on Maximum Entropy Approach

文献类型:期刊文献

中文题名:最大熵方法在英语名词短语识别中的应用研究

英文题名:Researchon Recognition of English BaseNP Based on Maximum Entropy Approach

作者:王晓涓[1];赵春[2]

第一作者:王晓涓

机构:[1]黄淮学院计算机科学系;[2]新乡学院

第一机构:黄淮学院计算机科学系,河南驻马店463000

年份:2011

卷号:28

期号:3

起止页码:414-417

中文期刊名:计算机仿真

外文期刊名:Computer Simulation

收录:CSTPCD;;北大核心:【北大核心2008】;CSCD:【CSCD_E2011_2012】;

语种:中文

中文关键词:最大熵;名词短语;特征提取;机器翻译

外文关键词:Maximum entropy; BaseNP; Feature select; Machine translation

摘要:研究英语名词短语识别不仅是句法分析的基本问题,而且是进行机器翻译的基础。针对英语名词短语传统识别算法存在速度慢,效率低的难题,为提高识别准确率,提出一种基于最大熵原理的英语基本名词短语识别方法。首先综合考虑英语短语结构特性和上下文的位置来建立特征集模板,采用改进的频次和平均互信息相结合方法提取有效特征,表示为最大熵模型形式,最大熵原理完成最后的识别过程。对Penn Treebank语料库中的英语名词短语进行仿真,证明改进方法对短语识别正确率和召回率均达90%以上,远远高于传统方法的识别率,是一种简单、快速、高效的英语名词短语识别方法。
As the basis of the syntax analysis,BaseNP recognition is an important step in English machine translation.A method based on the maximum entropy model for BaseNP recognition is proposed in this paper.Firstly,this method uses English phrase structure characteristic and the context of the position to establish feature set,then uses frequency and average mutual information to extract effective features,which is expressed as the maximum entropy model,and finally recognition is carried out based on he maximum entropy principle.Simulation experiment is carried out based on Penn Treebank data,the accuracy and recall rate of this method are more than 90%,far higher than the traditional method,so the method is a simple,quick and efficient recognition method in English BaseNP.

参考文献:

正在载入数据...

版权所有©新乡学院 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心