登录    注册    忘记密码

详细信息

面向舆情发现系统的中文语料分词研究    

The Segmentation of Chinese Word Corpus in Public Opinion System

文献类型:期刊文献

中文题名:面向舆情发现系统的中文语料分词研究

英文题名:The Segmentation of Chinese Word Corpus in Public Opinion System

作者:高慧[1,2];张涛[2];王付强[2];夏彬[3]

第一作者:高慧

机构:[1]武汉理工大学信息工程学院;[2]新乡学院网络管理中心;[3]中华全国供销合作总社郑州棉麻工程技术设计研究所

第一机构:武汉理工大学信息工程学院,湖北武汉430070

年份:2015

卷号:14

期号:11

起止页码:54-56

中文期刊名:软件导刊

外文期刊名:Software Guide

语种:中文

中文关键词:舆情系统;语料;中文分词

外文关键词:Public Opinion System; Corpus l Chinese Word

摘要:中文自然语言处理在舆情系统信息预处理中起着重要作用。提出一种基于ICTCLAS的中文舆情语料分词方法。它通过采用层叠隐马尔科夫模型将中文分词、词性标注、歧义词处理和未登录词识别进行系统集成,形成整体的系统框架。实验结果表明,该方法能够有效识别网络舆情用语,提高了分词准确率,为进一步发现高校网络舆情奠定了基础。
The importance of Chinese natural language processing system information in public opinion for the pretreatment is proposed based on the Chinese public opinion ICTCLAS corpus segmentation method. It does this by using cascaded hid- den Markov model of Chinese word segmentation, POS tagging, ambiguous word processing and unknown word recognition system integration,form the overall framework. Experimental results show that this method can effectively identify net- work public opinion oral language,improve the segmentation accuracy,and laid a good foundation for the further discovery university network public opinion.

参考文献:

正在载入数据...

版权所有©新乡学院 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心