登录    注册    忘记密码

详细信息

基于Dirichlet过程的层次话题模型研究    

Dirichlet Process Based Hierarchy Topic Model

文献类型:期刊文献

中文题名:基于Dirichlet过程的层次话题模型研究

英文题名:Dirichlet Process Based Hierarchy Topic Model

作者:张武强[1];穆瑞辉[1]

机构:[1]新乡学院计算机与信息工程学院

第一机构:新乡学院计算机与信息工程学院

年份:2013

期号:27

起止页码:8192-8196

中文期刊名:科学技术与工程

外文期刊名:Science Technology and Engineering

收录:CSTPCD;;北大核心:【北大核心2011】;

语种:中文

中文关键词:Dirichlet;话题;层次;模型;算法

外文关键词:Dirichlet topic hierarchy model algorithm

摘要:在微博中,用户规模不断增大,用户发言的信息也在急剧增长,这给海量信息中挖掘用户关注的热点话题提出了严峻的挑战。用户发言的内容会随着好友的转发在网络中形成一个树形结构,该树形结构包含的内容就是一个话题。然而在树的构建中,微博信息的迭代次数取决于树的高度,这在海量的微博信息中是不可行的。提出了一种群树的话题网络构建模型,只需要很少的迭代次数就可以构建话题的子树;然后通过LDA模型对子树之间潜在的话题进行分析。实验表明,提出的基于Dirichlet过程的层次话题模型,无论在准确性和计算效率上,都优于现有的相关研究。
As the growth of the size of users, data grows rapidly in Microblog, and this poses a huge challenge for mining hot topics from Microblog data. A post from a user can be forwarded by his friends, the friends of friends can also forward this post, and then a topic tree is constructed. However, in the construction of the tree, the number of iterations of the Microblog data depends on the height of the tree, and this is impossible in Microblog. A trees-based topic network construction model is proposed, which needs only a few iterations of Microblog data, and analyzes the latent topics among the trees by the Dirichlet process. Experiments show that our Dirichlet process based hierarchy topic model is better than related work in both accuracy and efficiency.

参考文献:

正在载入数据...

版权所有©新乡学院 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心