详细信息
一种基于内容相关度的检索模型计算方法
文献类型:专利
中文题名:一种基于内容相关度的检索模型计算方法
作者:贾海龙[1];
第一作者:贾海龙
机构:[1]新乡学院;
第一机构:新乡学院
专利类型:发明专利
申请号:CN201610474582.6
申请日:20160623
申请人地址:453000 河南省新乡市金穗大道东段新乡学院
公开日:20170510
代理人:汤东风
代理机构:北京科亿知识产权代理事务所(普通合伙)
语种:中文
中文关键词:检索模型;概率检索模型;独立模型;向量空间模型;相似性计算;概率计算;概率问题;基础知识;内容相关;特征权;相关度;语言;改进;统计;分析;估算;验证;发现
摘要:本发明公开了一种基于内容相关度的检索模型计算方法,包括相似性计算和特征权值计算;与现有技术相比,本发明首先,介绍了检索模型的基础知识——向量空间模型和概率检索模型;并重点分析了概率检索模型中的二元独立模型和BM25模型,发现二元独立模型中估算因子在进行概率计算时出现的零概率问题和BM25模型中相关度计算不准确的情况。其次针对以上两个问题,提出了改进的语言统计检索模型。最后,通过实验及分析验证了所提出改进语言统计检索模型的性能。
参考文献:
正在载入数据...