详细信息
基于超链接的主题预测算法
文献类型:专利
中文题名:基于超链接的主题预测算法
作者:贾海龙[1];
第一作者:贾海龙
机构:[1]新乡学院;
第一机构:新乡学院
专利类型:发明专利
申请号:CN201611023682.3
申请日:20161122
申请人地址:陕西省西安市金穗大道东段新乡学院
公开日:20170531
代理人:汤东凤
代理机构:北京科亿知识产权代理事务所(普通合伙)
语种:中文
中文关键词:超链接;预测算法;相关度;检索系统;爬虫;工作效率;网络爬虫;精准度;阈值时;预设;取出;网页
摘要:本发明公开了一种基于超链接的主题预测算法,与现有技术相比,本发明提出了超链接主题预测算法,主要思想是在网络爬虫爬取网页之前取出页面的超链接进行主题相关度判断,当相关度大于预设的阈值时才进行爬取。最后,通过实验比较表明,本文提出的超链接预测算法提高了爬虫的工作效率和检索系统的精准度。
参考文献:
正在载入数据...