详细信息
数据抽取中领域网页的特征分析
文献类型:期刊文献
中文题名:数据抽取中领域网页的特征分析
作者:郭东峰[1]
第一作者:郭东峰
机构:[1]新乡学院计算机与信息工程学院
第一机构:新乡学院计算机与信息工程学院
年份:2014
卷号:0
期号:7
起止页码:108-108
中文期刊名:民营科技
语种:中文
中文关键词:领域网页;HTML;Jtidy
摘要:在数据抽取中,领域网页是多数具有特点的网页,包含了大量的领域术语。针对领域网页的特征总结,分析出有效的消除"噪音"的方法,为数据抽取做好坚实的基础。
参考文献:
正在载入数据...