详细信息
基于DOM的Web数据抽取研究
文献类型:期刊文献
中文题名:基于DOM的Web数据抽取研究
作者:郭东峰[1]
第一作者:郭东峰
机构:[1]新乡学院计算机与信息工程学院
第一机构:新乡学院计算机与信息工程学院
年份:2013
期号:18
起止页码:77-77
中文期刊名:科技创新与应用
外文期刊名:Technology Innovation and Application
收录:国家哲学社会科学学术期刊数据库
语种:中文
中文关键词:数据抽取;XML数据;DOM树
摘要:文章阐述了利用XML中的DOM树将Web数据结构分析,转化为结构化的XML数据,使用Xpath实现数据匹配查找数据,通过正则表达式实现数据抽取。同时,对目前数据抽取技术做一些简单探讨研究。
参考文献:
正在载入数据...