详细信息
基于XML的无监督数据抽取研究
文献类型:期刊文献
中文题名:基于XML的无监督数据抽取研究
作者:郭东峰[1]
第一作者:郭东峰
机构:[1]新乡学院计算机与信息工程学院
第一机构:新乡学院计算机与信息工程学院
年份:2013
期号:17
起止页码:140-140
中文期刊名:黑龙江科技信息
外文期刊名:Heilongjiang Science and Technology Information
语种:中文
中文关键词:数据抽取;XML数据;信息抽取
摘要:本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。
参考文献:
正在载入数据...