详细信息
文献类型:期刊文献
中文题名:基于Web的网页信息抽取方法的研究
英文题名:The Research of Web Pages Information Extraction Based on Web
作者:冯伟华[1];苗长芬[2]
第一作者:冯伟华
机构:[1]中国烟草总公司郑州烟草研究院;[2]新乡师范高等专科学校计算机科学系
第一机构:中国烟草总公司郑州烟草研究院,河南郑州450000
年份:2005
卷号:15
期号:3
起止页码:30-31
中文期刊名:洛阳工业高等专科学校学报
外文期刊名:Journal of Luoyang Technology College
语种:中文
中文关键词:信息抽取;规则;模式
外文关键词:Information extraction; Regulation; Pattern
摘要:WWW的迅速发展,使其日益成为人们查找有用数据的重要来源。本文介绍了一种基于Web的信息抽取的实现方法,能够按照规则模式重复地将半结构化网页中的信息自动抽取出来。
The rapid development of the World Wide Web makes it become more and more important sources for people to look for useful data. This paper introduces a method of information extraction from the Web, which can extract information by regulation pattern from semi-strnctured web pages repeatedly and automatically.
参考文献:
正在载入数据...