- 机器学习中文本分类处理研究被引量:2收藏
- 作者:郭东峰 王东起
- 机构:新乡学院计算机与信息工程学院
- 来源:《内江科技》 2016
- 关键词:机器学习 分类处理 自然语言处理 信息检索 数据抽取 信息抽取技术 文档库 特征项 分类器 特征选择
- 摘要:在数据抽取中,主要是对文本的处理。文本分类是文本处理的基本过程。文本分类技术同时还在自然语言处理、信息检索、文本挖掘等领域都有着广泛的应用。经过分类后的文本可以减少用户甄别信息时间,满足不同用户需求,发挥信息自身其最大使...
- 数据抽取中领域网页的特征分析被引量:1收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《民营科技》 2014
- 关键词:领域网页 HTML Jtidy
- 摘要:在数据抽取中,领域网页是多数具有特点的网页,包含了大量的领域术语。针对领域网页的特征总结,分析出有效的消除"噪音"的方法,为数据抽取做好坚实的基础。
- 数据抽取中数据预处理被引量:1收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《电子技术与软件工程》 2014
- 关键词:噪音数据 HTML Jtidy
- 摘要:在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,对HTML语言中常见不规范问题做出分析。同时分析了在Java开发环境中借助Jtidy开源工具,对待抽取的HTML文档进行语法检测与...
- “软件再工程”在软件开发中的应用被引量:1收藏
- 作者:刘兴瑞 郭东峰
- 机构:平原大学网络中心;平原大学信息工程学院
- 来源:《科技信息》 2007
- 关键词:软件再工程 遗产系统正向工程 逆向工程 软件开发
- 摘要:软件再工程概念是针对现阶段软件系统更新换代加剧而提出的,当前用户需求不断变化、软件系统复杂性不断提高和软件维护日趋困难促进了软件再工程的发展。
- 基于DOM的Web数据抽取研究被引量:1收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《科技创新与应用》 2013
- 关键词:数据抽取 XML数据 DOM树
- 摘要:文章阐述了利用XML中的DOM树将Web数据结构分析,转化为结构化的XML数据,使用Xpath实现数据匹配查找数据,通过正则表达式实现数据抽取。同时,对目前数据抽取技术做一些简单探讨研究。
- DOT.NET 4.0中异常处理新特性研究被引量:0收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《华章》 2013
- 关键词:异常处理 破坏性异常 处理机制
- 摘要:异常处理是编程语言或计算机硬件里的一种机制,用于处理软件或信息系统中出现的异常状况.DOT.NET 4.0中,一些SEH异常(结构化异常处理)无法被捕捉,而是由CLR(公共语言运行库)来统一处理,这类异常叫做破坏性异常(...
- .NET中异常处理规范研究被引量:0收藏
- 作者:郭东峰
- 机构:新乡学院 计算机与信息工程学院
- 来源:《华章》 2013
- 关键词:异常处理 规范 安全
- 摘要:在.NET程序设计中,异常处理是一个非常重要的过程.简单处理所有异常,有可引起程序或系统崩溃.规范化异常处理,捕获具体的异常并作出正确的处理,更好的利用.NET的异常机制,创造出可信赖的,健壮的软件.
- 基于XML的无监督数据抽取研究被引量:0收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《黑龙江科技信息》 2013
- 关键词:数据抽取 XML数据 信息抽取
- 摘要:本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。
- 基于SVM的Web信息抽取研究被引量:0收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《黑龙江科技信息》 2013
- 关键词:信息抽取 XML数据 支持向量机
- 摘要:阐述了针对中小型企业供需信息自动化Web信息抽取技术的研究。自动化是指不需要人工标注网页抽取规则学习样本,系统能够从不同的求购信息网站的网页里自动获取相应的信息抽取规则,通过引入领域特征来净化抽取到文本字段而获得较高的查...
- LEACH clustering routing protocol for WSN被引量:0收藏
- 作者:Guo, Dongfeng Xu, Lijun
- 机构: Institute of Computer and Information Engineering
- 来源:Lecture Notes in Electrical Engineering 2013
- 关键词:Digital storage - Energy conservation - Energy utilization - Leaching
- 数据抽取中文本分类分析与研究被引量:0收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《科技视界》 2014
- 关键词:向量 信息增益 特征项
- 摘要:在数据抽取中,主要是对文本的处理。文本分类是文本处理的基本过程。文本分类技术同时还在自然语言处理、信息检索、文本挖掘等领域都有着广泛的应用。经过分类后的文本可以减少用户甄别信息时间,满足不同用户需求,发挥信息自身其最大使...
- ASP.NET课程教学模式研究被引量:0收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《福建电脑》 2013
- 关键词:主动学习 ASP NET 项目驱动
- 摘要:本文阐述了ASP.NET课程教学中出现的问题,并对这些问题进行教学方式改变,通过实用性项目驱动方式,分组协作,团结合作的方式,提高学生的学习兴趣和实际动手能力。
- 数据抽取中噪音过滤应用研究被引量:0收藏
- 作者:郭东峰
- 机构:新乡学院计算机与信息工程学院
- 来源:《网友世界》 2014
- 关键词:噪音 过滤 kNN分类算法
- 摘要:在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,采取利用启发式规则和基于文本内容方法两种策略分步对噪音数据区域过滤,使用kNN文本分类算法进一步对列表页中的非用户关注栏目过滤。
- 数据库数据存储和容错技术被引量:0收藏
- 作者:郭东峰 刘兴瑞
- 机构:平原大学信息工程学院;平原大学网络中心 河南新乡453003;河南新乡453003
- 来源:《科技信息(科学教研)》 2007
- 关键词:数据库技术 存储介质 备份技术 镜像技术
- 摘要:随着计算机应用的迅速发展,数据库的应用越来越多,但是数据库的安全问题是不可以回避的问题,本文将对数据库数据的存储介质、数据库备份和镜像技术做些研究。