详细信息
文献类型:期刊文献
中文题名:中文网页自动分类系统研究
英文题名:A Research of Chinese Web Page Automatic Categorization System
作者:廖文军[1];叶喜民[2]
第一作者:廖文军
机构:[1]新乡学院网络中心,河南新乡453003;[2]新乡学院计算机科学系,河南新乡453003
第一机构:新乡学院
年份:2007
卷号:21
期号:2
起止页码:67-69
中文期刊名:新乡师范高等专科学校学报
外文期刊名:Journal of Xinxiang Teachers College
语种:中文
中文关键词:网页;文本分类;向量空间模型(VSM);中文信息处理
外文关键词:web page; text classification; vector space model(VSM) ; Chinese information processing
摘要:给出了一个网页自动分类系统的设计,讨论了预处理、批量训练、特征选择等模块的设计过程。本系统采用空间向量模型作为分类模型,在分类开始前对网页信息进行了预处理。
A web information in the Chinese web page automatic categorization system is importment for us. A web page automatic categorization system was presented in this paper. It introduces the main module of the system including preprocessing batch training and feature selection. This system uses vector space model as the classification model. Before the classification, we do some preprocessing to improve the efficency of the classification.
参考文献:
正在载入数据...