Github仓库地址:https://github.com/xiaoliang8006/SPAM_CLASSIFY_online
Introduction
对垃圾短信进行分类 代码分为如下几个模块
model
该文件夹存放的是训练模型
Data
该文件夹下存放了程序的所有数据
label.txt是带标签数据,用来模型训练和模型测试
nolabel.txt是不带标签数据用来检验效果
X.mtx和y.json是预处理得到的新闻内容和新闻标记
feature.json是预处理得到的新闻特征
vec_tfidf是预处理得到的tfidf值
code
运行环境: python2.7 + apache + php