Python
分类算法 标签描述

新闻分类系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯) 简介 新闻分类系统可以对十种新闻进行自动分类并显示准确性的结果。(交叉验证准确性在65%70%,数据集一共3183,可增加数据集提高准确率。) 系统分为三部分: 爬虫部分,使用Requests处理http,post请求。BeautifulSoup处理HTML页面标签并提取信息。 目标网站是谣言百科网站,其实这个实战是我谣言处理系统的一部分,但是现阶段对于谣言处理系统我遇到了问题就是精度提高。 现阶段的方法我的想法是,第一个数据集增加,因为网络上很多谣言都是相似的,尤其是养生,历史之类的谣...