Skip to content

Latest commit

 

History

History
10 lines (8 loc) · 346 Bytes

File metadata and controls

10 lines (8 loc) · 346 Bytes
                                决策树对短信进行分类,并做词汇提取

1.分类过程 用结巴进行分词,并去停用词。 1.使用TF表示文档,并用TF矩阵分类 2.使用TF-IDF表示文档,并用TF-IDF矩阵分类

并且对训练好的模型进行关键词提取

使用的开源包 sklearn