基于朴素贝叶斯过滤垃圾邮件

  • 收集数据:提供文本文件
  • 准备数据:将文本文件解析成词条向量
  • 分析数据:检查词条确保解析的正确性
  • 训练算法:使用trainNB1()函数
  • 测试算法:使用classifyNB() 并且构建一个新的测试函数来计算文档集的错误率
  • 使用算法:构建完整程序 对一组文档进行分类,并将错分的文档输出到屏幕

准备数据:切分文本

mySent = 'this book is the best book on Python pr M.L I have ever laid eyes upon.'
mySent.split()
['this',
 'book',
 'is',
 'the',
 'best',
 'book',
 'on',
 'Python',
 'pr',
 'M.L',
 'I',
 'have',
 'ever',
 'laid',
 'eyes',
 'upon.']

About ME

👋 读书城南,🤔 在未来面前,我们都是孩子~
  • 📙 一个热衷于探索学习新方向、新事物的智能产品经理,闲暇时间喜欢coding💻、画图🎨、音乐🎵、学习ing~
👋 Social Media
👋 加入小组~

👋 感谢打赏~