qiwihui / blog

技术和思考,基于issues
https://qiwihui.com
43 stars 2 forks source link

基于机器学习的垃圾短信过滤应用 #36

Open qiwihui opened 6 years ago

qiwihui commented 6 years ago

基于机器学习的垃圾短信过滤

  1. Scikit-Learn 短信过滤模型训练,

  2. iOS CoreML介绍

  3. 使用 coremltools 将 Scikit-Learn 的模型转为 CoreML 的 mlmodel

  4. iOS App功能实现,界面编写

    • 导入模型并使用
    • 界面UI
    • 自定义黑白名单:号码,关键词
    • 提交辅助样本
  5. 调试

  6. App发布

  7. 优化模型大小,App大小及性能

SunsetWan commented 5 years ago

博主,你好! 能否分享一些如何使用 LinearSVC 对 RubbishMessage 数据训练的过程? 根据 RubbishMessage 的 readme.txt, 我运行 python keyWords.py 运行报错如下图: image 我看这两篇文章,基本了解了一下什么是 Linear SVCSVM 。 现在我的困境是在大概了解个算法(起码有个简单 example 可以模仿)和有训练数据的情况下,如何利用 LinearSVC 对 RubbishMessage 进行训练,这就难倒我了。我也是机器学习菜鸟,希望博主能分享一下您当时的心得,谢谢。

qiwihui commented 5 years ago

@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。

SunsetWan commented 5 years ago

@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。

好的,谢谢!

FeiLongTang commented 2 years ago

作者,你好,这东西,我能用安卓实现吗?😂