ICT-BDA / EasyML

Easy Machine Learning is a general-purpose dataflow-based system for easing the process of applying machine learning algorithms to real world tasks.
Apache License 2.0
1.98k stars 440 forks source link

请问通过平台训练完的模型是如何保存的? #113

Open rudyMcgee opened 4 years ago

sinllychen commented 4 years ago

@rudyMcgee 以文件形式进行存储

rudyMcgee commented 4 years ago

@rudyMcgee 以文件形式进行存储

谢谢你的回复,我还是想咨询一下

我用spark多个特征处理算子对原始数据进行处理,最后通过决策树训练分类,请问怎么导出最终模型?

环境:scala 2.11.11,spark2.4,pmml

步骤描述:最近看了你们的这个项目,想仿照写一个小的例子,然后我定义了多个object class,每个class完成一种数据处理功能,然后输出一个新的文件提供给下一个class作为输入,从而完成一连串的数据转换及特征提取工作,最后输出文件用于决策树分类训练,从而得到训练模型。

问题:请问我该如何导出最终训练完的模型的pmml文件?如果只在决策树class中导出pmml模型,那么此pmml模型是不是不包含前面的一串数据处理方法?如果我部署此pmml模型,那么调用的时候是不是不能直接传入源数据?

本人机器学习小白,谢谢帮助