Open rudyMcgee opened 4 years ago
@rudyMcgee 以文件形式进行存储
谢谢你的回复,我还是想咨询一下
我用spark多个特征处理算子对原始数据进行处理,最后通过决策树训练分类,请问怎么导出最终模型?
环境:scala 2.11.11,spark2.4,pmml
步骤描述:最近看了你们的这个项目,想仿照写一个小的例子,然后我定义了多个object class,每个class完成一种数据处理功能,然后输出一个新的文件提供给下一个class作为输入,从而完成一连串的数据转换及特征提取工作,最后输出文件用于决策树分类训练,从而得到训练模型。
问题:请问我该如何导出最终训练完的模型的pmml文件?如果只在决策树class中导出pmml模型,那么此pmml模型是不是不包含前面的一串数据处理方法?如果我部署此pmml模型,那么调用的时候是不是不能直接传入源数据?
本人机器学习小白,谢谢帮助
@rudyMcgee 以文件形式进行存储