quanttide / quanttide-specification-of-data-engineering

量潮数据工程标准
https://quanttide.github.io/quanttide-specification-of-data-engineering/
Apache License 2.0
0 stars 0 forks source link

数据工程标准文档目录 #5

Open Guo-Zhang opened 11 months ago

Guo-Zhang commented 11 months ago

目前暂时没有分Part。如果划分,可以考虑:

第一部分:领域模型。包括数据实体(数据集、数据模型、数据记录等)、处理器、调度器等。为整个标准文档搭建基石。 第二部分:领域问题和解决方案。包括数据治理、弹性计算、编排、DataOps等。为关键问题提供完整的解决方案,必要可以引用云计算标准、DevOps标准等其他标准联合解决问题。 第三部分:行业应用。比如经济模型(理论和结构实证)、统计和计量建模、财务报表分析、AIGC等等。可以考虑提供一些具体场景的拓展规范,为其他的标准或者云提供数据工程领域的方案。不过一般标准文件不会写这类。

Guo-Zhang commented 11 months ago

主要参考:

Guo-Zhang commented 9 months ago

数据实体:

数据实体的生命周期。类别组件的“生命周期”,可以自定义状态具体的变化。

定义“数据处理”为数据实体的状态变化。通过数据引擎DataEngine具体运行,比如函数计算。

定义“编排”为数据实体的状态(Node)和数据处理(Edge)产生的状态变化。

定义“DataOps”为管理上述三类程序的过程。