Open Guo-Zhang opened 9 months ago
Part 方法和工具 Chapter 基本原则 Chapter 基础设施 Section 元数据管理平台
Part 数据交付物 Chapter 数据集 Chapter 数据应用
Part 数据生命周期 Chapter 数据采集 Section 网页爬虫 Subsection AI爬虫
Part 系统治理 Part 研发流程管理 Part 数据共享
关于网页爬虫:暂定依次按照传统爬虫、AI爬虫的逻辑组织。如果AI爬虫可以更新换代成功,则可以围绕AI爬虫制作我们的爬虫最佳实践。
如果考虑和最新的数据工程标准对应,可以把“方法和工具”并入“系统治理”。
Part 方法和工具 Chapter 基本原则 Chapter 基础设施 Section 元数据管理平台
Part 数据交付物 Chapter 数据集 Chapter 数据应用
Part 数据生命周期 Chapter 数据采集 Section 网页爬虫 Subsection AI爬虫
Part 系统治理 Part 研发流程管理 Part 数据共享