Open en-hui opened 6 months ago
补充问题描述的结构图:
1.若存在主键,如何避免 主键冲突? 2.若不存在主键,若下游是 Kafka 那又如何 做到 不重复插入 3.Flink CDC 是如何了解?
1.还需 确认 每个 Chunk 都有各自的 高低水位,那么 他们各自补全数据的时候,是分别处理的
SourceReader 读取时支持 chunk 粒度的 checkpoint,在所有 Snapshot Chunk 读取完成后,下发一个 binlog chunk 进行增量部分的 binlog 读取
1.这里强调 chunk 粒度,而不是 当前条, 是否会造成重复数据
参考文档:https://flink-learning.org.cn/article/detail/3ebe9f20774991c4d5eeb75a141d9e1e