Add support for dlt.apply_changes_from_snapshot

Implementation Details: Onboarding:

Introduce snapshot format inside onboarding file

Introduce bronze_apply_changes_from_snapshot config keys and scd_type are mandatory fields

"bronze_apply_changes_from_snapshot":{
  "keys": ["id"] 
  "scd_type": "1"
  "track_history_column_list": []
  "track_history_except_column_list":[]
}

DataflowPipeline:

Add argument to dataflowpipeline to accept snapshot_reader_func
snapshot_reader_func will be applied to dlt.apply_changes_from_snapshot while doing bronze write

Usage:

Provide snapshot reader function in a notebook while invoking Dataflowpipeline:

Introduce new method

pip install dlt-meta


def next_snapshot_and_version():
 <<Provide logic here>>

layer = spark.conf.get("layer", None) from src.dataflow_pipeline import DataflowPipeline DataflowPipeline.invoke_dlt_pipeline(spark, layer, snapshot_reader_func=next_snapshot_and_version)

databrickslabs / dlt-meta

Add support for dlt.apply_changes_from_snapshot #86