Finalize API for writing Delta Tables

dask-contrib / dask-deltatable

A Delta Lake reader for Dask

BSD 3-Clause "New" or "Revised" License

46 stars 15 forks source link

The initial API for writing Delta Lake is a little bit clunky for the user.

When reading, users have to do something like this:

from dask_deltatalbe import read_delta_table
ddf = read_delta_table("path_to_table")

To write, they need this:

from dask_deltatable.write import to_deltalake
out = to_deltalake("path_to_table", ddf)
out.compute()

TODO:

naming is not consistent; read_delta_table vs to_deltalake. Either of the following combos would be more consistent:
1. read_delta_table/write_delta_table
2. read_deltalake/write_deltalake
3. read_delta_table/to_delta_table
4. read_deltalake/to_deltalake
to_deltalake should be exposed on top level, same as read_delta_table
user shouldn't need to call compute as an extra step, add compute: bool kwarg instead
https://github.com/dask-contrib/dask-deltatable/issues/17
https://github.com/dask-contrib/dask-deltatable/issues/16

dask-contrib / dask-deltatable