gvillarroel / synthetic-data-for-text

0 stars 0 forks source link

memoria-uchile

Data Sintética Privada, Generación Vía Modelo Deep Learning

Link

Como utilizar

Se puede descargar con los siguientes comandos

pip install dvc
git clone https://github.com/gvillarroel/synthetic-data-for-text.git
cd synthetic-data-for-text
dvc pull

Luego simplemente ejecuta los notebooks

Notebook Disponibles

Estructura

Parametros

Nombre Tipo Descripción
df Pandas DataFrame El dataset a replicar
category_columns tuple lista de columnas que serán consideradas categorías
id str columna única que será considerada llave principal
synthetic_folder str directorio base donde se construirá los artefacto sinteticos
text_columns tuple columnas consideradas como texto