alercebroker / pipeline

ALeRCE Pipeline Monorepo
https://alercebroker.github.io/pipeline/
2 stars 1 forks source link

[MongoDB] Migrar datos a nuevo esquema + corrección de AID #164

Open dirodriguezm opened 1 year ago

dirodriguezm commented 1 year ago
### Tasks
- [x] Simulate "production" mongo instance with old schema
- [x] Get production instance statistics (number of items to update)
- [x] Write script to migrate schema
- [x] Evaluate performance of the script
- [x] If the script is too slow, rewrite using distributed processing
- [X] Migración de detecciones + cálculo aid
- [ ] insertar objetos vacíos con aid al momento de migrar detecciones
- [ ] hacer update de objetos vacíos con los objetos de la BD source
- [ ] migración de non_detections + obtención de aid
dirodriguezm commented 11 months ago

Opciones:

Estrategia:

UPDATE:

dirodriguezm commented 11 months ago

Avances Lunes 2/octubre:

dirodriguezm commented 11 months ago

Avances Martes 3/octubre:

dirodriguezm commented 11 months ago

Avances Miércoles 4/octubre:

dirodriguezm commented 11 months ago

Jueves 4/octubre:

dirodriguezm commented 11 months ago

Nuevo plan para la migración:

Image

dirodriguezm commented 10 months ago

Viernes 3 / noviembre:

En proceso de hacer la parte del sorting hat.

Hice refactorización del script para usar Actor Model con la librería Pykka.

La estrategia va a ser leer desde detection y hacer una pipeline interna usando el actor model, insertando tanto object como detection "a la vez" (realmente son threads).