En este proyecto se realiza un análisis exploratorio de datos para tener un primer acercamiento a las fechas de los diferentes pasos en el proceso de entrega de pedidos de una empresa ficticia.
¿Que parte del proceso podemos mejorar para reducir los tiempos de entrega de pedidos?
Si deseas crear valores dummy para utilizar el código mostrado ingresa al notebook create_dummy_data y genera tu fuente de datos, este archivo cuenta con las siguientes funciones:
No olvides guardar tu archivo en CSV corriendo la ultima celda del notebook
En caso de que tengas datos reales asegúrate que tengan el siguiente formato:
ID_pedido | Fecha_pedido | Fecha_picking | Fecha_factura | Fecha_entrega |
---|---|---|---|---|
1 | DD/MM/YYYY | DD/MM/YYYY | DD/MM/YYYY | DD/MM/YYYY |
Para ver el proceso del análisis utiliza en archivo eda.ipynb corriendo linea por linea
Se observan algunos valores vacíos
No se observa una alta correlación sobre la falta de valores en las variables
Se observan algunos outliers que al ser pocos, se procede a eliminar
Se observa que los días entre el pedido y la factura no tienen tanta variablilidad, como los dias de la factura a la entrega
No se observa correlación entre estas 3 variables
Con los gráficos de cajas y bigotes se puede observar la media y desviación de las 3 variables
Viendo las medias se puede observar que los días entre la factura y la entrega representan la mayor parte de los días del proceso de envíos
En base al análisis exploratorio de los datos se puede observar que el proceso en el que debemos enfocarnos para mejorar los tiempos de entrega es el transporte hacia el cliente, que es lo que sucede entre la factura y la entrega, pues esto representa el 58% del tiempo total del proceso.
https://altair-viz.github.io/index.html
Este proyecto se realizó utilizando la version 3.11.2 de python