udistrital / autenticacion_mid

0 stars 0 forks source link

Creación de grupos de métricas y alarmas para AWS X-Ray #76

Open a52290451 opened 10 months ago

a52290451 commented 10 months ago

Se requiere implementar conjuntos de métricas y alarmas relacionadas en AWS X-Ray de tal forma que se permita detectar de forma temprana cuando una API entre en estado de fallo.

Especificaciones técnicas

Sub Tareas

Criterios de aceptación

Requerimientos

Dependencias

Definition of Ready - DoR

Definition of Done - DoD - Desarrollo

a52290451 commented 10 months ago

Se realiza la creación de un grupo nuevo en AWS X-Ray que permite filtrar las trazas entrantes por su Código de Estado. En particular, filtra todas las trazas que se encuentran con código de estado = 5XX.

image

De esta forma, es posible utilizar este grupo para filtrar directamente en las trazas y en el mapa de servicios de X-Ray:

image

De igual forma, con la creación del grupo "Xray-StatusCode-Fault", se crea automáticamente su métrica en "Métricas"

image

Queda pendiente la creación de la alarma y probar su funcionamiento.

a52290451 commented 10 months ago

Actualización:

Se realiza el ajuste del grupo "Xray-StatusCode-Fault", de la siguiente forma:

image

Con esta modificación, se logran filtrar todas las trazas que presenten un error en la linea HTTP 5XX.

También se crean dos grupos más con diferentes filtros:

image

De esta forma se identifican las trazas con un estado diferente a 200 o con duración superior a 5 segundos.

Las métricas asociadas a estos grupos se encuentran configuradas y listas para ser utilizadas como filtros o incluir alarmas asociadas:

image

Finalmente, se configura la alarma "XRay-StatusCode-Fault-5XX" para la métrica "Xray-StatusCode-Fault" la cual evalua cada 5 minutos todas las trazas en AWS XRay. Si encuentra una con estado de falla, activa la alarma y envia un correo electrónico notificando.

image

image

image

milo19980525 commented 10 months ago

Se determina como terminada la tarea a pesar de la no implementación de todas las métricas dado que con la actual es suficiente para establecer si un api está respondiendo correctamente o no