Management Agent for Kubernetes (OCMA) en estado Failed después de un fallo de actualización

Si la URL de imagen de Docker especificada para el agente de gestión es incorrecta o inaccesible durante una actualización de Helm del gráfico oci-kubernetes-monitoring, el pod del agente de gestión permanece en el estado failed.

En este estado, la realización de una actualización posterior de Helm con la versión de imagen correcta no recupera el pod automáticamente, ya que Kubernetes no reinicia automáticamente los pods que permanecen en estado Failed después de un error de extracción de imagen.

Para resolver esta incidencia:

  1. Actualice la versión de Helm con la URL de imagen correcta y accesible:
    helm upgrade <release-name> --values <path-to-override-values.yaml> <path-to-helm-chart>
  2. Suprima el pod con fallos para que Kubernetes pueda volver a crearlo con la versión de imagen correcta:
    kubectl delete pod oci-onm-mgmt-agent-0 -n oci-onm

Después de la supresión, Kubernetes volverá a crear automáticamente el pod mediante la configuración corregida y el pod se iniciará correctamente.