Si bien el New Relic Kubernetes OpenTelemetry Collector está diseñado para ser estable y confiable, aún pueden surgir problemas. Este documento de resolución de problemas proporciona pasos de resolución de problemas para problemas comunes que pueden surgir.
Problemas con el módulo General Collector
Consulte el log del pod recolector que está experimentando problemas. Ejecute este comando:
$kubectl logs <otel-pod-name> -n newrelic
Para habilitar el logging detallado de nivel DEBUG
para la resolución de problemas, configure el parámetro verboseLog
en true
en el gráfico Helm nr-k8s-otel-collector
.
Fallos de la colección métrica
Problema: las métricas no se recopilan ni se envían a New Relic.
resolución de problemas:
Verifique la configuración de scrape: cerciorar de que la configuración de su receptor
prometheus
dentro de la configuración del recolector (extraConfig
odefault
) sea correcta.bash$kubectl describe configmap prometheus-config -n monitoringVerificar las anotaciones pod : si está usando el descubrimiento de servicios de Prometheus, confirme que su pod de aplicación tenga las anotaciones
prometheus.io/scrape=true
correctas.bash$kubectl get pods --namespace=[your-namespace] --show-labels | grep 'prometheus.io/scrape=true'Probar la conectividad de la red: cerciorar de que el pod recolector pueda alcanzar el extremo métrico.
bash$kubectl exec [prometheus-pod-name] -- curl <http://service:port>
Las anulaciones de configuración no surten efecto
Problema: Las configuraciones personalizadas no se aplican correctamente.
resolución de problemas:
Revise su
values.yaml
: vuelva a verificar su archivovalues.yaml
para detectar errores tipográficos o sangría incorrecta en la secciónextraConfig
.bash$cat helm-charts/charts/nr-k8s-otel-collector/values.yaml | grep extraConfigValidar aplicado
ConfigMaps
: El gráfico de Helm generaConfigMaps
a partir de suvalues.yaml
. Inspeccione elConfigMap
resultante para cerciorar de que sus configuraciones personalizadas estén presentes.bash$kubectl describe configmap [collector-configmap-name] -n monitoring
Collector no se inicia
Problema: el recolector de OpenTelemetry pod no se puede inicializar o se bloquea repetidamente.
resolución de problemas:
Inspeccionar los logs pod : el primer paso más común. Busque mensajes de error específicos que indiquen configuraciones incorrectas o dependencias faltantes.
bash$kubectl logs [collector-pod-name] --namespace=monitoringVerificar las variables de entorno: cerciorar de que las variables de entorno requeridas se inyecten correctamente.
bash$kubectl exec [collector-pod-name] -- env | grep -i [variable-name]
Fallos de red
Problema: El recolector no puede comunicar ni enviar datos a New Relic.
resolución de problemas:
Verificar la resolución de DNS: cerciorar de que el pod recolector pueda resolver nombres de servicio o New Relic extremo.
bash$kubectl exec [collector-pod-name] -- nslookup service-nameEjecutar pruebas de conectividad: prueba la conectividad con servicios internos o externos New Relic extremo.
bash$kubectl exec [collector-pod-name] -- curl -I <http://service-name:port>Revisar las políticas de red: si tiene políticas de red estrictas en su clúster, cerciorar de que permitan el tráfico del pod OpenTelemetry Collector a servicios internos y al extremo externo New Relic.
bash$kubectl describe networkpolicy -n [namespace]
Apoyo
Si tiene problemas con la observabilidad de OpenTelemetry para Kubernetes, consulte:
- Sección de problemas en GitHub para cualquier problema similar o considere abrir un nuevo problema.