Embora o New Relic Kubernetes OpenTelemetry Collector tenha sido projetado para ser robusto e confiável, problemas ainda podem surgir. Este documento de resolução de problemas fornece etapas de resolução de problemas para problemas comuns que você possa encontrar.
Problemas com o pod Collector geral
Confira o log do pod coletor que está apresentando problemas. Execute este comando:
$kubectl logs <otel-pod-name> -n newrelic
Para ativar o logging de nível DEBUG
detalhado para resolução de problemas, defina o parâmetro verboseLog
como true
no gráfico nr-k8s-otel-collector
Helm.
falhas de coleta métrica
Problema: métricas não estão sendo coletadas ou enviadas para o New Relic.
resolução de problemas:
Verifique a configuração do scrape: Certifique-se de que a configuração do receptor
prometheus
dentro da configuração do coletor (extraConfig
oudefault
) esteja correta.bash$kubectl describe configmap prometheus-config -n monitoringVerifique as anotações pod : se você estiver usando a descoberta de serviço do Prometheus, confirme se o pod do aplicativo tem as anotações
prometheus.io/scrape=true
corretas.bash$kubectl get pods --namespace=[your-namespace] --show-labels | grep 'prometheus.io/scrape=true'Teste a conectividade de rede: certifique-se de que o pod coletor possa alcançar o ponto de extremidade métrica.
bash$kubectl exec [prometheus-pod-name] -- curl <http://service:port>
Substituições de configuração não estão tendo efeito
Problema: As configurações personalizadas não são aplicadas corretamente.
resolução de problemas:
Revise seu
values.yaml
: Verifique novamente seu arquivovalues.yaml
em busca de erros de digitação ou recuo incorreto na seçãoextraConfig
.bash$cat helm-charts/charts/nr-k8s-otel-collector/values.yaml | grep extraConfigValidar aplicado
ConfigMaps
: O gráfico Helm geraConfigMaps
a partir do seuvalues.yaml
. Inspecione oConfigMap
resultante para garantir que suas configurações personalizadas estejam presentes.bash$kubectl describe configmap [collector-configmap-name] -n monitoring
Collector não inicia
Problema: O pod do coletor OpenTelemetry falha ao inicializar ou trava repetidamente.
resolução de problemas:
Inspecionar logs de pod: a primeira etapa mais comum. Procure mensagens de erro específicas que indiquem configurações incorretas ou falta de dependência.
bash$kubectl logs [collector-pod-name] --namespace=monitoringVerifique as variáveis de ambiente: certifique-se de que as variáveis de ambiente necessárias sejam injetadas corretamente.
bash$kubectl exec [collector-pod-name] -- env | grep -i [variable-name]
Falhas de rede
Problema: O coletor não consegue se comunicar ou enviar dados para o New Relic.
resolução de problemas:
Verifique a resolução de DNS: certifique-se de que o pod coletor possa resolver nomes de serviço ou ponto de extremidade New Relic.
bash$kubectl exec [collector-pod-name] -- nslookup service-nameExecute testes de conectividade: teste a conectividade com serviços internos ou com o endpoint externo New Relic.
bash$kubectl exec [collector-pod-name] -- curl -I <http://service-name:port>Revise as políticas de rede: se você tiver políticas de rede rígidas no seu cluster, certifique-se de que elas permitam o tráfego do pod OpenTelemetry Collector para serviços internos e endpoint externo New Relic.
bash$kubectl describe networkpolicy -n [namespace]
Apoiar
Se você tiver problemas com a observabilidade do OpenTelemetry para Kubernetes, consulte:
- Seção de problemas no GitHub para quaisquer problemas semelhantes ou considere abrir um novo problema.