Instale la integración de New Relic Elasticsearch OpenTelemetry para monitorear sus clústeres de Elasticsearch con protocolos estándar de la industria. Esta guía lo guiará a través de la configuración del OpenTelemetry Collector para recopilar métricas y logs de su infraestructura de Elasticsearch y enviarlos a New Relic.
Para instalar la integración, complete los siguientes pasos:
- Antes de comenzar - Verifique los requisitos y prerrequisitos
- Configurar el OpenTelemetry Collector - Configurar la recopilación de datos
- Establecer variables de entorno - Configurar la autenticación
- Encontrar y usar datos - Vea sus datos de Elasticsearch en New Relic
- Configurar alertas - Configurar la supervisión proactiva
Paso 1: Antes de comenzar
Asegúrese de tener:
Privilegios de acceso requeridos - Privilegios de administrador del clúster de Elasticsearch y cuenta de New Relic con acceso
Versión 7.16 o superior de Elasticsearch - Esta integración requiere un clúster moderno de Elasticsearch
Supervisar o administrar los privilegios del clúster - Si la seguridad está habilitada, necesita el privilegio de supervisar o administrar el clúster. Consulte la documentación de privilegios de seguridad de Elasticsearch para obtener más detalles
Conectividad de red - Conectividad HTTPS saliente (puerto 443) al punto de ingestión OTLP de New Relic
OpenTelemetry Collector - Debe tener un OpenTelemetry Collector instalado y en ejecución en su host para monitorear Elasticsearch. Hay dos distribuciones compatibles:
- NRDOT (Recomendado): Siga la guía oficial de instalación de NRDOT para configurar el collector en su host.
- OTel Contrib: OpenTelemetry Collector Contrib instalado y ejecutándose en su host. Instale a través de un paquete oficial (.deb o .rpm) para garantizar que la unidad de servicio systemd se cree correctamente.
Valores de configuración listos - Necesitará dos valores clave para la configuración:
- Endpoint de Elasticsearch - Su URL real de Elasticsearch (reemplace
https://localhost:9200) - Nombre del clúster - Un nombre único para identificar su clúster en New Relic
- Endpoint de Elasticsearch - Su URL real de Elasticsearch (reemplace
Sugerencia
Recomendamos encarecidamente el uso de NRDOT (New Relic Distribution of OpenTelemetry) en lugar de la versión estándar de la comunidad. Como componente propiedad de New Relic, es:
- Optimizado: Preconfigurado para el máximo rendimiento con el backend de New Relic.
- Confiable: Probado exhaustivamente para la estabilidad y seguridad empresarial.
- Con soporte: Totalmente respaldado por los equipos de soporte de New Relic para una resolución de problemas más rápida.
Paso 2: Configura el OpenTelemetry Collector
Para configurar la recolección de métricas y logs de su clúster de Elasticsearch, cree o actualice el archivo de configuración en /etc/nrdot-collector/config.yaml para NRDOT o /etc/otelcol-contrib/config.yaml para Collector Contrib.
La configuración varía según su configuración de Elasticsearch y los requisitos de monitoreo. Elija la configuración adecuada a continuación:
Sugerencia
Correlacione APM con Elasticsearch: Para conectar su aplicación APM y el clúster de Elasticsearch, incluya el atributo de recurso es.cluster.name="your-cluster-name" en sus métricas de APM. Esto permite la visibilidad entre servicios y una solución de problemas más rápida dentro de New Relic.
Paso 3: Establecer variables de entorno
Agregue la siguiente configuración a /etc/systemd/system/nrdot-collector.service.d archivo, asegurándose de que las variables de entorno se coloquen bajo la sección [Service]:
$[Service]$Environment="NEW_RELIC_LICENSE_KEY=YOUR_LICENSE_KEY_HERE"$Environment="OTEL_EXPORTER_OTLP_ENDPOINT=YOUR_OTLP_ENDPOINT"$Environment="NEW_RELIC_MEMORY_LIMIT_MIB=COLLECTOR_MEMORY_LIMIT"Para aplicar estos cambios, recargue el administrador de systemd y reinicie el colector:
$sudo systemctl daemon-reload$sudo systemctl restart nrdot-collector.serviceAgregue la siguiente configuración a /etc/systemd/system/otelcol-contrib.service.d archivo, asegurándose de que las variables de entorno se coloquen bajo la sección [Service]:
$[Service]$Environment="NEW_RELIC_LICENSE_KEY=YOUR_LICENSE_KEY_HERE"$Environment="OTEL_EXPORTER_OTLP_ENDPOINT=YOUR_OTLP_ENDPOINT"$Environment="NEW_RELIC_MEMORY_LIMIT_MIB=COLLECTOR_MEMORY_LIMIT"Para aplicar estos cambios, recargue el administrador de systemd y reinicie el colector:
$sudo systemctl daemon-reload$sudo systemctl restart otelcol-contrib.servicePaso 4: Vea sus datos de Elasticsearch
Una vez que el recopilador esté en ejecución y enviando datos, puede ver sus métricas de Elasticsearch en New Relic:
- Vaya a one.newrelic.com > Integrations & Agents
- Buscar Elasticsearch (OpenTelemetry)
- En Dashboards, haga clic en Elasticsearch OpenTelemetry Dashboard
- Seleccione su cuenta y haga clic en View dashboard
Debería ver dashboards que muestren el estado del clúster, las métricas de rendimiento y el uso de recursos.
Sugerencia
¿No ve datos? Puede tardar unos minutos en aparecer los datos. Si no ve métricas después de 10 minutos, consulte nuestra guía de solución de problemas.
Próximos pasos con sus datos:
- Explorar métricas: Todas las métricas de Elasticsearch se almacenan como
Metrictipos de eventos - Crear consultas personalizadas: Use NRQL para construir gráficos y dashboards personalizados
- Configure alertas: Continúe con el Paso 5 para configurar el monitoreo proactivo
Paso 5: Configurar alertas
La monitorización proactiva con alertas le ayuda a detectar problemas antes de que afecten a sus usuarios. Para crear condiciones de alerta en New Relic:
- Vaya a one.newrelic.com > Alerts > Alert Conditions.
- Haga clic en Create condition.
- Configure la alerta utilizando el Guided mode o el generador de consultas NRQL.
Las configuraciones de alerta a continuación se recomiendan para una supervisión robusta de Elasticsearch:
Alertas esenciales (Alta prioridad)
Estas alertas monitorean problemas críticos de salud del clúster que pueden causar pérdida de datos o interrupciones del servicio:
Nombre de la alerta | Fundamento del umbral (Condición de ejemplo) |
|---|---|
Alerta de fragmentos no asignados | La métrica
(donde
) está por encima de 0 durante al menos 5 minutos. |
Alerta de nodos de datos en buen estado | La métrica
está por debajo del recuento mínimo de nodos requeridos durante al menos 5 minutos. |
Alerta de uso de memoria dinámica excesivo | El porcentaje de uso del montón (Usado/Máx.) es superior al 90% durante al menos 5 minutos. |
Alerta de tareas pendientes | La métrica
está por encima de 5 durante al menos 5 minutos. |
Alertas de supervisión adicionales
Estas alertas ayudan a monitorear el rendimiento y los problemas operativos:
Nombre de la alerta | Fundamento del umbral (Condición de ejemplo) |
|---|---|
Alerta de tiempo de consulta lento | El percentil 95 de
es superior a 5 ms durante al menos 2 minutos. |
Inicializando fragmentos durante demasiado tiempo | La métrica
(donde
) está por encima de 0 durante al menos 5 minutos. |
Reubicando fragmentos durante demasiado tiempo | La métrica
(donde
) está por encima de 0 durante al menos 5 minutos. |
Resolución de problemas
Si encuentra problemas durante la instalación o no ve datos en New Relic, consulte nuestra completa guía de solución de problemas para obtener soluciones paso a paso a los problemas comunes.