Aperçu
Nous travaillons toujours sur cette fonctionnalité, mais nous aimerions que vous l'essayiez !
Cette fonctionnalité est actuellement fournie dans le cadre d'un programme d'aperçu conformément à nos politiques de pré-sortie.
Cette page propose des solutions aux problèmes courants que vous pourriez rencontrer lors de l'utilisation de l'automatisation des workflows. Pour obtenir de l'aide supplémentaire, consultez le forum d'assistance de New Relic ou contactez l'assistance de New Relic.
Identifiants et authentification AWS
« Jeton invalide » ou identifiants expirés
Problème : le workflow a échoué en raison d’erreurs d’expiration Jeton.
Solutions :
- Pour les jetons de session : vérifiez la durée d'expiration — les jetons de session durent généralement de 1 à 12 heures. Générez-en de nouveaux avant leur expiration en utilisant :bash$aws sts assume-role \>--role-arn "arn:aws:iam::YOUR_ACCOUNT:role/YOUR_ROLE" \>--role-session-name "WorkflowAutomationSession"
- Pour les clés d'accès : vérifiez que l'ID de clé d'accès et la clé d'accès secrète sont correctement enregistrés dans le gestionnaire de secrets. Revérifiez les valeurs dans l'explorateur NerdGraph GraphiQL.
- Vérifiez la syntaxe des secrets : assurez-vous d’utiliser le format
${{ :secrets:keyName }}et non${{ secrets.keyName }}. Le préfixe deux-points (:secrets:) est requis.
Impossible de trouver mon rôle ARN
Problème : Vous avez besoin de l’ARN mais vous ne parvenez pas à le localiser dans AWS.
Solution:
- Connectez-vous à la console AWS IAM
- Choisissez Roles dans le menu de navigation
- Recherchez le nom de votre rôle (par exemple,
NewRelicWorkflowAutomationRole) - Sélectionnez le rôle — l’ARN apparaît dans la section Résumé
- Le format ARN est :
arn:aws:iam::<YOUR_AWS_ACCOUNT>:role/<ROLE_NAME>
Le workflow ne peut pas accéder à certaines ressources AWS.
Problème : Votre rôle dispose des autorisations nécessaires, mais le workflow ne peut toujours pas accéder à certaines ressources.
Solutions :
- Autorisations au niveau des ressources : vérifiez si votre stratégie IAM restreint l’accès à des ARN de ressources spécifiques. Vous devrez peut-être ajouter un caractère générique (
*) pour les tests, puis limiter l'accès à des ressources spécifiques.{"Effect": "Allow","Action": "ec2:DescribeInstances","Resource": "*" // Change from specific ARN to * for testing} - Politiques de contrôle des services (SCP) : si vous êtes dans une organisation AWS, les SCP peuvent bloquer certaines actions. Contactez votre administrateur AWS pour consulter les politiques de votre organisation.
- Incompatibilité de région : assurez-vous que vos autorisations IAM spécifient la région AWS correcte où se trouvent vos ressources. Mettez à jour le paramètre
awsRegiondu workflow pour qu'il corresponde à l'emplacement de votre ressource.
problèmes d'exécution du workflow
Guide de dépannage rapide
Utilisez ce tableau pour un diagnostic rapide des problèmes courants workflow :
| Symptôme | Vérifier | Solution |
|---|---|---|
| Le workflow échoue à une étape spécifique | Consultez les logs d'exécution pour obtenir le message d'erreur. | Corrigez la configuration, les identifiants ou les données d'entrée pour cette action. |
| Le workflow s'exécute mais produit des résultats incorrects | Vérifier le passage des données entre les étapes | Vérifier la syntaxe du modèle ${{ .steps.name.outputs.field }} |
| workflow planifié ne s'exécute pas. | Consultez l'historique d'exécution pour les exécutions ignorées. | Vérifier configuration de la planification et l'état workflow (Actif) |
| Le workflow expire | Vérifier la durée d'exécution | Réduisez la fréquence d'interrogation ou divisez le workflow en plus petits |
| Les modifications ne sont pas prises en compte. | Consulter l'historique des versions | Mettez à jour les exécutions planifiées pour utiliser la nouvelle version. |
Pour des instructions détaillées sur la consultation des logs et de l'historique d'exécution, voir les exécutions workflow du moniteur.
Le workflow affiche l'état « Échec ».
Problème : Un workflow apparaît avec le statut « Échec » dans le dashboard.
Solutions :
Consultez l'historique d'exécution:
- Accédez à one.newrelic.com > All Capabilities > Workflow Automation
- Cliquez sur le nom workflow
- Consultez Run history pour voir quelle exécution a échoué.
Revoir les logs d'exécution :
- Cliquez sur View logs de l’exécution ayant échoué pour identifier l’action spécifique qui a échoué.
- Recherchez les messages d'erreur indiquant la cause première
Causes fréquentes:
- Identifiants invalides: jeton expiré, syntaxe des secrets incorrecte ou clés secrètes erronées
- Autorisations manquantes: autorisations AWS IAM insuffisantes, étendues d’accès au bot Slack ou accès à l’API insuffisants
- Modifications apportées aux ressources cibles: instances EC2 supprimées, canaux Slack supprimés ou base de données renommée
- Limites de débit de l'API dépassées: Trop de requests vers des services externes (AWS, Slack, etc.).
- Délais d'attente réseau: les API externes mettent trop de temps à répondre.
Correction et nouvelle exécution: Après avoir résolu le problème, déclenchez manuellement le workflow à l’aide de l’ API StartWorkflowRun pour vérifier son bon fonctionnement.
L'exécution du workflow prend trop de temps.
Problème : les exécutions du workflow dépassent la durée prévue ou expirent.
Solutions :
Analyse de la séquence d'actions: Consultez les logs pour identifier les actions lentes. Recherchez les actions dont le temps d'exécution est supérieur à 30 secondes.
Optimisation des requêtes: Si vous utilisez des requêtes NRQL, optimisez-les pour de meilleures performances :
- Ajoutez des plages horaires spécifiques au lieu d'interroger toutes les données.
- Utilisez
LIMITpour réduire la taille de l'ensemble de résultats - Filtrer tôt avec des clauses
WHERE
Vérifiez les API externes: des réponses lentes des services intégrés (AWS, Slack) peuvent retarder l’exécution. Tester séparément les temps de réponse de l'API.
Tenez compte des limites workflow : examinez les limitesworkflow pour les contraintes de délai d'expiration (généralement 15 minutes par workflow).
Décomposez les workflows en processus plus courts: Divisez les workflows complexes en automatisations plus petites et ciblées pouvant s’exécuter en parallèle.
Les modifications apportées au workflow ne sont pas prises en compte.
Problème : Vous avez modifié un workflow, mais les modifications ne sont pas prises en compte lors de son exécution.
Solutions :
Vérifiez que vous avez enregistré: Assurez-vous d'avoir cliqué sur Save après avoir modifié la configuration workflow.
Vérifiez la version:
- Accéder aux détails workflow
- Cliquez sur l'onglet Version history
- Assurez-vous que vos dernières modifications apparaissent comme une nouvelle version
- Vérifiez que cette version est bien active.
Mise à jour des exécutions planifiées: si le workflow s’exécute selon une planification, mettez à jour cette planification pour utiliser la nouvelle version :
- Accédez à one.newrelic.com > All Capabilities > Workflow Automation
- Trouver les courses programmées
- Mettez à jour le planning pour qu'il prenne en compte la nouvelle version workflow
Vider le cache: La mise en cache Browser peut afficher une ancienne configuration— actualisez la page (Ctrl+Maj+R ou Cmd+Maj+R).
Problèmes dashboard du workflow
Impossible de trouver un workflow dans le dashboard
Problème : Le workflow que vous avez créé n’apparaît pas dans la liste dashboard.
Solutions :
Vérifier les filtres:
- Cliquez sur la liste déroulante des filtres
- Sélectionnez « Tous » pour les filtres d'état
- Effacer la barre de recherche
Vérifier le compte: Confirmez que vous êtes connecté au compte New Relic correct sur lequel le workflow a été créé. Consultez le sélecteur de compte en haut à droite.
Vérifiez les autorisations: assurez-vous que votre rôle d'utilisateur a accès à la visualisation du workflow. Contactez votre administrateur New Relic si vous avez besoin d'autorisations d'accès workflow.
Actualisez la page: la mise en cache Browser peut parfois masquer les modifications récentes. Essayez une actualisation forcée (Ctrl+Maj+R ou Cmd+Maj+R).
Impossible de supprimer un workflow
Problème : L’option Supprimer est grisée ou la suppression échoue.
Solutions :
Vérifier les autorisations: Vérifiez que votre rôle d'utilisateur dispose des autorisations de suppression pour le workflow. Contactez l'administrateur de votre compte si nécessaire.
Arrêter les exécutions planifiées: Annulez toutes les exécutions planifiées actives avant de les supprimer :
- Accédez aux détails workflow
- Accédez à l'onglet Scheduled runs
- Annuler tous les horaires actifs
Vérification des dépendances: certains workflows ne peuvent pas être supprimés si d’autres automatisations en dépendent. Vérifiez si le workflow est référencé par :
- D'autres workflows l'appellent ainsi.
- règle d'alerte qui le déclenche
- Système externe qui le démarre via API
Contactez l'assistance: Si le problème persiste après avoir essayé les solutions ci-dessus, contactez l'assistance New Relic pour obtenir de l'aide.
Problèmes spécifiques à l'intégration
La notification Slack ne s'affiche pas
Problème : le workflow s'exécute correctement, mais les messages Slack n'apparaissent pas.
Solutions :
Vérifiez l'ID du canal: Assurez-vous d'utiliser l' ID du canal Slack (par exemple,
C01234ABCD), et non le nom du canal. Trouvez l'identifiant dans Slack :- Faites un clic droit sur le nom de la chaîne
- Sélectionnez View channel details.
- Copiez l'identifiant de la chaîne en bas.
Vérifiez les autorisations du bot: assurez-vous que votre bot Slack dispose des autorisations suivantes :
chat:write- Publier des messageschannels:read- Consulter les chaînes publiquesgroups:read- Afficher les chaînes privées (le cas échéant)
Vérifier que le bot est dans le canal: Ajouter le bot au canal cible :
- Tapez
/invite @YourBotNamedans le canal - Vérifiez que le bot figure bien dans la liste des membres.
- Tapez
Vérifier le jeton dans les secrets: Vérifiez que le jeton Slack stocké dans le gestionnaire de secrets est correct et n’a pas expiré.
Les opérations AWS système Manager échouent
Problème : Les documents ou commandes d’automatisation SSM ne s’exécutent pas.
Solutions :
- Vérifiez les autorisations SSM: assurez-vous que le rôle IAM dispose des autorisations suivantes :{"Effect": "Allow","Action": ["ssm:CreateDocument","ssm:DeleteDocument","ssm:StartAutomationExecution","ssm:GetAutomationExecution"],"Resource": "*"}
- Vérification de l'agent SSM: assurez-vous que l'agent SSM est installé et en cours d'exécution sur les instances EC2 cibles :bash$aws ssm describe-instance-information --region us-east-1
- Vérifiez le profil de l'instance: les instances EC2 nécessitent un profil d'instance IAM avec des autorisations SSM pour exécuter des commandes.
- Vérifier l'existence du document: Si vous utilisez un document SSM existant, vérifiez qu'il existe dans votre compte AWS et votre région.
Problèmes spécifiques au modèle
GUID d'entité introuvable
Problème : Les modèles échouent avec Entity not found erreurs.
Solutions :
Trouver le GUID d'entité correct:
- Accédez à la page de ressources du moniteur dans New Relic
- Vérifiez l'URL ou les métadonnées de l'entité pour le GUID
- Utilisez la recherche d'entité pour localiser l'entité
Vérifiez que l'entité existe dans le compte approprié: assurez-vous d'utiliser l'entité du même compte que celui où le workflow est déployé.
Vérifiez les données de l'entité: assurez-vous que l'entité affiche Last seen récente (une entité obsolète a peut-être été supprimée).
Pour l'entité AWS: Assurez-vous que les intégrations sont actives
Conseil
Les GUID d'entité sont spécifiques à chaque compte. Le déplacement du workflow entre les comptes nécessite la mise à jour de tous les GUID d'entité.
La requête NRQL ne renvoie aucun résultat
Problème : Les modèles utilisant la requête NRQL s’exécutent correctement mais renvoient des ensembles de données vides.
Solutions :
Testez d'abord la requête: utilisez le générateur de requêtes pour valider la requête avant de l'ajouter aux modèles
Vérifiez le type de données et les noms des événements:
- Utilisez
FROM Transaction, et nonFROM Transactions - Vérifier que les noms des attributs correspondent exactement (sensible à la casse).
- Utilisez
Ajuster les plages horaires: Pour les données éparses, élargir la fenêtre temporelle :
- Ajoutez
SINCE 1 hour agopour les données récentes - Utilisez
SINCE 1 day agopour les tendances
- Ajoutez
Simplifiez et testez progressivement: commencez par une requête de base, puis ajoutez les filtres un par un.
Vérifier la syntaxe NRQL: s’assurer que la structure de la requête correspond aux exigences NRQL
Le déploiement du modèle échoue
Problème : Le modèle ne se déploie pas ou affiche des erreurs lors du déploiement.
Solutions :
- Vérifiez toutes les informations requises: assurez-vous d’avoir rempli tous les champs obligatoires (identifiants, GUID, requête).
- Vérifiez le format des informations d'identification: les secrets doivent utiliser le format
${{ :secrets:keyName }}avec le préfixe deux-points. - Testez les identifiants indépendamment: avant le déploiement, testez les identifiants AWS avec l’interface de ligne de commande AWS et l’API Slack.
- Exigences relatives aux modèles de vérification: Chaque modèle énumère des prérequis spécifiques ; assurez-vous qu’ils sont tous respectés.
- Vérifiez la présence de caractères spéciaux: certains champs (noms de canaux, requêtes) peuvent ne pas fonctionner correctement avec des caractères spéciaux ; utilisez des caractères alphanumériques lorsque cela est possible.
Le flux d'approbation ne répond pas.
Problème : les modèles nécessitant une approbation Slack (restauration d’API Gateway, redimensionnement d’EC2) ne détectent pas les réactions.
Solutions :
Vérifier les portées des jetons du bot:
reactions:read- Nécessaire pour détecter les réactions aux émojischat:write- Obligatoire pour publier les messages d'approbation
Vérifiez le format de réaction: utilisez l’emoji exact spécifié dans le workflow (généralement 👍 pour approuver, 👎 pour refuser).
Vérifiez les paramètres de délai d'expiration: requests d'approbation expirent après le délai configuré (généralement 5 à 10 minutes).
Assurez-vous que le bot puisse lire les messages: le bot doit être présent dans le canal et avoir l’autorisation de consulter l’historique des messages.
Test avec une approbation simple: Créez un workflow de test avec uniquement la logique d’approbation pour isoler le problème.
Problèmes de gestion des instances EC2
Problème : le modèle EC2 ne parvient pas à redimensionner ou à gérer l’instance.
Solutions :
- Vérifiez que les flux de métriques CloudWatch sont configurés: requis pour les métriques EC2 en temps réel.
- Vérifier que l'intégration du monitoring EC2 est active: garantit que les données de l'instance sont transmises à New Relic.
- Vérifier l'état instance : l'instance doit être à l'état
runningoustopped; les états transitoires (en attente, en cours d'arrêt) entraînent des échecs. - Vérifiez la compatibilité instance de type d': toutes instance de type d' ne prennent pas en charge toutes les opérations de redimensionnement. Consultez la documentation AWS relative aux instance de type d'.
- Vérifiez les autorisations d'arrêt/démarrage: le rôle IAM nécessite
ec2:StopInstancesetec2:StartInstancesen plus deec2:ModifyInstanceAttribute
Le modèle d'analyse JSON ne consigne pas les données.
Problème : le modèle d’analyse JSON s’exécute correctement, mais aucune donnée n’apparaît dans les logs New Relic.
Solutions :
- Vérifier les points de terminaison d'API: Tester l'URL de la page d'état dans un navigateur – s'assurer qu'elle renvoie un JSON valide
- Vérifiez la structure JSON: le modèle attend un format spécifique ; assurez-vous que les champs d’état des composants correspondent à la structure attendue.
- Vérifiez les filtres log : assurez-vous que l’action de logging utilise le type d’événement et l’attribut corrects.
- Test avec un point de terminaison simple: utilisez un point de terminaison JSON basique (comme
https://httpbin.org/json) pour vérifier le bon fonctionnement du modèle. - Vérifier les autorisations du compte: s’assurer que workflow est autorisé à écrire les logs dans New Relic.
L'authentification de la requête SQL NRLens échoue
Problème : le modèle NRLens échoue en raison d’erreurs d’authentification ou de connexion.
Solutions :
- Vérifiez les informations d'identification NRLens: assurez-vous que les informations d'identification du Gateway de requête SQL sont à jour et correctement stockées dans les secrets.
- Vérifiez les identifiants de l'organisation et du compte: assurez-vous que les deux identifiants correspondent exactement à ceux de votre organisation New Relic.
- Tester la requête SQL séparément: utiliser l’interface NRLens pour tester la requête avant de l’ajouter au workflow
- Vérifiez la syntaxe SQL: NRLens SQL diffère de NRQL ; consultez la documentation NRLens pour connaître la syntaxe prise en charge.
- Vérifiez la complexité de la requête: les jointures très complexes ou les grands ensembles de données peuvent expirer ; simplifiez la requête ou ajoutez des limites de temps.
Prochaines étapes
Si vous rencontrez toujours des problèmes après avoir essayé ces solutions :
- Forum de la communauté sur l'automatisation des workflows: Posez des questions et obtenez de l'aide d'autres utilisateurs
- Assistance New Relic: Contactez l’assistance pour les problèmes liés à votre compte.
- Bonnes pratiques de workflow: Apprenez des modèles pour un workflow fiable
- Limites du workflow: Comprendre les contraintes et les quotas du système