Tenez-vous informé des nouveautés et des fonctionnalités de Google Home. S'inscrire

Surveillance des pannes de la maison connectée

1. Avant de commencer

Comme nous l'avons expliqué dans l'atelier de programmation Déboguer la maison connectée, nous publions des métriques et des journaux dans vos projets pour la maison connectée. Les métriques vous permettent de déterminer les problèmes rencontrés par votre action pour la maison connectée. Quant aux journaux, ils sont utiles pour analyser la situation en détail afin de résoudre ces problèmes.

DD44868a4ff2df6e.png

Vous pouvez configurer des alertes à l'aide des métriques fournies pour surveiller vos pannes de manière automatisée et recevoir des notifications en cas d'interruption de service. Nous publions une métrique de confiance pour mettre en évidence les perturbations de votre projet. Nous aborderons ce nouvel atelier de programmation avec tous les autres outils d'alerte disponibles sur Google Cloud Platform.

Conditions préalables

Points abordés

  • Surveiller les problèmes de performances et les interruptions de service dans votre projet
  • Créer une alerte basée sur un seuil et recevoir des notifications en cas de perturbations
  • Utiliser la métrique de confiance fournie à votre projet pour détecter les interruptions

2. Contrôle des performances

Il est essentiel de surveiller les performances pour assurer le succès de l'intégration à l'écosystème Google Home pour la maison connectée. Nous fournissons un ensemble d'outils de surveillance aux développeurs de maisons connectées sur Google Cloud Platform. Ces outils vous donnent une idée des performances de votre projet.

Accéder aux tableaux de bord

La première étape pour accéder à vos données consiste à vérifier les tableaux de bord Google Home. Pour cela, connectez-vous à Google Cloud Console et accédez à Operations > Monitoring > Dashboards. Plusieurs tableaux de bord sont disponibles, et ceux pour la maison connectée intègrent le préfixe Google Home Analytics.

317697e52ced2436.png

Nous avons créé des tableaux de bord distincts pour chaque type d'intégration. Les intégrations Cloud, locales et de litige ont leur propre tableau de bord, et les données pour les protocoles de streaming de la caméra sont fournies dans le tableau de bord "Qualité de la caméra". Ces tableaux de bord ne contiendront des données que si vous avez intégré le type correspondant, ainsi qu'un projet fonctionnel qui répond aux requêtes.

Lorsque vous ouvrez l'un de ces tableaux de bord, la vue que vous obtenez se présente comme suit:

F8bfd69286c569a4.png

Les tableaux de bord contiennent divers graphiques présentant les détails des requêtes traitées par votre projet. Dans chaque tableau de bord d'intégration, un graphique indique le nombre total de demandes traitées par votre projet, un graphique du taux de réussite de ce type d'intégration, ainsi que plusieurs graphiques présentant les caractéristiques et les types d'appareils concernés.

Pour évaluer les performances de vos actions pour la maison connectée, vous devez respecter trois principes fondamentaux:

f511fafd3aaaa1eb.png

En cas de panne, vous pouvez voir les tendances à la baisse dans le pourcentage de réussite et la tendance à la hausse dans le graphique de répartition des erreurs. Le contrôle du pourcentage de réussite de l'exécution permet de remarquer l'indisponibilité, tandis que le fait d'examiner les principales erreurs dans la répartition des erreurs peut faciliter le débogage. Vous pouvez également observer une augmentation de la latence pendant les pannes, comme indiqué dans les graphiques de latence des requêtes.

Notez que la vue par défaut avec les graphiques affichés dans les tableaux de bord Google Analytics n'est qu'une vue créée pour votre projet à l'aide de données de métriques sur les maisons connectées. Vous pouvez également utiliser l'Explorateur de métriques pour créer vos propres graphiques à partir des mêmes métriques sous-jacentes, puis les enregistrer dans vos tableaux de bord personnalisés.

Explorateur de métriques

L'explorateur de métriques permet de visualiser les segments de votre ensemble de données de projet. Vous pouvez accéder à l'outil dans Google Cloud Console en accédant à Operations > Monitoring > Metrics Explorer.

Google Cloud fournit de nombreuses métriques prêtes à l'emploi, dont certaines ne sont pas liées à la maison connectée. Les statistiques que nous fournissons pour la maison connectée sont répertoriées sous "resource".googleapis.com/smarthome_action/..." ressource. Pour les rechercher, saisissez "&home"" dans la zone de sélection de métriques.

538d851edfd34764.png

Recherchez "homehome" pour afficher toutes les métriques de maison connectée que nous proposons pour votre projet. Vous pouvez obtenir des informations détaillées sur chacune de nos métriques sur la page Surveillance et journalisation de notre documentation.

Pour surveiller votre projet, la métrique la plus simple à utiliser est la nombre de requêtes (qui est une métrique delta). Cette métrique enregistre une entrée pour chaque exécution de la maison connectée initiée par vos utilisateurs et enregistre des champs tels que le type d'appareil, la caractéristique, le type d'exécution impliqué dans l'exécution et le champ d'état qui affiche le résultat.

Si vous sélectionnez cette métrique, un écran s'affiche, présentant chaque bucket de données de la manière suivante:

B1C18141d15a0e09.png

Globalement, pour chaque combinaison de libellés de données présents dans cette métrique, un bucket enregistre la modification (delta) entre les intervalles de temps précédent et actuel. Vous pouvez regrouper ou filtrer ces buckets pour obtenir un segment de données de vue souhaité. De plus, les données sont alignées dans les intervalles de temps sélectionnés avec une fonction d'alignement (DELTA, MEAN, MEDIAN, SUM). Sauf indication contraire, vous utilisez généralement l'alignement Delta avec une métrique delta.

Vous pouvez créer la plupart des graphiques disponibles dans les tableaux de bord Google Home Analytics à l'aide de l'explorateur de métriques et les enregistrer pour y accéder ultérieurement dans un tableau de bord personnalisé. Pour obtenir des vues plus complexes, comme un graphique de ratios, vous devrez utiliser le langage MQL (Monitoring Query Language).

3. Évaluation des résultats

Pour suivre votre intégration, vous pouvez utiliser le taux de réussite que nous calculons à partir de votre indicateur de nombre de demandes comme indicateur de référence, ou le taux de réussite pour une approche plus spécialisée.

Taux de réussite

Le taux de réussite est calculé pour toutes vos intégrations en divisant le nombre de requêtes réussies par le nombre total de requêtes. Vous pouvez y accéder à partir du graphique sur le taux de réussite de Fulfillment dans votre tableau de bord Google Home Analytics.

55ea8930fbf48d9e.png

Le graphique du taux de réussite des traitements est très utile pour surveiller les performances de votre projet, mais il ne le sera pas beaucoup lorsque vous créerez des tableaux de bord personnalisés ou des alertes. Comme le taux de réussite est déterminé à partir de votre métrique de décompte des requêtes et non d'une métrique en soi, vous devrez la recréer à l'aide du langage MQL (Monitoring Query Language) dans l'explorateur de métriques afin de l'utiliser avec l'une ou l'autre de ces fonctionnalités.

De plus, pour suivre les perturbations des performances de votre projet, nous pensons qu'une approche beaucoup plus spécialisée est nécessaire. C'est pourquoi nous avons créé la métrique de confiance, qui change en fonction de l'écart entre votre taux de réussite actuel et les normes historiques.

Métrique de confiance

Il existe différents types d'indisponibilités pour les projets. Ils peuvent durer plusieurs heures, voire quelques minutes, ce qui peut nuire à leur identification. Pour cela, nous avons créé une métrique de confiance dans votre projet, qui fournit une valeur normalisée permettant de prédire la fiabilité en fonction des performances passées. Pour accéder à la métrique de confiance, recherchez "smarthome" dans l'explorateur de métriques, puis sélectionnez Execution success confiance (Fiabilité de réussite de l'exécution).

AB467A1777281526.png

Si l'intégration de votre maison connectée enregistre des performances supérieures ou égales à l'historique (moyenne sur sept jours), cette métrique affiche la valeur maximale (1,0). Lorsque votre pourcentage de réussite dévie de plus de quatre écarts types (également calculés sur sept jours), cette métrique génère la valeur minimale (0,0). Lorsque les écarts types sont trop faibles (moins de 2,5%), cette métrique base la valeur 0,0 sur une baisse de 10% du taux de réussite.

Pour tous les intermédiaires, cette métrique fournit des valeurs comprises entre 1 (confiable dans l'éventualité où aucune indisponibilité n'est détectée) et 0.0 (fiabilité maximale qu'il n'y a aucune interruption).

Par conséquent, lorsque vous définissez une alerte (dans la section suivante), nous vous recommandons de baser la valeur 0,5 sur un seuil. Cela correspond à deux écarts types ou à une diminution de 5 %, selon l'écart le plus élevé (selon la valeur la plus élevée).

4. Configurer des alertes

L'étape suivante consiste à utiliser tout ce que vous avez appris dans la section précédente pour configurer des alertes sur votre projet.

Créer une règle d'alerte

Les alertes automatiques sur Google Cloud Platform sont définies via des règles d'alerte. Vous pouvez accéder aux règles d'alerte via le menu latéral : Operations > Monitoring > Alerting (Opérations et surveillance ; surveillance ; Alertes). Pour créer une règle d'alerte, sélectionnez l'option +CREATE POLICY (+ CRÉER UNE RÈGLE) qui vous permet d'accéder à l'écran de création de règles d'alerte:

6e417d88c2274b3d.png

La création d'une règle d'alerte s'effectue en trois étapes. Vous devez d'abord déterminer les éléments que vous souhaitez suivre en ajoutant une condition. Appuyez sur le bouton AJOUTER UNE CONDITION pour afficher une fenêtre semblable à l'explorateur de métriques, avec des commandes supplémentaires pour configurer la condition:

df1ccf7da741e1c7.png

Pour la cible, sélectionnez la métrique de confiance décrite dans la section précédente. Assurez-vous que l'aligneur est défini sur "delta" à l'aide de cette métrique (Afficher les options avancées > Aligner). L'étape suivante consiste à configurer la condition d'alerte et à utiliser les paramètres suivants:

4192e0f4ea00jj28.png

Conditions déclenchées si : il s'agit de la configuration principale à utiliser pour déterminer quand déclencher des alertes. L'option Chaque fois que une série enfreint les règles fonctionnera, car nous allons définir un seuil pour notre métrique et surveiller si la valeur est croisée.

Condition : L'alerte doit être déclenchée lorsque la valeur passe en dessous du seuil. Nous devons donc définir la valeur sur cette valeur. Avec notre métrique, 1.0 signifie que l'intégration fonctionne correctement et 0,0 indique une interruption définitive.

Seuil : nous avons créé la métrique de confiance pour fournir les meilleurs résultats lorsque cette valeur est définie sur 0,5. Si vous souhaitez recevoir plus d'alertes plus fréquemment et recevoir des notifications en cas d'incidents moins importants, vous pouvez essayer d'augmenter cette valeur (1 au maximum). Par la suite, si vous souhaitez être averti moins efficacement, mais uniquement pour les problèmes les plus graves, vous pouvez essayer de réduire cette valeur (0 ou 0).

For (Pendant) : ce paramètre permet d'identifier la durée des interruptions. Nous vous recommandons de conserver ce paramètre sur la valeur la plus récente afin d'être alerté lorsqu'un point dépasse le seuil. Notre métrique de confiance est publiée toutes les 15 minutes, indiquant le succès moyen de cette période.

Une fois la condition ajoutée, sélectionnez le canal de notification. Les notifications par e-mail sont la méthode la plus simple. Vous pouvez choisir un e-mail dans la liste déroulante Notification Channels (Canaux de notification) :

3cc10629830e7f13.png

Si vous cochez l'option Notifier en cas de fermeture d'incident, une autre notification sera envoyée dès que l'incident sera marqué comme fermé. Dans ce cas, vous devez également sélectionner une durée de fermeture automatique de l'incident, qui est définie par défaut sur sept jours.

La dernière étape consiste à attribuer un nom à votre alerte et à ajouter tous les documents que vous souhaitez inclure dans les notifications.

686fb1c537fee10.png

Il est recommandé de fournir des documents, en particulier si vous ne recevez pas l'alerte. Ajouter des étapes comme le lieu de vérification lors d'un incident, et le tri et le débogage peut être utile en cas d'indisponibilité. Si nécessaire, vous pouvez consulter notre Guide de dépannage.

Une fois enregistrée, votre règle d'alerte est répertoriée dans la section "Règles" de la page "Alertes".

C71a001e4df035ee.png

5. Atténuer les pannes

Une fois les alertes configurées, vous recevez une notification en cas d'indisponibilité des canaux de notification que vous avez fournis, et une entrée d'incident est créée sur la page "Alertes".

Recevoir des alertes

Le canal d'alerte fourni dans cet atelier de programmation est un e-mail. Une fois la configuration effectuée, nous espérons que vous ne recevrez aucune alerte (en cas d'interruption), mais la notification se présentera comme suit:

43217b0a145c2cd.png

Notez que la notification d'alerte fournit la valeur observée qui dépasse le seuil que vous avez spécifié, ainsi qu'un horodatage indiquant le début de l'incident.

Incidents de surveillance

Les incidents se produisent également dans la section "Incidents" de la page "Alertes".

fdD883a9604ed981.png

Vous pouvez cliquer sur un incident spécifique pour en afficher les détails, tels que sa durée ou sa gravité.

N'oubliez pas que, lorsque vous recevez des alertes, la première étape consiste à examiner vos métriques, puis à rechercher les erreurs qui contribuent à votre panne dans vos journaux. Un rappel sur la procédure à suivre est disponible dans notre atelier de programmation Déboguer la maison connectée.

6. Félicitations

17d485868a6771bc.png

Félicitations ! Vous avez appris à configurer des alertes à l'aide des métriques fournies pour surveiller automatiquement les pannes et recevoir des notifications en cas de perturbations du service.

Étapes suivantes

En complément de cet atelier de programmation, faites ces exercices et découvrez d'autres ressources :

  • Vous pouvez combiner ce que vous avez appris dans cet atelier de programmation avec d'autres métriques fournies avec votre projet. Vous pouvez consulter la liste complète des métriques disponibles dans la section "Métriques acceptées" de la page Surveillance et journalisation.
  • Découvrez d'autres types de canaux de notification pour les alertes expliquées sur la page Options de notification de la documentation Google Cloud Platform.