Cette suite de tableaux de bord et d'alertes vous aide à maintenir de manière proactive une intégration de haute qualité avec l'écosystème Google Home. Google s'engage à aider ses partenaires à développer un écosystème de haute qualité pour tous les clients.
Le tableau de bord comporte trois sections, chacune couvrant un élément clé qui contribue à la qualité d'une intégration globale.
Métriques Google vers partenaire : mesurent l'état des appels de Google vers votre backend cloud.
État du système : métriques partenaire vers Google : mesure l'état des appels de votre système vers Google.
État de santé de l'appareil : précision de l'état : mesure la précision des états stockés dans les systèmes Google, qui sont utilisés pour répondre aux requêtes des utilisateurs.
Lorsque les métriques ne respectent pas leurs valeurs cibles, elles sont mises en évidence en rouge pour indiquer un problème susceptible d'avoir un impact sur l'expérience utilisateur. Les informations suivantes fournissent des détails sur chaque cible et expliquent pourquoi elle est importante pour vos utilisateurs.
Si le bouton suivant ne vous redirige pas directement vers le tableau de bord, vous pouvez y accéder en sélectionnant la page Présentation, puis Tableaux de bord. Ensuite, dans la liste Mes tableaux de bord, sélectionnez Tableau de bord des données vitales Google Home (Cloud) pour afficher votre tableau de bord.
Métriques Google pour les partenaires
La métrique Taux de réussite des requêtes/exécutions >= 99, 5 % mesure la fréquence à laquelle les commandes des utilisateurs sont exécutées correctement.Elle permet d'éviter les réponses de l'Assistant telles que "Je n'arrive pas à accéder à l'appareil" ou la confirmation incorrecte d'une commande qui n'a pas été exécutée.
Qu'est-ce qu'une "réussite" ?
Une transaction est marquée comme réussie si la plate-forme Google Home reçoit une réponse valide indiquant que l'action souhaitée a été effectuée ou que l'état demandé a été récupéré.
Les réponses qui incluent des exceptions non bloquantes (par exemple, un état SUCCESS accompagné d'une exception lowBattery) sont comptabilisées comme des transactions réussies.
La commande a atteint l'appareil et l'intention a été satisfaite malgré l'avertissement.
Qu'est-ce qu'un échec ?
Les erreurs listées dans Codes d'erreur courants de la plate-forme et marquées comme Action requise du partenaire sont considérées comme des "échecs" lors du calcul des taux de réussite des requêtes et des exécutions.
La métrique Latence de requête/d'exécution (p90) <= 1 000 ms mesure le temps d'attente pour l'action demandée et permet de s'assurer que les utilisateurs n'ont pas à attendre trop longtemps (par exemple, quelques secondes pour que leur lumière s'éteigne).
Statistiques relatives à la latence
La latence est un indicateur essentiel de la réactivité de votre intégration pour l'utilisateur final. Le tableau de bord suit la latence du 90e centile (P90), qui représente l'expérience de vos utilisateurs les plus "lents" (par exemple, un P90 de 800 ms signifie que 90 % des requêtes sont traitées en 800 ms ou moins).
Google mesure la latence différemment pour les vérifications d'état et les commandes d'appareil afin de garantir la précision technique.
1. Latence des REQUÊTES (interrogatives)
Cette métrique mesure le temps d'aller-retour Cloud-to-cloud lorsque Google demande l'état actuel d'un appareil.
- Début : Google envoie une requête
action.devices.QUERYà votre URL de traitement. - Période de mesure : temps nécessaire à votre cloud pour recevoir, traiter et retransmettre la réponse HTTP complète à Google.
- Fin : Google reçoit et accuse réception de la charge utile de la réponse finale de votre service.
2. Latence EXECUTE (action)
Il s'agit du temps d'accusé de réception des commandes lorsque Google envoie une demande de contrôle à un appareil.
- Début : Google envoie une requête
action.devices.EXECUTEà votre URL de traitement. - Période de mesure : temps nécessaire à votre cloud pour recevoir la commande et renvoyer une réponse d'accusé de réception.
- Fin : Google reçoit la réponse d'état
SUCCESS,PENDINGouOFFLINE. - Champ d'application technique : cette métrique mesure le temps d'accusé de réception de la réponse entre le cloud de Google et le vôtre. Il ne mesure pas le temps nécessaire au matériel physique (par exemple, une ampoule) pour effectuer le changement d'état physique, car cela implique souvent une latence du réseau maillé local en dehors du chemin cloud à cloud.
Options de réduction de la latence
Recommandations d'architecture pour le routage géographique
Si l'implémentation d'une adresse IP Anycast n'est pas possible, nous vous recommandons les alternatives économiques suivantes pour vous assurer que les utilisateurs sont desservis par le centre de données régional le plus proche.
Équilibrage de charge global (GLB)
Au lieu du routage statique, utilisez un équilibreur de charge d'application global (disponible auprès de la plupart des principaux fournisseurs de services cloud).
Fonctionnement : vous configurez un point d'entrée global unique (URL) situé à la périphérie du réseau. L'équilibreur de charge détecte automatiquement l'origine géographique de la requête à partir des clusters de traitement de Google et achemine le trafic vers le backend régional opérationnel le plus proche.
Avantage : cela permet de bénéficier des performances d'Anycast avec une complexité de configuration et un coût nettement inférieurs.
DNS tenant compte de la géolocalisation (GeoDNS)
Fonctionnement : configurez votre fournisseur DNS pour qu'il résolve votre URL de traitement sur différentes adresses IP en fonction de la zone géographique de la requête DNS.
Implémentation : assurez-vous que votre fournisseur DNS est optimisé pour les points de sortie de Google. Lorsque les services d'exécution régionaux de Google (par exemple, aux États-Unis, dans l'UE ou en Asie) résolvent votre domaine, ils reçoivent l'adresse IP du centre de données dans cette région spécifique.
Stratégies d'optimisation au niveau de l'application
Au-delà du routage au niveau de l'infrastructure, vous pouvez implémenter les stratégies suivantes au niveau de l'application pour réduire la latence dans le traitement des requêtes.
Méthode de proxy "Trampoline"
Si vous devez conserver un centre de données principal, utilisez des serveurs proxy régionaux légers (trampolines) pour gérer la première prise de contact.
Google accède à votre URL mondiale.
Un proxy régional (par exemple, une fonction Nginx ou Lambda légère) reçoit la requête.
Le proxy transfère la charge utile via votre backbone interne à haut débit vers la base de données principale.
Avantage : cela réduit le temps de "prise de contact TCP", qui est souvent le principal facteur de latence pour les requêtes longue distance.
Indication de la région du jeton d'accès
Lors du processus d'association de compte (OAuth), votre système peut identifier la région du domicile de l'utilisateur.
Implémentation : encodez un identifiant de région dans le
access_tokenémis pour Google. Lorsque Google envoie une demande d'exécution, votre passerelle peut inspecter immédiatement le jeton et acheminer la demande vers le cluster régional approprié sans avoir besoin d'une recherche dans la base de données.
État du système : métriques sur le partenariat entre Google et les partenaires
Le maintien d'un taux de réussite supérieur ou égal à 99, 5 % permet de s'assurer que les états des appareils sont corrects dans Google Home, que les appareils sont ajoutés et supprimés, que les automatisations se déclenchent et que les événements de l'historique s'affichent dans l'onglet "Activité" de Google Home app (GHA).
Le taux de réussite est calculé en fonction des codes de réponse HTTP renvoyés par Google lorsque votre cloud envoie des mises à jour d'état. Pour s'assurer que les partenaires ne sont pas pénalisés en cas de problèmes d'infrastructure côté Google, la métrique exclut les erreurs internes de Google du nombre d'échecs. Les appels d'API inclus dans le calcul se trouvent dans la documentation de référence de l'API HomeGraph.
Qu'est-ce qu'une "réussite" ?
- 2xx (Succès) : la mise à jour de l'état a bien été reçue et traitée par Home Graph.
Qu'est-ce qu'un échec ?
- 4xx (erreur partenaire) : ces erreurs représentent des échecs et indiquent un problème avec la requête envoyée depuis votre cloud. Voici quelques codes courants :
- 400 Bad Request : le serveur n'a pas pu traiter la requête en raison d'une syntaxe incorrecte. Les causes courantes incluent un code JSON mal formé ou l'utilisation de la valeur nulle au lieu de "" pour une valeur de chaîne.
- 404 Not Found : la ressource demandée est introuvable. En général, cela signifie que Google ne trouve pas l'appareil demandé. Cela peut également signifier que le compte utilisateur n'est pas associé ou qu'un
agentUserIdnon valide a été reçu. Assurez-vous queagentUserIdcorrespond à la valeur fournie dans votre réponse SYNC et que vous gérez correctement les intentsDISCONNECT. - 429 : Ressource épuisée. Votre intégration a dépassé son quota alloué. Pour gérer les quotas, suivez les instructions de l'étape 1, plus haut dans le tableau de bord.
État de l'appareil : précision de l'état
Si vous atteignez ou dépassez un état de précision >= 99,5 %, vous vous assurez que les utilisateurs voient des résultats corrects lorsqu'ils consultent l'état des appareils ou utilisent des fonctionnalités d'IA comme Demander à la maison. Si la précision de l'état est faible, il est possible que les automatisations ne se déclenchent pas et que les entrées de l'historique n'apparaissent pas au bon moment dans l'onglet "Activité" de GHA. Pour en savoir plus, consultez État du rapport.
Le tableau de bord de la qualité effectue un suivi horaire à l'aide de deux métriques distinctes : Précision globale et Combinaison type/traitement la plus faible.
1. Composants de précision
La métrique est dérivée d'échantillons pour lesquels Google peut vérifier l'état signalé par rapport à un résultat d'intention connu.
2. Métriques du tableau de bord (calcul horaire)
Le tableau de bord calcule la précision sur la base d'un intervalle d'une heure. Si une heure comporte moins de 100 échantillons au total (S_Total < 100), la précision pour cette heure est définie sur N/A.
Vue 1 : Précision globale (moyenne mondiale)
Cela représente la précision totale de votre intégration pour tous les types d'appareils et toutes les caractéristiques combinés. Il fournit une moyenne pondérée de l'état de santé de l'ensemble de votre écosystème.
- Calcul : précision totale de l'état sur tous les appareils / total de l'état sur tous les appareils.
Vue 2 : Combinaison type/trait la plus basse
Cela permet d'identifier la catégorie spécifique la moins fiable de votre intégration. Il empêche les appareils à volume élevé et de haute qualité de masquer les appareils à volume faible et de faible qualité. Par exemple, si vous avez un volume élevé de lumières avec une précision d'état supérieure à 99,5 %, mais un faible volume d'interrupteurs avec une faible précision d'état, cela met en évidence l'amélioration nécessaire au niveau des interrupteurs, qui peut être perdue dans une valeur moyenne.
- Calcul : minimum de "Précision de l'état"/"Total de l'état" pour toutes les combinaisons de caractéristiques/d'appareils.