Google Home Vitals (cloud)

Questa suite di dashboard e avvisi ti aiuta a mantenere in modo proattivo un'integrazione di alta qualità con l'ecosistema Google Home. Google si impegna a supportare i partner nello sviluppo di un ecosistema di alta qualità per tutti i clienti

La dashboard è suddivisa in tre sezioni, ognuna delle quali copre una parte fondamentale che contribuisce alla qualità di un'integrazione complessiva.

  1. Metriche da Google a partner: misurano l'integrità delle chiamate da Google al backend cloud.

  2. Integrità del sistema - Metriche partner-Google: misura l'integrità delle chiamate dal tuo sistema a Google.

  3. Integrità del dispositivo - Precisione dello stato: misura la precisione degli stati archiviati nei sistemi Google, che vengono utilizzati per rispondere alle query degli utenti.

Quando le metriche non raggiungono i valori target, vengono evidenziate in rosso per indicare un problema che potrebbe influire sull'esperienza utente. Le seguenti informazioni forniscono dettagli su ciascun target e sul motivo per cui è importante per i tuoi utenti.

Se il pulsante seguente non ti porta direttamente alla dashboard, puoi accedervi selezionando la pagina Panoramica, poi Dashboard e infine Dashboard Vitals di Google Home (Cloud) dall'elenco Le mie dashboard.

Vai alla Dashboard

Metriche da Google al partner

La metrica Tasso di successo di query/esecuzione >= 99,5% misura la frequenza con cui i comandi degli utenti vengono eseguiti correttamente, il che contribuisce a evitare risposte dell'assistente come "Non riesco a raggiungere il dispositivo" o la conferma errata di un comando che non è stato eseguito.

Che cosa definisce un "successo"?

Una transazione viene contrassegnata come riuscita se la piattaforma Google Home riceve una risposta valida che indica che l'azione prevista è stata eseguita o che lo stato richiesto è stato recuperato.

Le risposte che includono eccezioni non bloccanti (ad esempio, uno stato SUCCESS accompagnato da un'eccezione lowBattery) vengono conteggiate come transazioni riuscite. Il comando ha raggiunto il dispositivo e l'intent è stato soddisfatto nonostante l'avviso.

Che cosa definisce un "errore"?

Gli errori rilevati in Codici di errore comuni della piattaforma contrassegnati come Azione del partner vengono considerati "Errori" durante il calcolo delle percentuali di successo di QUERY ed EXECUTE.

La metrica Latenza query/esecuzione (p90) <= 1000 ms misura il tempo di attesa dell'azione richiesta e contribuisce a garantire che gli utenti non debbano aspettare troppo a lungo, ad esempio, qualche secondo prima che la luce si spenga.

Metriche di latenza

La latenza è un indicatore fondamentale di quanto l'integrazione sia reattiva per l'utente finale. La dashboard monitora la latenza del 90° percentile (P90), che rappresenta l'esperienza degli utenti "più lenti" (ad esempio, un P90 di 800 ms significa che il 90% delle richieste viene riconosciuto in 800 ms o meno).

Google misura la latenza in modo diverso per i controlli dello stato rispetto ai comandi del dispositivo per garantire l'accuratezza tecnica.

1. Latenza della query (interrogativa)

Misura il tempo di andata e ritorno di Cloud-to-cloud quando Google chiede lo stato attuale di un dispositivo.

  • Inizio: Google invia una richiesta action.devices.QUERY al tuo URL di evasione.
  • Finestra di misurazione: il tempo impiegato dal cloud per ricevere, elaborare e trasmettere la risposta HTTP completa a Google.
  • Fine: Google riceve e conferma il payload della risposta finale dal tuo servizio.

2. Latenza EXECUTE (azione)

Misura il tempo di riconoscimento del comando quando Google invia una richiesta di controllo a un dispositivo.

  • Inizio: Google invia una richiesta action.devices.EXECUTE al tuo URL di evasione.
  • Finestra di misurazione: il tempo impiegato dal cloud per ricevere il comando e restituire una risposta di riconoscimento.
  • Fine: Google riceve la risposta con lo stato SUCCESS, PENDING o OFFLINE.
  • Ambito tecnico: questa metrica misura il tempo di "Response Ack" tra il cloud di Google e il tuo cloud. Non misura il tempo necessario all'hardware fisico (ad esempio una lampadina) per completare la modifica dello stato fisico, poiché spesso ciò comporta una latenza della rete mesh locale al di fuori del percorso cloud-to-cloud.

Opzioni di riduzione della latenza

Consigli sull'architettura per il georouting

Se l'implementazione dell'IP Anycast non è fattibile, ti consigliamo le seguenti alternative economiche per garantire che gli utenti vengano serviti dal data center regionale più vicino.

  1. Global Load Balancing (GLB)

    Anziché il routing statico, utilizza un bilanciatore del carico delle applicazioni globale (disponibile dalla maggior parte dei principali fornitori di servizi cloud).

    • Come funziona: configuri un unico punto di ingresso globale (URL) che si trova al limite della rete. Il bilanciatore del carico rileva automaticamente l'origine geografica della richiesta dai cluster di evasione di Google e instrada il traffico al backend regionale integro più vicino.

    • Vantaggio:offre le prestazioni di Anycast con costi e complessità di configurazione notevolmente inferiori.

  2. DNS con riconoscimento della posizione geografica (GeoDNS)

    • Come funziona:configura il tuo provider DNS in modo che risolva l'URL di evasione in indirizzi IP diversi in base alla posizione geografica della query DNS.

    • Implementazione:assicurati che il tuo provider DNS sia ottimizzato per i punti di uscita di Google. Quando i servizi di evasione regionali di Google (ad esempio, negli Stati Uniti, nell'UE o in Asia) risolvono il tuo dominio, ricevono l'indirizzo IP per il data center in quella regione specifica.

Strategie di ottimizzazione a livello di applicazione

Oltre al routing a livello di infrastruttura, puoi implementare le seguenti strategie a livello di applicazione per ridurre la latenza nell'elaborazione delle richieste.

  1. Metodo proxy "Trampolino"

    Se devi mantenere un data center principale, utilizza server proxy leggeri regionali (trampolini) per gestire l'handshake iniziale.

    1. Google accede all'URL globale.

    2. Un proxy regionale (ad esempio, una funzione Nginx o Lambda leggera) riceve la richiesta.

    3. Il proxy inoltra il payload tramite la dorsale interna ad alta velocità al database primario.

    Vantaggio: questo riduce il tempo di "handshake TCP", che spesso è il principale fattore di latenza per le richieste a lunga distanza.

  2. Suggerimenti per la regione del token di accesso

    Durante la procedura di collegamento dell'account (OAuth), il tuo sistema può identificare la regione di residenza dell'utente.

    Implementazione: codifica un identificatore di regione nel access_token emesso a Google. Quando Google invia una richiesta di evasione, il gateway può ispezionare immediatamente il token e indirizzare la richiesta al cluster regionale corretto senza dover eseguire una ricerca nel database.

Integrità del sistema - Metriche partner-Google

Il mantenimento di una percentuale di successo >= 99, 5% contribuisce a garantire che gli stati dei dispositivi siano corretti in Google Home, che i dispositivi vengano aggiunti e rimossi, che le automazioni vengano attivate e che gli eventi della cronologia vengano visualizzati nella scheda Attività di Google Home app (GHA).

La percentuale di successo viene calcolata in base ai codici di risposta HTTP restituiti da Google quando il cloud esegue il push degli aggiornamenti di stato. Per garantire che i partner non vengano penalizzati per problemi di infrastruttura lato Google, la metrica esclude gli errori interni di Google dal conteggio degli errori. Le chiamate API incluse nel calcolo sono disponibili nel riferimento API HomeGraph.

Che cosa definisce un "successo"?

  • 2xx (Riuscito): l'aggiornamento dello stato è stato ricevuto ed elaborato correttamente da Home Graph.

Che cosa definisce un "errore"?

  • 4xx (errore partner): questi errori rappresentano errori e indicano un problema con la richiesta inviata dal tuo cloud. I codici più comuni includono:
    • 400 Richiesta non valida: il server non è riuscito a elaborare la richiesta a causa di una sintassi non valida. Le cause comuni includono JSON malformato o l'utilizzo di null anziché "" per un valore stringa.
    • 404 Not Found: la risorsa richiesta non è stata trovata. In genere, questo significa che Google non riesce a trovare il dispositivo richiesto. Potrebbe anche significare che l'account utente non è collegato o che è stato ricevuto un agentUserId non valido. Assicurati che agentUserId corrisponda al valore fornito nella risposta SYNC e che gestisci correttamente gli intent DISCONNECT.
    • 429 Risorsa esaurita: la tua integrazione ha superato la quota assegnata. Per istruzioni sulla gestione delle quote, consulta la sezione "Passaggio 1" nella parte superiore della dashboard.

Integrità del dispositivo - Accuratezza dello stato

Se un test soddisfa o supera il requisito Precisione stato >= 99,5%, gli utenti vedranno risultati corretti quando visualizzano gli stati dei dispositivi o utilizzano funzionalità di AI come Chiedi a Home. Se la precisione dello stato è bassa, le automazioni potrebbero non attivarsi e le voci della cronologia potrebbero non essere visualizzate nella scheda Attività di GHA al momento giusto. Per maggiori informazioni, consulta Stato report.

La dashboard della qualità monitora questo valore ogni ora utilizzando due metriche distinte: Accuratezza complessiva e Combinazione di tipo/caratteristica più bassa.

1. Componenti di precisione

La metrica è derivata da "campioni" in cui Google può verificare lo stato segnalato rispetto a un risultato di intent noto.

2. Metriche della dashboard (calcolo orario)

La dashboard calcola l'accuratezza in base a un intervallo di un'ora. Se un'ora ha meno di 100 campioni totali (S_Total < 100), l'accuratezza per quell'ora è impostata su N/A.

Visualizzazione 1: precisione complessiva (media globale)

Rappresenta l'accuratezza totale dell'integrazione in tutti i tipi di dispositivi e le caratteristiche combinate. Fornisce una media ponderata dell'integrità dell'intero ecosistema.

  • Calcolo: accuratezza totale dello stato su tutti i dispositivi / totale dello stato totale su tutti i dispositivi.

Visualizzazione 2: combinazione di tipo/tratto più bassa

Identifica la categoria specifica meno affidabile nell'integrazione. Impedisce ai dispositivi ad alto volume di alta qualità di nascondere i dispositivi a basso volume di bassa qualità. Ad esempio, se hai un volume elevato di luci con una precisione dello stato superiore al 99,5%, ma un volume basso di interruttori con una precisione dello stato bassa, questo evidenzia il miglioramento necessario per gli interruttori, che potrebbe non essere visibile in un valore medio.

  • Calcolo: minimo di Accuratezza stato / Totale stato per tutte le combinazioni di tratto/dispositivo.