Mantenha-se atualizado sobre as últimas notícias e recursos do Google Home. Inscreva-se ,Mantenha-se atualizado sobre as últimas notícias e recursos do Google Home. Inscrever-se

Monitoramento de interrupções para casa inteligente

1. Antes de começar

Como abordamos no codelab Depurando o codelab Smart Home , estamos publicando métricas e logs para seus projetos Smart Home. As métricas ajudam você a determinar onde sua Smart Home Action está tendo problemas, e os logs são úteis ao fazer um mergulho profundo para resolver esses problemas.

dd44868a4ff2df6e.png

Você pode configurar alertas usando as métricas fornecidas ao seu projeto para monitorar interrupções de maneira automatizada e receber notificações durante interrupções de serviço. Estamos publicando uma métrica de confiança para destacar as interrupções em seu projeto, que abordaremos neste codelab junto com todas as outras ferramentas de alerta disponíveis no Google Cloud Platform.

Pré-requisitos

O que você vai aprender

  • Como monitorar problemas de desempenho e interrupções de serviço em seu projeto.
  • Como criar um alerta baseado em limite e receber notificações durante interrupções.
  • Como utilizar a métrica de confiança fornecida ao seu projeto para detectar interrupções.

2. Monitoramento do Desempenho

O monitoramento do desempenho é fundamental para uma integração bem-sucedida com o Google Smart Home Ecosystem. Estamos fornecendo um conjunto de ferramentas de monitoramento para desenvolvedores de casas inteligentes no Google Cloud Platform . Você pode usar essas ferramentas para ter uma noção do desempenho do seu projeto.

Acessando painéis

A primeira etapa para acessar seus dados é verificar os painéis da Página inicial do Google, fazendo login no Google Cloud Console e navegando até Operations > Monitoring > Dashboards . Você verá que há vários painéis disponíveis e os painéis para casa inteligente vêm com um prefixo do Google Home Analytics.

317697e52ced2437.png

Criamos painéis individuais para representar cada tipo de integração. As integrações em nuvem, local e matéria têm seu próprio painel e os dados para protocolos de streaming de câmera são fornecidos no painel Qualidade da câmera. Esses painéis só conterão dados se você tiver uma integração do tipo correspondente, juntamente com um projeto em funcionamento atendendo às solicitações.

Ao abrir um desses painéis, a visualização que você obtém terá a seguinte aparência:

f8bfd69286c569a4.png

Os painéis contêm vários gráficos que mostram os detalhes das solicitações tratadas pelo seu projeto. Com cada painel de integração, você verá um gráfico mostrando o número total de solicitações tratadas pelo seu projeto, um gráfico mostrando a taxa de sucesso para esse tipo de integração e vários gráficos mostrando os tipos de dispositivos e características envolvidas.

Existem três gráficos que são essenciais para avaliar o desempenho de suas ações de Smart Home:

f511fafd3aaaa1eb.png

Durante as interrupções, você geralmente verá tendências de baixa na porcentagem de sucesso e uma tendência de alta no gráfico de detalhamento de erros. Monitorar a porcentagem de sucesso da execução ajuda a perceber a interrupção, enquanto examinar os principais erros na divisão de erros pode ajudar na depuração. Você também pode observar uma tendência de alta na latência durante interrupções, que você pode ver nos gráficos de latência de solicitação.

Observe que a visualização padrão com gráficos que você vê nos painéis do Google Home Analytics é apenas uma visualização que criamos para seu projeto usando dados de métricas de casa inteligente. Você também pode usar o Metrics Explorer para criar seus próprios gráficos a partir das mesmas métricas subjacentes e salvá-los em seus painéis personalizados.

Explorador de métricas

O Metrics Explorer é uma ferramenta para visualizar seções transversais do conjunto de dados do seu projeto. A ferramenta pode ser acessada no Console do Google Cloud navegando até Operations > Monitoring > Metrics Explorer .

O Google Cloud fornece muitas métricas diferentes prontas para uso, incluindo algumas não relacionadas à casa inteligente. As métricas que fornecemos para casa inteligente estão listadas no recurso "actions.googleapis.com/smarthome_action/..." e podem ser facilmente pesquisadas digitando "smarthome" na caixa de seleção de métrica.

538d851edfd34764.png

A pesquisa por "smarthome" exibirá todas as métricas de casa inteligente que fornecemos ao seu projeto. Você pode obter informações detalhadas sobre cada uma de nossas métricas na página de monitoramento e registro de nossa documentação.

Quando se trata de monitorar seu projeto, a métrica mais simples de se referir seria a métrica de contagem de solicitações (que é uma métrica delta ). Essa métrica registra uma entrada para cada execução de casa inteligente iniciada por seus usuários e registra campos como tipo de dispositivo, característica, tipo de execução envolvido com a execução e o campo de status que mostra o resultado.

A seleção dessa métrica produzirá uma tela mostrando cada bucket de dados semelhante ao seguinte:

b1c18141d15a0e09.png

Essencialmente, para cada combinação de rótulos de dados presentes nesta métrica existe um bucket que registra a mudança (delta) entre os intervalos de tempo anterior e atual. É possível agrupar ou filtrar esses buckets para obter uma fatia de dados de visualização desejada. Além disso, os dados são alinhados em intervalos de tempo selecionados com uma função de alinhamento (DELTA, MEAN, MEDIAN, SUM). A menos que seja necessário, você normalmente usará o alinhamento Delta com uma métrica delta.

Você pode criar a maioria dos gráficos disponíveis nos painéis do Google Home Analytics usando o Metrics Explorer e salvar seus gráficos para acesso posterior em um painel personalizado. Para obter visualizações mais complexas, como um gráfico de proporção, você precisará usar o MQL - Monitoring Query Language.

3. Métricas de sucesso

Quando se trata de acompanhar o sucesso da integração, você pode usar a taxa de sucesso que calculamos a partir da métrica de contagem de solicitações como um indicador de linha de base ou a confiança de sucesso para uma abordagem mais especializada.

Taxa de sucesso

A taxa de sucesso é calculada para todas as suas integrações dividindo o número de solicitações bem-sucedidas por todas as solicitações. Você pode acessá-lo a partir do gráfico Taxa de sucesso de cumprimento em seu painel do Google Home Analytics.

55ea8930fbf48d9e.png

O gráfico Fulfillment Success Rate é muito útil para monitorar o desempenho do seu projeto, mas não tanto ao criar seus painéis personalizados ou configurar alertas. Como a taxa de sucesso é derivada de sua métrica de contagem de solicitações e não de uma métrica em si, você terá que recriá-la usando MQL (Linguagem de consulta de monitoramento) no Metrics Explorer para usá-la com qualquer um dos recursos.

Além disso, para rastrear as interrupções de desempenho em seu projeto, achamos que é necessária uma abordagem muito mais especializada. É por isso que criamos a métrica de confiança que muda com base em quanto sua taxa de sucesso de atendimento atual se desvia das normas históricas.

Métrica de Confiança

As interrupções podem existir em diferentes formas e tamanhos para projetos. Eles podem durar de várias horas a apenas alguns minutos, o que pode tornar a identificação deles um desafio. Para isso, criamos uma Métrica de Confiança em seu projeto, que fornece um valor normalizado para prever a confiabilidade com base no desempenho passado. Você pode acessar a métrica de confiança pesquisando por smarthome no gerenciador de métricas e selecionando a confiança de sucesso da execução .

ab467a1777281526.png

Quando sua integração de casa inteligente tiver desempenho igual ou superior ao histórico (média de 7 dias), essa métrica produzirá o valor máximo (1,0). Quando sua porcentagem de sucesso se desvia em mais de um fator de 4 desvios padrão (também calculados em 7 dias), essa métrica gera o valor mínimo (0,0). Para casos em que os desvios padrão são muito pequenos (menos de 2,5%), essa métrica baseia o valor de 0,0 em uma queda de 10% na porcentagem de sucesso.

Para todos os casos intermediários, essa métrica fornece valores entre 1,0 (perfeitamente confiante de que não há interrupção) e 0,0 (confiança máxima de que há uma interrupção).

Portanto, ao definir um alerta (que será apresentado na próxima seção), recomendamos basear o valor de 0,5 como limite. Isso corresponderá a 2 desvios padrão ou a uma queda de 5%, o que for maior .

4. Configurando Alertas

O próximo passo é usar tudo o que você aprendeu na seção anterior para configurar alertas em seu projeto.

Criando uma política de alertas

Os alertas automatizados no Google Cloud Platform são definidos por meio de Políticas de alertas. Você pode acessar as Políticas de Alerta através do menu lateral, Operações > Monitoramento > guia Alerta . Você pode criar uma nova política de alertas selecionando a opção +CREATE POLICY , que o levará à tela de criação da política de alertas:

6e417d88c2274b3d.png

Há três partes para criar uma política de alertas. Primeiro, você precisa determinar o que deseja rastrear adicionando uma condição. Pressionar o botão ADICIONAR CONDIÇÃO abrirá uma janela semelhante ao Metrics Explorer, com alguns controles adicionais para configurar a condição:

df1ccf7da741e1c7.png

Para o destino, selecione a métrica de confiança que abordamos na seção anterior. Certifique-se de que o alinhador esteja definido como delta usando esta métrica ( Mostrar opções avançadas > Alinhador ). A próxima etapa é configurar a condição de alerta e usar as seguintes configurações:

4192e0f4ea00dd28.png

A condição aciona se - Esta é a configuração principal para determinar quando acionar os alertas. A seleção de Qualquer violação de série temporal funcionará, pois definiremos um limite em nossa métrica e monitoraremos se o valor for ultrapassado.

Condição - Queremos que o alerta seja acionado quando o valor cair abaixo do limite, portanto, definiremos isso como abaixo de . Com nossa métrica, 1,0 significa que a integração está funcionando bem e 0,0 indica uma interrupção definitiva.

Limiar - Criamos a métrica de confiança para fornecer melhores resultados quando esse valor é definido como 0,5 . Se você deseja ter alertas mais frequentes e ser notificado de incidentes menores, tente aumentar esse valor (máximo de 1,0). Posteriormente, se você quiser ser menos alertado, apenas para problemas mais graves, tente diminuir esse valor (mínimo 0,0).

Para - Esta é a configuração para identificar quanto tempo a interrupção deve durar antes de você ser alertado. Recomendamos manter essa configuração no valor mais recente para ser alertado sobre qualquer ponto que ultrapasse o limite. Nossa métrica de confiança é publicada a cada 15 minutos, analisando a média de sucesso nesse período.

Depois de concluir a adição de uma condição, a próxima etapa é selecionar o canal de notificação. O método mais simples de notificação são os alertas por e-mail. Você pode escolher um e-mail listado no menu suspenso Canais de notificação :

3cc10629830e7f13.png

Se você marcar a opção Notificar no encerramento do incidente , outra notificação será enviada assim que o incidente for marcado como encerrado. Nesse caso, você também deve selecionar uma duração de fechamento automático de incidente , que é especificada como 7 dias por padrão.

A etapa final é dar um nome ao seu alerta e adicionar qualquer documentação que você queira incluir nas notificações.

686fb1c537fee10.png

É recomendável fornecer documentação, especialmente se você não for o destinatário do alerta. Adicionar etapas como onde verificar durante um incidente e como fazer a triagem e depuração pode ajudar durante uma interrupção. Você pode consultar nosso Guia de solução de problemas conforme necessário.

Depois de salva, sua política de alertas será listada na seção Políticas na página Alertas.

c71a001e4df035ee.png

5. Mitigação de interrupções

Depois de configurar os alertas, você será notificado durante as interrupções dos canais de notificação que forneceu, bem como uma entrada de incidente será criada na página Alerta.

Recebendo Alertas

O canal de alerta que fornecemos neste codelab foi um e-mail. Depois de definir, esperamos que você não receba nenhum alerta (não tenha interrupções), mas se você fizer isso, a notificação será semelhante à seguinte:

43217b0a145c2cd.png

Observe que a notificação de alerta fornece o valor observado que ultrapassa o limite especificado, bem como um carimbo de data/hora descrevendo quando o incidente foi iniciado pela primeira vez.

Monitoramento de incidentes

À medida que os incidentes acontecem, eles também serão contados na seção de incidentes na página Alerta.

fdd883a9604ed981.png

Você pode clicar no incidente específico para ver os detalhes sobre a interrupção, como quanto tempo durou ou quão grave foi.

Lembre-se, à medida que você recebe alertas, o melhor primeiro passo é dar uma olhada em suas métricas e, em seguida, pesquisar os erros que contribuem para sua interrupção em seus logs. Você pode se atualizar sobre como fazer isso em nosso codelab Depurando a casa inteligente.

6. Parabéns

17d485868a6771bc.png

Parabéns! Você aprendeu com sucesso como configurar alertas usando as métricas fornecidas ao seu projeto para monitorar interrupções de maneira automatizada e receber notificações durante interrupções de serviço.

Próximos passos

Com base neste Codelab, experimente os seguintes exercícios e explore recursos adicionais:

  • Você pode combinar o que aprendeu neste codelab com outras métricas fornecidas ao seu projeto. Você pode ver a lista completa de métricas disponíveis na seção Métricas com suporte da página Monitoramento e registro .
  • Explore outros tipos de canais de notificação para alertas que são explicados na página Opções de notificação da documentação do Google Cloud Platform.