Supervisión de interrupciones en casas inteligentes

1. Antes de comenzar

Como se explicó en el codelab Cómo depurar una casa inteligente, publicamos métricas y registros en tus proyectos de casa inteligente. Las métricas te ayudan a determinar dónde tienes problemas con tus acciones de casa inteligente, y los registros resultan útiles cuando realizas análisis detallados para resolverlos.

dd44868a4ff2df6e.png

Puedes configurar alertas con las métricas proporcionadas a tu proyecto para supervisar las interrupciones de forma automática y recibir notificaciones durante las interrupciones del servicio. Publicamos una métrica de confianza para destacar las interrupciones de tu proyecto. Las analizaremos en este codelab junto con todas las demás herramientas de alertas disponibles en Google Cloud Platform.

Requisitos previos

Qué aprenderás

  • Cómo supervisar los problemas de rendimiento y las interrupciones del servicio en tu proyecto
  • Cómo crear una alerta basada en umbrales y recibir notificaciones durante las interrupciones
  • Cómo utilizar la métrica de confianza proporcionada a tu proyecto para detectar interrupciones

2. Supervisión del rendimiento

La supervisión del rendimiento es fundamental para lograr una integración exitosa con el ecosistema de casa inteligente de Google. Ofrecemos un conjunto de herramientas de supervisión a los desarrolladores de casas inteligentes en Google Cloud Platform. Puedes usar estas herramientas para tener una idea del rendimiento de tu proyecto.

Accede a los paneles

El primer paso para acceder a tus datos es revisar los paneles de Google Home. Para ello, accede a la consola de Google Cloud y navega a Operaciones > Monitoring > Paneles. Verás que hay varios paneles disponibles y que los de la casa inteligente vienen con el prefijo de las estadísticas de Google Home.

317697e52ced2437.png

Creamos paneles individuales para representar cada tipo de integración. Las integraciones en la nube, Local y Matter tienen su propio panel, y los datos para los protocolos de transmisión de cámara se proporcionan en el panel de calidad de la cámara. Estos paneles solo contendrán datos si tienes una integración del tipo correspondiente, junto con un proyecto en funcionamiento que cumpla con las solicitudes.

Cuando abras uno de estos paneles, la vista que obtengas se verá de la siguiente manera:

f8bfd69286c569a4.png

Los paneles contienen varios gráficos que muestran los detalles de las solicitudes que maneja tu proyecto. Con cada panel de integración, verás un gráfico que muestra la cantidad total de solicitudes que maneja tu proyecto, un gráfico que muestra la tasa de éxito para ese tipo de integración y varios gráficos que muestran los tipos y las características de dispositivos involucrados.

Hay tres gráficos que son fundamentales para evaluar el rendimiento de tus acciones de casa inteligente:

f511fafd3aaaa1eb.png

Durante las interrupciones, por lo general, verás tendencias a la baja en el porcentaje de éxito y una tendencia al alza en el gráfico de desglose de errores. Supervisar el porcentaje de éxito de la ejecución ayuda a notar la interrupción, mientras que echar un vistazo a los errores principales en el desglose de errores puede ayudar con la depuración. También es posible que observes una tendencia al aumento en la latencia durante las interrupciones, que se puede ver en los gráficos de latencia de las solicitudes.

Ten en cuenta que la vista predeterminada con gráficos que ves en los paneles de Google Home Analytics es solo una vista que creamos para tu proyecto con los datos de métricas de casa inteligente. También puedes usar el Explorador de métricas para crear tus propios gráficos a partir de las mismas métricas subyacentes y guardarlos en tus paneles personalizados.

Explorador de métricas

El Explorador de métricas es una herramienta que permite visualizar secciones transversales del conjunto de datos de tu proyecto. Se puede acceder a la herramienta en la consola de Google Cloud navegando a Operaciones > Monitoring > Explorador de métricas.

Google Cloud proporciona muchas métricas diferentes desde el primer momento, incluidas algunas no relacionadas con la casa inteligente. Las métricas que proporcionamos para la casa inteligente se enumeran en el recurso "actions.googleapis.com/smarthome_action/..." y se pueden buscar fácilmente escribiendo "casa inteligente" en el cuadro de selección de métricas.

538d851edfd34764.png

Si buscas “casa inteligente”, aparecerán todas las métricas de casa inteligente que proporcionamos para tu proyecto. Puedes obtener información detallada sobre cada una de nuestras métricas en las páginas de Monitoring y Logging de nuestra documentación.

Cuando se trata de supervisar tu proyecto, la métrica más simple para consultar es la métrica Recuento de solicitudes (que es una métrica delta). Esta métrica registra una entrada para cada ejecución de casa inteligente que inician tus usuarios y registra campos como el tipo de dispositivo, la característica, el tipo de ejecución relacionado con la ejecución y el campo de estado que muestra el resultado.

Si seleccionas esta métrica, se mostrará una pantalla en la que se mostrará cada bucket de datos similar al siguiente:

b1c18141d15a0e09.png

Básicamente, para cada combinación de etiquetas de datos presentes en esta métrica, existe un bucket que registra el cambio (delta) entre los intervalos de tiempo anterior y actual. Es posible agrupar o filtrar estos buckets para obtener la porción de datos de vista que desees. Además, los datos se alinean en intervalos de tiempo seleccionados con una función de alineación (DELTA, MEAN, MEDIAN, SUM). A menos que sea necesario, por lo general, usarás la alineación delta con una métrica delta.

Puedes usar el Explorador de métricas para crear la mayoría de los gráficos disponibles en los paneles de Analytics de Google Home y guardarlos para acceder a ellos más tarde en un panel personalizado. Para obtener vistas más complejas, como un gráfico de proporción, deberás usar MQL, lenguaje de consulta de Monitoring.

3. Índices de éxito

Cuando se trata del seguimiento del éxito de tu integración, puedes usar la tasa de éxito que calculamos a partir de la métrica de recuento de solicitudes como indicador de referencia, o la confianza del éxito para un enfoque más especializado.

Tasa de éxito

Para calcular la tasa de éxito de todas tus integraciones, se divide la cantidad de solicitudes exitosas entre todas las solicitudes. Puedes acceder a ella desde el gráfico de Tasa de éxito de entrega en el panel de Analytics de Google Home.

55ea8930fbf48d9e.png

El gráfico de tasa de éxito de entrega es muy útil para supervisar el rendimiento de tu proyecto, pero no tanto cuando creas tus paneles personalizados o configuras alertas. Dado que la tasa de éxito se deriva de tu métrica de recuento de solicitudes, y no de una métrica en sí, tendrás que volver a crearla con MQL (lenguaje de consulta de Monitoring) en el Explorador de métricas para usarla con cualquiera de las funciones.

Además, para realizar un seguimiento de las interrupciones del rendimiento de tu proyecto, creemos que se necesita un enfoque mucho más especializado. Por eso creamos la métrica de confianza que cambia en función de cuánto se desvía tu tasa de éxito de las entregas actual de las normas históricas.

Métrica de confianza

Las interrupciones pueden presentarse en diferentes formas y tamaños para los proyectos. Pueden durar desde varias horas hasta solo unos minutos, lo que puede hacer que identificarlos sea un desafío. Para ello, creamos una métrica de confianza en tu proyecto, que proporciona un valor normalizado para predecir la confiabilidad en función del rendimiento pasado. Para acceder a la métrica de confianza, busca la casa inteligente en el Explorador de métricas y, luego, selecciona Confianza en el éxito de la ejecución.

ab467a1777281526.png

Cuando la integración de tu casa inteligente tenga un rendimiento igual o superior al historial de rendimiento (promedio de 7 días), esta métrica mostrará el valor máximo (1.0). Cuando su porcentaje de éxito se desvía en más de un factor de 4 desviaciones estándar (que también se calculan durante 7 días), esta métrica genera el valor mínimo (0.0). En los casos en los que las desviaciones estándar son demasiado pequeñas (menos del 2.5%), esta métrica basa el valor 0.0 en una caída del 10% en el porcentaje de éxito.

Para todos los casos intermedios, esta métrica proporciona valores entre 1.0 (confianza absoluta de que no hay interrupción) y 0.0 (confianza máxima de que existe una interrupción).

Por lo tanto, cuando configures una alerta (que aparecerá en la siguiente sección), te recomendamos que bases un valor de 0.5 como un umbral. Esto corresponderá a 2 desviaciones estándar o una disminución del 5%, lo que sea mayor.

4. Configuración de alertas

El siguiente paso es usar todo lo que aprendiste en la sección anterior para configurar alertas en tu proyecto.

Crea una política de alertas

Las alertas automatizadas de Google Cloud Platform se configuran a través de políticas de alertas. Puedes acceder a las políticas de alertas a través del menú lateral, Operaciones > Monitoring > Alertas. Para crear una política de alertas nueva, selecciona la opción +CREAR POLÍTICA, que te llevará a la pantalla de creación de políticas de alertas:

6e417d88c2274b3d.png

La creación de una política de alertas consta de tres partes. Primero, debes determinar de qué quieres hacer un seguimiento agregando una condición. Si presionas el botón AGREGAR CONDICIÓN, aparecerá una ventana similar al Explorador de métricas, con algunos controles adicionales para configurar la condición:

df1ccf7da741e1c7.png

Para el objetivo, selecciona la métrica de confianza que explicamos en la sección anterior. Asegúrate de que el alineador esté configurado en delta con esta métrica (Mostrar opciones avanzadas > Alineador). El siguiente paso es configurar la condición de alerta y usar la siguiente configuración:

4192e0f4ea00dd28.png

La condición se activa si: Esta es la configuración principal para determinar cuándo activar las alertas. La opción Cualquier serie temporal es una infracción para funcionar, ya que vamos a establecer un umbral en nuestra métrica y supervisar si se supera el valor.

Condición: Queremos que la alerta se active cuando el valor descienda por debajo del umbral, por lo que configuraremos esto como es inferior. Con nuestra métrica, 1.0 significa que la integración funciona bien y 0.0 indica una interrupción definitiva.

Umbral: Creamos la métrica de confianza para proporcionar los mejores resultados cuando este valor se establece en 0.5. Si deseas tener alertas más frecuentes y recibir notificaciones sobre incidentes menores, puedes aumentar este valor (máx. 1.0). Luego, si quieres recibir menos alertas, solo para problemas más graves, puedes intentar disminuir este valor (mínimo 0.0).

Durante: Este es el parámetro de configuración que permite identificar cuánto tiempo debe durar la interrupción antes de que recibas una alerta. Te recomendamos mantener esta configuración en el valor más reciente para recibir alertas sobre cualquier punto que cruce el umbral. Nuestra métrica de confianza se publica cada 15 minutos y analiza el éxito promedio en ese período.

Una vez que termines de agregar una condición, el siguiente paso es seleccionar el canal de notificaciones. El método más simple de notificación son las alertas por correo electrónico. Puedes elegir un correo electrónico que aparezca en el menú desplegable Canales de notificaciones:

3cc10629830e7f13.png

Si marcas la opción Notificar cuando se cierre un incidente, se enviará otra notificación una vez que el incidente se marque como cerrado. En ese caso, también debes seleccionar una Duración del cierre automático de incidentes, que se especifica en 7 días de forma predeterminada.

El último paso es darle un nombre a tu alerta y agregar la documentación que desees incluir en las notificaciones.

686fb1c537fee10.png

Se recomienda proporcionar documentación, especialmente si no eres tú quien recibirá la alerta. Agregar pasos como dónde verificar durante un incidente y cómo clasificar y depurar puede ayudar durante una interrupción puede ayudar. Puedes consultar nuestra guía de solución de problemas según sea necesario.

Una vez guardada, tu política de alertas aparecerá en la sección Políticas de la página Alertas.

c71a001e4df035ee.png

5. Mitigar las interrupciones

Una vez que configures alertas, recibirás una notificación durante las interrupciones de los canales de notificación que proporcionaste y se creará una entrada de incidente en la página Alertas.

Recibir alertas

El canal de alertas que proporcionamos en este codelab fue un correo electrónico. Una vez que lo hagas, esperamos que no recibas ninguna alerta (no habrá interrupciones), pero si lo haces, la notificación se verá de la siguiente manera:

43217b0a145c2cd.png

Ten en cuenta que la notificación de alerta proporciona el valor observado que cruza el umbral que especificaste, así como una marca de tiempo que indica cuándo comenzó el incidente por primera vez.

Incidentes de supervisión

A medida que ocurren incidentes, también se cuentan en la sección de incidentes de la página Alertas.

fdd883a9604ed981.png

Puedes hacer clic en el incidente específico para ver los detalles de la interrupción, como la duración o la gravedad.

Recuerda que, cuando recibes alertas, el mejor primer paso es revisar tus métricas y, luego, buscar en tus registros los errores que contribuyen a la interrupción. Puedes repasar la forma de hacerlo en nuestro codelab Cómo depurar una casa inteligente.

6. Felicitaciones

17d485868a6771bc.png

¡Felicitaciones! Aprendiste a configurar alertas mediante las métricas proporcionadas a tu proyecto para supervisar las interrupciones de forma automatizada y recibir notificaciones durante las interrupciones del servicio.

Próximos pasos

A partir de este Codelab, prueba los siguientes ejercicios y explora recursos adicionales:

  • Puedes combinar lo que aprendiste en este codelab con otras métricas proporcionadas a tu proyecto. Puedes ver la lista completa de métricas disponibles en la sección Métricas admitidas de la página Monitoring.
  • Explora otros tipos de canales de notificaciones para las alertas que se explican en la página Opciones de notificación de la documentación de Google Cloud Platform.