Будьте в курсе последних новостей и функций Google Home. Зарегистрируйтесь ,Будьте в курсе последних новостей и функций Google Home. Зарегистрироваться

Мониторинг отключений для умного дома

1. Прежде чем начать

Как мы уже говорили в разделе «Отладка лаборатории кода умного дома », мы публикуем метрики и журналы для ваших проектов умного дома. Метрики помогут вам определить, где у вашего Smart Home Action возникают проблемы, а журналы полезны при глубоком погружении для решения этих проблем.

dd44868a4ff2df6e.png

Вы можете настроить оповещения, используя метрики, предоставленные вашему проекту, для автоматического отслеживания сбоев и получения уведомлений во время сбоев в обслуживании. Мы публикуем метрику достоверности, чтобы выделить сбои в вашем проекте, которые мы рассмотрим в этой кодовой лаборатории вместе со всеми другими инструментами оповещения, доступными вам на Google Cloud Platform.

Предпосылки

Что вы узнаете

  • Как отслеживать проблемы с производительностью и сбои в работе вашего проекта.
  • Как создать оповещение на основе порога и получать уведомления во время сбоев.
  • Как использовать показатель достоверности, предоставленный вашему проекту, для обнаружения сбоев.

2. Мониторинг производительности

Мониторинг производительности имеет решающее значение для успешной интеграции с экосистемой Google Smart Home. Мы предоставляем набор инструментов мониторинга для разработчиков умного дома на платформе Google Cloud . Вы можете использовать эти инструменты, чтобы получить представление о производительности вашего проекта.

Доступ к информационным панелям

Первым шагом для доступа к вашим данным является проверка информационных панелей Google Home. Для этого войдите в Google Cloud Console и перейдите в раздел «Операции» > «Мониторинг» > «Информационные панели» . Вы увидите, что доступно несколько панелей мониторинга, а панели управления для умного дома имеют префикс Google Home Analytics.

317697e52ced2437.png

Мы создали отдельные информационные панели для представления каждого типа интеграции. Облачные, локальные и материальные интеграции имеют свою собственную панель управления, а данные для протоколов потоковой передачи камеры предоставляются на панели управления качеством камеры. Эти дашборды будут содержать данные только в том случае, если у вас есть интеграция соответствующего типа, а также работающий проект, выполняющий запросы.

Когда вы откроете одну из этих панелей мониторинга, вы получите следующее представление:

f8bfd69286c569a4.png

Инструментальные панели содержат различные диаграммы, показывающие детали запросов, обработанных вашим проектом. На каждой панели интеграции вы увидите диаграмму, показывающую общее количество запросов, обработанных вашим проектом, диаграмму, показывающую уровень успеха для этого типа интеграции, и несколько диаграмм, показывающих типы устройств и задействованные характеристики.

Есть три диаграммы, которые имеют решающее значение для оценки эффективности действий вашего Умного дома:

f511fafd3aaaa1eb.png

Во время сбоев вы обычно видите нисходящий тренд в проценте успешных операций и восходящий тренд в диаграмме разбивки ошибок. Мониторинг процента успешного выполнения помогает заметить сбой, а просмотр основных ошибок в разбивке ошибок может помочь при отладке. Вы также можете наблюдать восходящий тренд задержки во время сбоев, что вы можете увидеть на диаграммах задержки запросов.

Обратите внимание, что представление по умолчанию с диаграммами, которые вы видите на информационных панелях Google Home Analytics, — это просто представление, которое мы создали для вашего проекта с использованием данных показателей умного дома. Вы также можете использовать Metrics Explorer для создания собственных диаграмм на основе тех же базовых показателей и сохранения их на настраиваемых информационных панелях.

Исследователь метрик

Metrics Explorer — это инструмент для визуализации поперечных сечений набора данных вашего проекта. Доступ к этому инструменту можно получить в Google Cloud Console , выбрав «Операции» > «Мониторинг» > «Обозреватель показателей» .

Google Cloud «из коробки» предоставляет множество различных метрик, в том числе и не связанных с «умным домом». Метрики, которые мы предоставляем для умного дома, перечислены в ресурсе «actions.googleapis.com/smarthome_action/…», и их можно легко найти, введя «smarthome» в поле выбора метрики.

538d851edfd34764.png

При поиске «умный дом» будут показаны все показатели умного дома, которые мы предоставляем для вашего проекта. Вы можете получить подробную информацию о каждой из наших метрик на странице мониторинга и ведения журнала нашей документации.

Когда дело доходит до мониторинга вашего проекта, простейшей метрикой, на которую можно сослаться, будет метрика количества запросов (которая является дельта-метрикой ). Эта метрика записывает запись для каждого запуска умного дома, инициированного вашими пользователями, и записывает такие поля, как тип устройства, характеристика, тип выполнения, связанный с выполнением, и поле состояния, которое показывает результат.

При выборе этой метрики появится экран, показывающий каждое ведро данных, подобное следующему:

b1c18141d15a0e09.png

По сути, для каждой комбинации меток данных, присутствующих в этой метрике, существует сегмент, в котором фиксируется изменение (дельта) между предыдущим и текущим временными интервалами. Можно сгруппировать или отфильтровать эти сегменты, чтобы получить желаемый фрагмент данных представления, который вам нужен. Кроме того, данные выравниваются по выбранным временным интервалам с помощью функции выравнивания (DELTA, MEAN, MEDIAN, SUM). Если не требуется иное, вы обычно используете дельта-выравнивание с дельта-метрикой.

Вы можете создать большинство диаграмм, доступных на информационных панелях Google Home Analytics, с помощью обозревателя показателей и сохранить свои диаграммы для последующего доступа на пользовательской информационной панели. Для получения более сложных представлений, таких как диаграмма отношений, вам потребуется использовать MQL — язык запросов для мониторинга.

3. Показатели успеха

Когда дело доходит до отслеживания успешности интеграции, вы можете использовать показатель успешности, который мы рассчитываем на основе метрики количества ваших запросов, в качестве базового индикатора или уверенность в успехе для более специализированного подхода.

Коэффициент успеха

Показатель успеха рассчитывается для всех ваших интеграций путем деления количества успешных запросов на все запросы. Вы можете получить к нему доступ из диаграммы «Показатель успешности выполнения» на панели инструментов Google Home Analytics.

55ea8930fbf48d9e.png

Диаграмма Fulfillment Success Rate очень полезна для отслеживания производительности вашего проекта, но не очень полезна при создании пользовательских информационных панелей или настройке предупреждений. Поскольку показатель успешности выводится из вашей метрики количества запросов, а не из метрики сам по себе, вам придется воссоздать ее с помощью MQL (Monitoring Query Language) в обозревателе метрик, чтобы использовать ее с любой функцией.

Кроме того, мы считаем, что для отслеживания сбоев производительности вашего проекта необходим гораздо более специализированный подход. Вот почему мы создали показатель достоверности, который меняется в зависимости от того, насколько ваш текущий показатель успешности выполнения отклоняется от исторических норм.

Метрика доверия

Отключения могут существовать в различных формах и размерах для проектов. Они могут длиться от нескольких часов до нескольких минут, что может затруднить их идентификацию. Для этого мы создали в вашем проекте метрику доверия, которая обеспечивает нормализованное значение для прогнозирования надежности на основе прошлой производительности. Вы можете получить доступ к метрике достоверности, выполнив поиск smarthome в проводнике метрик, а затем выбрав Уверенность в успехе выполнения .

ab467a1777281526.png

Когда ваша интеграция с умным домом работает на уровне или выше исторической производительности (в среднем за 7 дней), эта метрика выводит максимальное значение (1,0). Когда ваш процент успеха отклоняется более чем в 4 раза от стандартных отклонений (также рассчитывается за 7 дней), эта метрика выводит минимальное значение (0,0). Для случаев, когда стандартные отклонения слишком малы (менее 2,5%), эта метрика основывает значение 0,0 на 10% снижении процента успеха.

Для всех промежуточных случаев эта метрика предоставляет значения от 1,0 (полная уверенность в отсутствии сбоя) до 0,0 (максимальная уверенность в том, что сбой произошел).

Поэтому при настройке оповещения (рассматриваемом в следующем разделе) мы рекомендуем использовать значение 0,5 в качестве порогового значения. Это будет соответствовать 2 стандартным отклонениям или падению на 5%, в зависимости от того, что больше .

4. Настройка оповещений

Следующий шаг — использовать все, что вы узнали в предыдущем разделе, для настройки оповещений в вашем проекте.

Создание политики предупреждений

Автоматические оповещения в Google Cloud Platform настраиваются с помощью политик оповещений. Вы можете получить доступ к политикам предупреждений через боковое меню, Операции > Мониторинг > вкладка Предупреждения. Вы можете создать новую политику предупреждений, выбрав опцию +CREATE POLICY , которая приведет вас к экрану создания политики предупреждений:

6e417d88c2274b3d.png

Создание политики предупреждений состоит из трех частей. Сначала вам нужно определить, что вы хотите отслеживать, добавив условие. При нажатии кнопки ДОБАВИТЬ УСЛОВИЕ откроется окно, похожее на обозреватель метрик, с некоторыми дополнительными элементами управления для настройки условия:

df1ccf7da741e1c7.png

В качестве цели выберите показатель достоверности, который мы рассмотрели в предыдущем разделе. Убедитесь, что для выравнивателя установлено значение дельта, используя эту метрику ( Показать дополнительные параметры > Выравниватель ). Следующим шагом является настройка условия оповещения и использование следующих параметров:

4192e0f4ea00dd28.png

Условие срабатывает, если — это основная конфигурация, определяющая, когда запускать оповещения. Выбор «Любые нарушения временных рядов» будет работать, поскольку мы собираемся установить пороговое значение для нашей метрики и отслеживать, пересекается ли значение.

Условие — мы хотим, чтобы оповещение срабатывало, когда значение падает ниже порогового значения, поэтому мы установим его ниже . С нашей метрикой 1,0 означает, что интеграция работает нормально, а 0,0 указывает на определенный сбой.

Порог . Мы создали показатель достоверности, чтобы обеспечить наилучшие результаты, когда для этого значения установлено значение 0,5 . Если вы хотите получать более частые оповещения и получать уведомления о меньших инцидентах, вы можете попробовать увеличить это значение (максимум 1,0). Впоследствии, если вы хотите получать меньше предупреждений, только о более серьезных проблемах, вы можете попробовать уменьшить это значение (мин. 0,0).

Для — это параметр, определяющий, как долго должен длиться сбой, прежде чем вы получите предупреждение. Мы рекомендуем сохранить для этого параметра самое последнее значение , чтобы получать оповещения о любой точке, пересекающей порог. Наша метрика достоверности публикуется каждые 15 минут и показывает средний успех за этот период.

После завершения добавления условия следующим шагом будет выбор канала уведомлений. Самый простой способ оповещения — оповещения по электронной почте. Вы можете выбрать адрес электронной почты, указанный в раскрывающемся списке « Каналы уведомлений »:

3cc10629830e7f13.png

Если вы установите флажок Уведомлять о закрытии инцидента , после того, как инцидент будет помечен как закрытый, будет отправлено еще одно уведомление. В этом случае вам также следует выбрать продолжительность автозакрытия инцидента , которая по умолчанию составляет 7 дней.

Последним шагом является присвоение вашему предупреждению имени и добавление любой документации, которую вы хотите включить в уведомления.

686fb1c537fee10.png

Рекомендуется предоставить документацию, особенно если вы не тот, кто будет получать оповещение. Добавление шагов, например, где проверять во время инцидента и как сортировать и отлаживать, может помочь во время простоя. При необходимости вы можете обратиться к нашему Руководству по устранению неполадок .

После сохранения ваша политика предупреждений будет указана в разделе «Политики» на странице «Предупреждения».

c71a001e4df035ee.png

5. Снижение простоев

После того, как вы настроите оповещения, вы будете получать уведомления о сбоях по предоставленным вами каналам уведомлений, а также будет создана запись об инциденте на странице оповещений.

Получение предупреждений

Каналом оповещения, который мы предоставили в этой кодовой лаборатории, была электронная почта. Надеюсь, после того, как вы настроите, вы не будете получать никаких предупреждений (нет сбоев), но если вы это сделаете, уведомление будет выглядеть следующим образом:

43217b0a145c2cd.png

Обратите внимание, что предупреждающее уведомление действительно предоставляет наблюдаемое значение, пересекающее указанный вами порог, а также временную метку, указывающую, когда инцидент впервые начался.

Мониторинг инцидентов

По мере возникновения инцидентов они также будут учитываться в разделе инцидентов на странице предупреждений.

fdd883a9604ed981.png

Вы можете щелкнуть конкретный инцидент, чтобы просмотреть подробные сведения о сбое, например, как долго он длился или насколько серьезным он был.

Помните, что, когда вы получаете оповещения, лучший первый шаг — это взглянуть на ваши показатели, а затем найти ошибки, которые привели к сбою, в ваших журналах. Вы можете освежить в памяти, как это сделать, в нашей лаборатории кода «Отладка умного дома ».

6. Поздравления

17d485868a6771bc.png

Поздравляем! Вы успешно научились настраивать оповещения, используя метрики, предоставленные вашему проекту, для автоматического отслеживания сбоев и получения уведомлений во время сбоев в обслуживании.

Следующие шаги

Опираясь на эту лабораторию кода, попробуйте выполнить следующие упражнения и изучить дополнительные ресурсы:

  • Вы можете комбинировать то, что вы узнали в этой кодовой лаборатории, с другими показателями, предоставленными вашему проекту. Вы можете увидеть полный список доступных метрик в разделе «Поддерживаемые метрики» на странице « Мониторинг и ведение журнала ».
  • Изучите другие типы каналов уведомлений для предупреждений, которые описаны на странице « Параметры уведомлений » документации Google Cloud Platform.