Pemantauan Gangguan untuk Smart Home

Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

1. Sebelum memulai

Seperti yang telah dibahas dalam codelab Men-debug Smart Home, kami memublikasikan metrik dan log ke project Smart Home Anda. Metrik membantu Anda menentukan tempat Action Smart Home Anda mengalami masalah, dan log berguna saat melakukan pembahasan mendalam untuk mengatasi masalah tersebut.

dd44868a4ff2df6e.png

Anda dapat menyiapkan notifikasi menggunakan metrik yang disediakan untuk project Anda guna memantau penonaktifan secara otomatis dan menerima notifikasi selama gangguan layanan. Kami memublikasikan metrik keyakinan untuk menyoroti gangguan pada project Anda, yang akan kita bahas di codelab ini bersama semua alat pemberitahuan lainnya yang tersedia untuk Anda di Google Cloud Platform.

Prasyarat

Yang akan Anda pelajari

  • Cara memantau masalah performa dan gangguan layanan di project Anda.
  • Cara membuat pemberitahuan berbasis nilai minimum dan menerima notifikasi selama gangguan.
  • Cara menggunakan metrik keyakinan yang disediakan pada project Anda untuk mendeteksi gangguan.

2. Memantau Kinerja

Memantau performa sangat penting agar integrasi berhasil dengan Ekosistem Google Smart Home. Kami menyediakan serangkaian alat pemantauan untuk developer smart home di Google Cloud Platform. Anda dapat menggunakan alat ini untuk memahami performa project Anda.

Mengakses Dasbor

Langkah pertama untuk mengakses data Anda adalah memeriksa dasbor Google Home, dengan login ke Google Cloud Console dan membuka Operasi > Pemantauan > Dasbor. Anda akan melihat sejumlah dasbor yang tersedia, dan dasbor untuk smart home dilengkapi dengan awalan Google Home Analytics.

317697e52ced2437.png

Kami membuat dasbor individual untuk mewakili setiap jenis integrasi. Integrasi Cloud, Lokal, dan Materi memiliki dasbornya sendiri dan data untuk protokol streaming kamera disediakan di dasbor Kualitas Kamera. Dasbor ini hanya akan berisi data jika Anda memiliki integrasi dari jenis yang sesuai, beserta project yang memenuhi permintaan.

Saat Anda membuka salah satu dasbor ini, tampilan yang Anda dapatkan akan terlihat seperti berikut:

f8bfd69286c569a4.png

Dasbor berisi berbagai diagram yang menampilkan detail permintaan yang ditangani oleh project Anda. Dengan setiap dasbor integrasi, Anda akan melihat diagram yang menunjukkan jumlah total permintaan yang ditangani oleh project Anda, diagram yang menunjukkan tingkat keberhasilan untuk jenis integrasi tersebut, dan beberapa diagram yang menunjukkan jenis dan karakteristik perangkat yang terlibat.

Ada tiga diagram yang sangat penting untuk menilai performa tindakan Smart Home Anda:

f511fafd3aaaaeb1.png

Selama gangguan, Anda biasanya akan melihat tren penurunan dalam persentase keberhasilan dan tren naik dalam diagram perincian error. Memantau persentase keberhasilan eksekusi membantu melihat gangguan, sementara melihat error teratas dalam perincian error dapat membantu proses debug. Anda mungkin juga mengamati peningkatan tren latensi selama gangguan, yang dapat Anda lihat di diagram latensi permintaan.

Perlu diperhatikan bahwa tampilan default dengan diagram yang Anda lihat di dasbor Analytics Google Home hanyalah tampilan yang kami buat untuk project Anda menggunakan data metrik smart home. Anda juga dapat menggunakan Metrics Explorer untuk membuat diagram sendiri dari metrik pokok yang sama dan menyimpannya di dasbor kustom.

Penjelajah Metrik

Metrics Explorer adalah alat untuk memvisualisasikan bagian lintas set data project Anda. Alat ini dapat diakses di Google Cloud Console dengan membuka Operations > Monitoring > Metrics Explorer.

Google Cloud menyediakan berbagai metrik siap pakai, termasuk beberapa yang tidak terkait dengan smart home. Metrik yang kami berikan untuk smart home tercantum di bagian "actions.googleapis.com/smarthome_action/..." resource, dan dapat dengan mudah ditelusuri dengan mengetik "smarthome" di kotak pemilihan metrik.

538d851edfd34764.png

Mencari "smarthome" akan memunculkan semua metrik smart home yang kami berikan ke project Anda. Anda dapat memperoleh informasi mendetail tentang setiap metrik di halaman pemantauan dan logging dalam dokumentasi kami.

Dalam hal pemantauan project, metrik yang paling sederhana untuk dirujuk adalah metrik Jumlah permintaan (yang merupakan metrik delta). Metrik ini mencatat entri untuk setiap eksekusi smart home yang dimulai oleh pengguna Anda dan mencatat kolom seperti jenis perangkat, karakteristik, jenis eksekusi yang terkait dengan eksekusi, dan kolom status yang menampilkan hasilnya.

Memilih metrik ini akan memunculkan layar yang menampilkan setiap bucket data yang mirip dengan berikut ini:

b1c18141d15a0e09.png

Pada dasarnya, untuk setiap kombinasi label data yang ada di metrik ini, akan ada bucket yang mencatat perubahan (delta) antara interval waktu sebelumnya dan saat ini. Anda dapat mengelompokkan, atau memfilter bucket ini untuk mendapatkan bagian data tampilan yang diinginkan. Selain itu, data diselaraskan ke dalam interval waktu yang dipilih dengan fungsi penyelarasan (DELTA, MEAN, MEDIAN, SUM). Kecuali jika diperlukan, Anda biasanya akan menggunakan penyelarasan Delta dengan metrik delta.

Anda dapat membuat sebagian besar diagram yang tersedia di dasbor Analytics Google Home menggunakan Metrics Explorer dan menyimpan diagram untuk diakses nanti di dasbor kustom. Untuk mendapatkan tampilan yang lebih kompleks, seperti diagram rasio, Anda harus menggunakan MQL - Monitoring Query Language.

3. Metrik Keberhasilan

Dalam hal keberhasilan pelacakan integrasi, Anda dapat menggunakan tingkat keberhasilan yang kami hitung dari metrik jumlah permintaan sebagai indikator dasar, atau keyakinan keberhasilan untuk pendekatan yang lebih khusus.

Tingkat Kesuksesan

Tingkat keberhasilan dihitung untuk semua integrasi Anda dengan membagi jumlah permintaan yang berhasil dengan semua permintaan. Anda dapat mengaksesnya dari diagram Tingkat Kesuksesan Pemenuhan di Dasbor Analytics Google Home Anda.

55ea8930fbf48d9e.png

Diagram Tingkat Keberhasilan Berhasil sangat berguna untuk memantau performa project Anda, tetapi tidak terlalu signifikan saat membuat dasbor kustom atau menyiapkan pemberitahuan. Karena tingkat keberhasilan berasal dari metrik jumlah permintaan Anda, dan bukan metrik itu sendiri, Anda harus membuat ulang metrik tersebut menggunakan MQL (Monitoring Query Language) di Metrics Explorer agar dapat menggunakannya dengan kedua fitur tersebut.

Selain itu, untuk melacak gangguan performa pada project, kami merasa diperlukan pendekatan yang lebih khusus. Itulah sebabnya kami membuat metrik keyakinan yang berubah berdasarkan seberapa besar tingkat keberhasilan pemenuhan Anda saat ini menyimpang dari standar historis.

Metrik Keyakinan

Gangguan dapat terjadi dalam berbagai bentuk dan ukuran untuk project. Pengujian ini dapat berlangsung beberapa jam hingga hanya beberapa menit, yang dapat membuat identifikasinya menjadi tantangan. Untuk itu, kami telah membuat Metrik Keyakinan dalam project Anda, yang memberikan nilai yang dinormalkan untuk memprediksi keandalan berdasarkan performa sebelumnya. Anda dapat mengakses metrik keyakinan dengan menelusuri smarthome di explorer metrik, lalu memilih Keyakinan keberhasilan eksekusi.

ab467a1777281526.png

Saat integrasi smart home Anda berperforma pada atau di atas performa historis (rata-rata 7 hari), metrik ini akan menghasilkan nilai maksimum (1.0). Saat persentase keberhasilan Anda menyimpang lebih dari faktor 4 deviasi standar (juga dihitung dalam 7 hari), metrik ini menghasilkan nilai minimum (0,0). Untuk kasus di mana deviasi standar terlalu kecil (kurang dari 2,5%), metrik ini didasarkan pada nilai 0,0 pada penurunan 10% pada persentase keberhasilan.

Untuk semua kasus di antaranya, metrik ini memberikan nilai antara 1,0 (sangat yakin bahwa tidak ada gangguan) dan 0,0 (yakin maksimum bahwa ada gangguan).

Oleh karena itu, saat menyetel pemberitahuan (akan dibahas pada bagian berikutnya), sebaiknya gunakan nilai 0,5 sebagai nilai minimum. Ini akan sesuai dengan 2 deviasi standar, atau penurunan 5%, mana saja yang lebih tinggi.

4. Menyiapkan Peringatan

Langkah berikutnya adalah menggunakan semua yang telah Anda pelajari di bagian sebelumnya untuk menyiapkan pemberitahuan di project Anda.

Membuat Kebijakan Pemberitahuan

Pemberitahuan otomatis di Google Cloud Platform disetel melalui Kebijakan Pemberitahuan. Anda dapat mengakses Kebijakan Pemberitahuan melalui menu samping, tab Operasi > Pemantauan > Pemberitahuan. Anda dapat membuat kebijakan pemberitahuan baru dengan memilih opsi +CREATE POLICY, yang akan mengarahkan Anda ke layar pembuatan kebijakan pemberitahuan:

6e417d88c2274b3d.png

Ada tiga bagian dalam membuat kebijakan pemberitahuan. Pertama, Anda harus menentukan apa yang ingin dilacak dengan menambahkan kondisi. Menekan tombol TAMBAHKAN KONDISI akan memunculkan jendela yang mirip dengan Metrics Explorer, dengan beberapa kontrol tambahan untuk mengonfigurasi kondisi:

df1ccf7da741e1c7.png

Untuk target, pilih metrik keyakinan yang telah kita bahas di bagian sebelumnya. Pastikan aligner ditetapkan ke delta menggunakan metrik ini (Show Advanced Options > Aligner). Langkah berikutnya adalah mengonfigurasi kondisi pemberitahuan dan menggunakan setelan berikut:

4192e0f4ea00dd28.png

Kondisi dipicu jika - Ini adalah konfigurasi utama untuk menentukan kapan akan memicu notifikasi. Memilih Deret waktu mana saja yang melanggar akan berfungsi karena kita akan menetapkan ambang batas pada metrik dan memantau apakah nilainya disilangkan.

Kondisi - Kita ingin peringatan dipicu saat nilai turun di bawah ambang batas sehingga kita akan menetapkannya ke di bawah. Dengan metrik kami, 1.0 berarti integrasi berfungsi dengan baik dan 0.0 menunjukkan pemadaman yang pasti.

Nilai Minimum - Kami telah membuat metrik keyakinan untuk memberikan hasil terbaik jika nilai ini ditetapkan ke 0,5. Jika Anda ingin mendapatkan notifikasi yang lebih sering dan mendapatkan notifikasi untuk insiden yang lebih kecil, Anda dapat mencoba meningkatkan nilai ini (maks 1.0). Selanjutnya, jika Anda ingin mendapatkan lebih sedikit notifikasi, hanya untuk masalah yang lebih parah, Anda dapat mencoba mengurangi nilai ini (min 0,0).

Untuk - Ini adalah setelan untuk mengidentifikasi berapa lama penonaktifan harus berlangsung sebelum Anda menerima notifikasi. Sebaiknya pertahankan setelan ini pada nilai terbaru agar mendapatkan peringatan saat titik mana pun melampaui batas. Metrik keyakinan kami dipublikasikan setiap 15 menit, dengan melihat keberhasilan rata-rata dalam periode tersebut.

Setelah Anda selesai menambahkan kondisi, langkah berikutnya adalah memilih saluran notifikasi. Metode notifikasi yang paling sederhana adalah notifikasi email. Anda dapat memilih email yang tercantum di bawah menu Saluran Notifikasi:

3cc10629830e7f13.png

Jika Anda mencentang opsi Beri tahu tentang penutupan insiden, akan ada notifikasi lain yang dikirim setelah insiden ditandai tutup. Dalam hal ini, Anda juga harus memilih Durasi penutupan otomatis insiden yang ditentukan sebagai default 7 hari.

Langkah terakhir adalah memberikan nama pada pemberitahuan, lalu menambahkan dokumentasi yang ingin disertakan dalam notifikasi.

686fb1c537fee10.png

Sebaiknya berikan dokumentasi, terutama jika bukan Anda yang akan menerima pemberitahuan. Menambahkan langkah seperti tempat pemeriksaan selama insiden berlangsung serta cara melakukan triase dan debug dapat membantu selama gangguan. Anda dapat melihat Panduan Pemecahan Masalah kami jika diperlukan.

Setelah disimpan, kebijakan pemberitahuan Anda akan dicantumkan di bagian Kebijakan pada halaman Pemberitahuan.

c71a001e4df035ee.png

5. Mengurangi Pemadaman Listrik

Setelah menyiapkan notifikasi, Anda akan menerima notifikasi selama penonaktifan dari saluran notifikasi yang Anda berikan, serta entri insiden akan dibuat di halaman Pemberitahuan.

Menerima Pemberitahuan

Saluran pemberitahuan yang kami berikan dalam codelab ini adalah email. Setelah ditetapkan, mudah-mudahan Anda tidak menerima pemberitahuan apa pun (tidak mengalami gangguan layanan), tetapi jika Anda melakukannya, notifikasi akan terlihat seperti berikut:

43217b0a145c2cd.png

Perhatikan bahwa notifikasi pemberitahuan memberikan nilai yang diamati melampaui batas yang Anda tentukan, serta stempel waktu yang menguraikan kapan insiden tersebut pertama kali dimulai.

Memantau Insiden

Saat insiden terjadi, insiden tersebut juga akan dihitung di bagian insiden di halaman Pemberitahuan.

fdd883a9604ed981.png

Anda dapat mengklik insiden tertentu untuk melihat detail tentang gangguan, seperti berapa lama insiden berlangsung atau seberapa parah gangguan tersebut terjadi.

Ingat, saat Anda menerima peringatan, langkah pertama yang terbaik adalah melihat metrik, kemudian menelusuri error yang menyebabkan gangguan di log Anda. Anda dapat mengingat kembali cara melakukannya di codelab Men-debug Smart Home kami.

6. Selamat

17d485868a6771bc.png

Selamat! Anda telah berhasil mempelajari cara menyiapkan pemberitahuan menggunakan metrik yang disediakan ke project Anda untuk memantau gangguan secara otomatis dan menerima notifikasi selama gangguan layanan.

Langkah berikutnya

Dari Codelab ini, coba latihan berikut dan jelajahi resource tambahan:

  • Anda dapat menggabungkan hal yang telah dipelajari dalam codelab ini dengan metrik lain yang disediakan untuk project Anda. Anda dapat melihat daftar lengkap metrik yang tersedia di bagian Metrik yang Didukung di halaman Monitoring dan Logging.
  • Pelajari jenis saluran notifikasi lain untuk mengetahui pemberitahuan yang dijelaskan di halaman Opsi Notifikasi dalam dokumentasi Google Cloud Platform.