Pemantauan Gangguan untuk Smart Home

Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

1. Sebelum memulai

Seperti yang telah dibahas dalam codelab Men-debug Smart Home, kami memublikasikan metrik dan log ke project Smart Home Anda. Metrik membantu Anda menentukan tempat Action Smart Home Anda mengalami masalah, dan log berguna saat melakukan pembahasan mendalam untuk mengatasi masalah tersebut.

dd44868a4ff2df6e.png

Anda dapat menyiapkan pemberitahuan menggunakan metrik yang disediakan untuk project Anda agar dapat memantau gangguan secara otomatis dan menerima notifikasi selama gangguan layanan. Kami memublikasikan metrik keyakinan untuk menyoroti gangguan pada project Anda, yang akan kita bahas di codelab ini bersama dengan semua alat pemberitahuan lain yang tersedia untuk Anda di Google Cloud Platform.

Prasyarat

Yang akan Anda pelajari

  • Cara memantau masalah performa dan gangguan layanan di project Anda.
  • Cara membuat pemberitahuan berbasis nilai minimum dan menerima notifikasi selama gangguan.
  • Cara menggunakan metrik keyakinan yang disediakan ke project Anda untuk mendeteksi gangguan.

2. Memantau Kinerja

Pemantauan performa sangat penting untuk keberhasilan integrasi dengan Ekosistem Google Smart Home. Kami menyediakan serangkaian alat pemantauan bagi developer smart home di Google Cloud Platform. Anda dapat menggunakan alat ini untuk mendapatkan gambaran tentang performa project.

Mengakses Dasbor

Langkah pertama untuk mengakses data Anda adalah memeriksa dasbor Google Home, dengan login ke Google Cloud Console dan membuka Operasi > Pemantauan > Dasbor. Anda akan melihat sejumlah dasbor yang tersedia, dan dasbor untuk smart home dilengkapi dengan awalan Google Home Analytics.

317697e52ced2437.png

Kami membuat dasbor individual untuk mewakili setiap jenis integrasi. Integrasi Cloud, Lokal, dan Matter memiliki dasbornya sendiri dan data untuk protokol streaming kamera disediakan di dasbor Kualitas Kamera. Dasbor ini hanya akan berisi data jika Anda memiliki integrasi dengan jenis yang sesuai, beserta project yang berfungsi dan memenuhi permintaan.

Saat membuka salah satu dasbor ini, tampilan yang Anda dapatkan akan terlihat seperti berikut:

f8bfd69286c569a4.png

Dasbor berisi berbagai diagram yang menampilkan detail permintaan yang ditangani oleh project Anda. Dengan setiap dasbor integrasi, Anda akan melihat diagram yang menunjukkan jumlah total permintaan yang ditangani oleh project Anda, diagram yang menunjukkan tingkat keberhasilan untuk jenis integrasi tersebut, dan beberapa diagram yang menunjukkan jenis dan karakteristik perangkat yang terlibat.

Ada tiga diagram yang penting untuk menilai performa tindakan Smart Home Anda:

f511fafd3aaaa1eb.png

Selama gangguan, Anda biasanya akan melihat tren penurunan dalam persentase keberhasilan dan tren naik dalam diagram perincian error. Memantau persentase keberhasilan eksekusi membantu melihat pemadaman layanan, sementara melihat error teratas dalam perincian error dapat membantu proses debug. Anda mungkin juga mengamati tren naik dalam latensi selama pemadaman layanan, yang dapat dilihat di diagram latensi permintaan.

Perhatikan bahwa tampilan default dengan diagram yang Anda lihat di dasbor Google Home Analytics hanyalah tampilan yang kami buat untuk project Anda menggunakan data metrik smart home. Anda juga dapat menggunakan Metrics Explorer untuk membuat diagram sendiri dari metrik dasar yang sama dan menyimpannya di dasbor kustom.

Penjelajah Metrik

Metrics Explorer adalah alat untuk memvisualisasikan berbagai bagian set data project Anda. Alat ini dapat diakses di Google Cloud Console dengan membuka Operations > Monitoring > Metrics Explorer.

Google Cloud menyediakan berbagai metrik siap pakai, termasuk beberapa metrik yang tidak terkait dengan smart home. Metrik yang kami sediakan untuk smart home tercantum di bagian resource "actions.googleapis.com/smarthome_action/...", dan dapat dengan mudah ditelusuri dengan mengetik "smarthome" di kotak pilihan metrik.

538d851edfd34764.png

Menelusuri "smarthome" akan menampilkan semua metrik smart home yang kami sediakan ke project Anda. Anda bisa mendapatkan informasi mendetail tentang setiap metrik di halaman Pemantauan dan Logging dalam dokumentasi kami.

Dalam hal pemantauan project, metrik yang paling sederhana untuk dirujuk adalah metrik Jumlah permintaan (yang merupakan metrik delta). Metrik ini mencatat entri untuk setiap eksekusi smart home yang dimulai oleh pengguna dan kolom catatan seperti jenis perangkat, karakteristik, jenis eksekusi yang terkait dengan eksekusi, dan kolom status yang menampilkan hasilnya.

Memilih metrik ini akan menghasilkan layar yang menampilkan setiap bucket data yang mirip dengan berikut ini:

b1c18141d15a0e09.png

Pada dasarnya, ada kombinasi bucket data untuk setiap kombinasi data dalam metrik ini yang mencatat perubahan (delta) antara interval waktu sebelumnya dan saat ini. Anda dapat mengelompokkan, atau memfilter bucket ini untuk mendapatkan potongan data tampilan yang diinginkan. Selain itu, data disejajarkan ke dalam interval waktu yang dipilih dengan fungsi penyelarasan (DELTA, MEAN, MEDIAN, SUM). Kecuali jika diperlukan, Anda biasanya akan menggunakan perataan Delta dengan metrik delta.

Anda dapat membuat sebagian besar diagram yang tersedia di dasbor Google Home Analytics menggunakan Metrics Explorer dan menyimpan diagram tersebut untuk diakses nanti di dasbor kustom. Untuk mencapai tampilan yang lebih kompleks, seperti diagram rasio, Anda perlu menggunakan MQL - Monitoring Query Language.

3. Metrik Keberhasilan

Dalam hal pelacakan keberhasilan integrasi, Anda dapat menggunakan tingkat keberhasilan yang kami hitung dari metrik jumlah permintaan sebagai indikator dasar, atau tingkat keberhasilan untuk pendekatan yang lebih terspesialisasi.

Tingkat Keberhasilan

Tingkat keberhasilan dihitung untuk semua integrasi Anda dengan membagi jumlah permintaan yang berhasil dengan semua permintaan. Anda dapat mengaksesnya dari diagram Rasio Fulfillment Success di Dasbor Google Home Analytics.

55ea8930fbf48d9e.png

Diagram Rasio Fulfillment Sukses sangat berguna untuk memantau performa project Anda, tetapi tidak begitu banyak saat membuat dasbor kustom atau menyiapkan pemberitahuan. Karena tingkat keberhasilan berasal dari metrik jumlah permintaan, dan bukan metrik itu sendiri, Anda harus membuatnya kembali menggunakan MQL (Memantau Bahasa Kueri) di Metrics Explorer agar dapat menggunakannya dengan salah satu fitur.

Selain itu, untuk melacak gangguan performa pada project Anda, kami rasa diperlukan pendekatan yang lebih khusus. Itulah sebabnya kami membuat metrik keyakinan yang berubah berdasarkan seberapa jauh penyimpangan tingkat keberhasilan Anda saat ini dari norma historis.

Metrik Keyakinan

Gangguan dapat terjadi dalam berbagai bentuk dan ukuran untuk project. Latihan ini dapat berlangsung beberapa jam hingga hanya beberapa menit, yang dapat membuat identifikasi tantangan. Untuk alasan ini, kami telah membuat Metrik Keyakinan dalam project Anda, yang memberikan nilai yang dinormalkan untuk memprediksi keandalan berdasarkan performa sebelumnya. Anda dapat mengakses metrik keyakinan dengan menelusuri smarthome di penjelajah metrik, lalu memilih Keyakinan keberhasilan eksekusi.

ab467a1777281526.png

Jika performa integrasi smart home Anda berada pada atau di atas histori performa (rata-rata 7 hari), metrik ini akan menampilkan nilai maksimum (1,0). Jika persentase keberhasilan Anda menyimpang lebih dari faktor 4 deviasi standar (juga dihitung dalam 7 hari), metrik ini akan menghasilkan nilai minimum (0,0). Untuk kasus di mana standar deviasi terlalu kecil (kurang dari 2,5%), metrik ini mendasarkan nilai 0,0 pada penurunan 10% pada persentase keberhasilan.

Untuk semua kasus di antaranya, metrik ini memberikan nilai antara 1,0 (sangat yakin bahwa tidak ada gangguan) dan 0,0 (yakin bahwa terjadi gangguan).

Oleh karena itu, saat menyetel pemberitahuan (akan datang di bagian berikutnya), sebaiknya dasarkan nilai 0,5 sebagai ambang batas. Hal ini sesuai dengan 2 deviasi standar, atau penurunan 5%, mana saja yang lebih tinggi.

4. Menyiapkan Pemberitahuan

Langkah berikutnya adalah menggunakan semua yang telah Anda pelajari di bagian sebelumnya untuk menyiapkan pemberitahuan di project.

Membuat Kebijakan Pemberitahuan

Pemberitahuan otomatis di Google Cloud Platform ditetapkan melalui Kebijakan Pemberitahuan. Anda dapat mengakses Kebijakan Pemberitahuan melalui menu samping, tab Operasi > Pemantauan > Pemberitahuan. Anda dapat membuat kebijakan pemberitahuan baru dengan memilih opsi +CREATE POLICY, yang akan mengarahkan Anda ke layar pembuatan kebijakan pemberitahuan:

6e417d88c2274b3d.png

Ada tiga bagian dalam membuat kebijakan pemberitahuan. Pertama, Anda harus menentukan apa yang ingin dilacak dengan menambahkan kondisi. Menekan tombol ADD CONDITION akan memunculkan jendela yang mirip dengan Metrics Explorer, dengan beberapa kontrol tambahan untuk mengonfigurasi kondisi:

df1ccf7da741e1c7.png

Untuk target, pilih metrik keyakinan yang kita bahas di bagian sebelumnya. Pastikan aligner ditetapkan ke delta menggunakan metrik ini (Show Advanced Options > Aligner). Langkah berikutnya adalah mengonfigurasi kondisi pemberitahuan dan menggunakan setelan berikut:

4192e0f4ea00dd28.png

Kondisi dipicu jika - Ini adalah konfigurasi utama untuk menentukan kapan akan memicu notifikasi. Memilih Deret waktu mana pun melanggar akan berfungsi karena kita akan menetapkan batas pada metrik dan memantau apakah nilainya disilangkan.

Kondisi - Kami ingin pemberitahuan dipicu saat nilai turun di bawah nilai minimum sehingga kami akan menetapkannya ke di bawah. Dengan metrik kami, 1.0 berarti integrasi berfungsi dengan baik dan 0.0 menunjukkan pemadaman yang pasti.

Nilai Minimum - Kami telah membuat metrik keyakinan untuk memberikan hasil terbaik saat nilai ini ditetapkan ke 0,5. Jika Anda ingin mendapatkan pemberitahuan lebih sering dan mendapatkan notifikasi untuk insiden yang lebih rendah, Anda dapat mencoba meningkatkan nilai ini (maks 1,0). Selanjutnya, jika Anda ingin mendapatkan pemberitahuan lebih sedikit, hanya untuk masalah yang lebih serius, Anda dapat mencoba mengurangi nilai ini (min 0,0).

Untuk - Ini adalah setelan untuk mengidentifikasi berapa lama pemadaman akan berlangsung sebelum Anda menerima notifikasi. Sebaiknya pertahankan setelan ini pada nilai terbaru untuk mendapatkan notifikasi saat ada poin yang melampaui batas. Metrik keyakinan kami dipublikasikan setiap 15 menit, dengan melihat keberhasilan rata-rata dalam periode tersebut.

Setelah Anda selesai menambahkan kondisi, langkah berikutnya adalah memilih saluran notifikasi. Metode notifikasi yang paling sederhana adalah notifikasi email. Anda dapat memilih email yang tercantum di menu drop-down Notification Channels:

3cc10629830e7f13.png

Jika Anda mencentang opsi Beri tahu penutupan insiden, akan ada notifikasi lain yang dikirim setelah insiden ditandai sebagai tutup. Dalam hal ini, Anda juga harus memilih Durasi penutupan otomatis insiden, yang ditentukan sebagai 7 hari secara default.

Langkah terakhir adalah menamai pemberitahuan dan menambahkan dokumentasi yang ingin disertakan dalam notifikasi.

686fb1c537fee10.png

Sebaiknya berikan dokumentasi, terutama jika bukan Anda yang akan menerima pemberitahuan. Menambahkan langkah-langkah seperti tempat memeriksa selama insiden serta cara melakukan triase dan debug dapat membantu selama pemadaman. Anda dapat melihat Panduan Pemecahan Masalah kami jika diperlukan.

Setelah disimpan, kebijakan pemberitahuan Anda akan dicantumkan di bagian Kebijakan di halaman Pemberitahuan.

c71a001e4df035ee.png

5. Memitigasi Gangguan

Setelah menyiapkan notifikasi, Anda akan mendapatkan notifikasi saat terjadi gangguan dari saluran notifikasi yang Anda berikan, serta entri insiden akan dibuat di halaman Pemberitahuan.

Menerima Pemberitahuan

Saluran pemberitahuan yang kami berikan dalam codelab ini adalah email. Setelah ditetapkan, semoga Anda tidak menerima pemberitahuan apa pun (tidak mengalami gangguan). Namun, jika Anda melakukannya, notifikasi akan terlihat seperti berikut:

43217b0a145c2cd.png

Perhatikan bahwa notifikasi pemberitahuan memberikan nilai yang diamati yang melampaui nilai minimum yang Anda tentukan, serta stempel waktu yang menguraikan kapan insiden pertama kali dimulai.

Memantau Insiden

Saat insiden terjadi, insiden tersebut juga akan dihitung di bagian insiden di halaman Pemberitahuan.

fdd883a9604ed981.png

Anda dapat mengklik insiden tertentu untuk melihat detail tentang pemadaman layanan, seperti berapa lama durasinya atau seberapa parah gangguan.

Ingat, saat Anda menerima notifikasi, langkah pertama yang terbaik adalah melihat metrik, lalu menelusuri error yang menyebabkan gangguan di log. Anda dapat mengingat kembali cara melakukannya di codelab Men-debug Smart Home kami.

6. Selamat

17d485868a6771bc.png

Selamat! Anda telah berhasil mempelajari cara menyiapkan pemberitahuan menggunakan metrik yang disediakan untuk project Anda agar dapat memantau gangguan secara otomatis dan menerima notifikasi selama gangguan layanan.

Langkah berikutnya

Dari Codelab ini, coba latihan berikut dan jelajahi resource tambahan:

  • Anda dapat menggabungkan apa yang telah Anda pelajari dalam codelab ini dengan metrik lain yang disediakan untuk project Anda. Anda dapat melihat daftar lengkap metrik yang tersedia di bagian Metrik yang Didukung di halaman Pemantauan.
  • Pelajari jenis saluran notifikasi lainnya untuk pemberitahuan yang dijelaskan di halaman Opsi Notifikasi dalam dokumentasi Google Cloud Platform.