Pemantauan Gangguan untuk Smart Home

1. Sebelum memulai

Seperti yang telah dibahas dalam codelab Men-debug Smart Home, kami memublikasikan metrik dan log ke project Smart Home Anda. Metrik membantu Anda menentukan tempat Action Smart Home Anda mengalami masalah, dan log berguna saat melakukan pembahasan mendalam untuk mengatasi masalah tersebut.

dd44868a4ff2df6e.png

Anda dapat mengatur pemberitahuan menggunakan metrik yang disediakan ke project untuk memantau pemadaman secara otomatis dan mendapatkan notifikasi selama gangguan layanan. Kami memublikasikan metrik keyakinan untuk menyoroti gangguan pada project Anda, yang akan kami bahas dalam codelab ini bersama semua alat pemberitahuan lainnya yang tersedia untuk Anda di Google Cloud Platform.

Prasyarat

Yang akan Anda pelajari

  • Cara memantau masalah performa dan gangguan layanan pada project Anda.
  • Cara membuat pemberitahuan berbasis nilai minimum dan menerima notifikasi selama gangguan terjadi.
  • Cara memanfaatkan metrik keyakinan yang diberikan ke project Anda untuk mendeteksi pemadaman layanan.

2. Memantau Kinerja

Memantau performa sangat penting untuk keberhasilan integrasi dengan Ekosistem Google Smart Home. Kami menyediakan serangkaian alat pemantauan untuk developer smart home di Google Cloud Platform. Anda dapat menggunakan alat-alat ini untuk memahami kinerja proyek Anda.

Mengakses Dasbor

Langkah pertama untuk mengakses data Anda adalah memeriksa dasbor Google Home, dengan login ke Konsol Google Cloud dan membuka Operasi > Pemantauan > Dasbor. Anda akan melihat bahwa ada sejumlah dasbor yang tersedia, dan dasbor untuk smart home dilengkapi dengan awalan Google Home Analytics.

317697e52ced2437.png

Kami membuat dasbor individual untuk mewakili setiap jenis integrasi. Integrasi Cloud, Lokal, dan Matter memiliki dasbor sendiri dan data untuk protokol streaming kamera disediakan di dasbor Kualitas Kamera. Dasbor ini hanya akan berisi data jika Anda memiliki integrasi dari jenis yang sesuai, bersama dengan project yang berfungsi yang memenuhi permintaan.

Saat Anda membuka salah satu dasbor ini, tampilan yang Anda dapatkan akan terlihat seperti berikut:

f8bfd69286c569a4.png

Dasbor berisi berbagai bagan yang menunjukkan detail permintaan yang ditangani oleh proyek Anda. Pada setiap dasbor integrasi, Anda akan melihat diagram yang menunjukkan jumlah total permintaan yang ditangani oleh proyek Anda, diagram yang menunjukkan tingkat keberhasilan untuk jenis integrasi tersebut, dan beberapa diagram yang menunjukkan jenis dan karakteristik perangkat yang terlibat.

Ada tiga diagram yang penting untuk menilai performa tindakan Smart Home Anda:

f511fafd3aaaa1eb.png

Selama pemadaman, Anda biasanya akan melihat tren turun dalam persentase keberhasilan dan tren naik dalam diagram perincian error. Memantau persentase keberhasilan eksekusi akan membantu Anda mengetahui pemadaman, sekaligus melihat error teratas dalam pengelompokan error dapat membantu proses debug. Anda juga mungkin melihat adanya tren naik dalam latensi selama pemadaman layanan, yang dapat Anda lihat di diagram latensi permintaan.

Perhatikan bahwa tampilan default dengan diagram yang Anda lihat di dasbor Google Home Analytics hanyalah tampilan yang kami buat untuk project Anda menggunakan data metrik smart home. Anda juga dapat menggunakan Metrics Explorer untuk membuat diagram Anda sendiri dari metrik dasar yang sama dan menyimpannya di dasbor kustom.

Metrics Explorer

Metrics Explorer adalah alat untuk memvisualisasikan bagian-bagian set data project Anda. Alat ini dapat diakses di Konsol Google Cloud dengan membuka Operations > Monitoring > Metrics Explorer.

Google Cloud menyediakan berbagai metrik siap pakai, termasuk beberapa yang tidak terkait dengan smart home. Metrik yang kami sediakan untuk smart home tercantum di bagian resource "actions.googleapis.com/smarthome_action/...", dan dapat ditelusuri dengan mudah dengan mengetik "smarthome" di kotak pilihan metrik.

538d851edfd34764.png

Penelusuran "smarthome" akan menampilkan semua metrik smart home yang kami berikan untuk project Anda. Anda dapat memperoleh informasi mendetail tentang setiap metrik kami di halaman Monitoring dan Logging dalam dokumentasi kami.

Saat memantau project Anda, metrik yang paling sederhana untuk dirujuk adalah metrik Jumlah permintaan (yang merupakan metrik delta). Metrik ini mencatat entri untuk setiap eksekusi smart home yang dimulai oleh pengguna Anda dan mencatat kolom seperti jenis perangkat, karakteristik, jenis eksekusi yang terkait dengan eksekusi, dan kolom status yang menunjukkan hasilnya.

Memilih metrik ini akan menghasilkan layar yang menampilkan setiap bucket data yang serupa dengan berikut ini:

b1c18141d15a0e09.png

Pada dasarnya, untuk setiap kombinasi label data yang ada dalam metrik ini, terdapat bucket yang mencatat perubahan (delta) antara interval waktu sebelumnya dan saat ini. Anda dapat mengelompokkan atau memfilter bucket ini untuk mendapatkan bagian data tampilan yang diinginkan. Selain itu, data diselaraskan ke dalam interval waktu yang dipilih dengan fungsi perataan (DELTA, MEAN, MEDIAN, SUM). Kecuali jika diperlukan, Anda biasanya akan menggunakan perataan Delta dengan metrik delta.

Anda dapat membuat sebagian besar diagram yang tersedia di dasbor Google Home Analytics menggunakan Metrics Explorer dan menyimpan diagram untuk diakses nanti di dasbor kustom. Untuk mencapai tampilan yang lebih kompleks, seperti diagram rasio, Anda harus menggunakan MQL - Bahasa Kueri Pemantauan.

3. Metrik Keberhasilan

Untuk melacak keberhasilan integrasi, Anda dapat menggunakan tingkat keberhasilan yang kami hitung dari metrik jumlah permintaan Anda sebagai indikator dasar, atau keyakinan keberhasilan untuk pendekatan yang lebih khusus.

Rasio Keberhasilan

Tingkat keberhasilan dihitung untuk semua integrasi Anda dengan membagi jumlah permintaan yang berhasil ke semua permintaan. Anda dapat mengaksesnya dari diagram Rasio Keberhasilan Pemenuhan Pesanan di Dasbor Google Home Analytics.

55ea8930fbf48d9e.pngS

Diagram Fulfillment Success Rate sangat berguna untuk memantau performa di project Anda, tetapi tidak terlalu berguna saat membuat dasbor kustom atau menyiapkan pemberitahuan. Karena tingkat keberhasilan berasal dari metrik jumlah permintaan Anda, dan bukan metrik itu sendiri, Anda harus membuatnya ulang menggunakan MQL (Monitoring Query Language) di Metrics Explorer untuk dapat menggunakannya dengan salah satu fitur tersebut.

Selain itu, untuk melacak gangguan performa pada proyek Anda, kami merasa diperlukan pendekatan yang jauh lebih khusus. Itulah sebabnya kami membuat metrik keyakinan yang berubah berdasarkan seberapa besar tingkat keberhasilan pemenuhan pesanan Anda saat ini menyimpang dari norma historis.

Metrik Keyakinan

Pemadaman layanan dapat terjadi dalam berbagai bentuk dan ukuran untuk project. Parameter ini dapat berlangsung beberapa jam hingga beberapa menit saja, yang dapat membuat proses identifikasinya cukup sulit. Untuk itu, kami telah membuat Metrik Keyakinan dalam project Anda, yang memberikan nilai yang dinormalkan untuk memprediksi keandalan berdasarkan performa sebelumnya. Anda dapat mengakses metrik keyakinan dengan menelusuri smarthome di metrics explorer, lalu memilih Execution success credentials.

ab467a1777281526.png

Jika integrasi smart home Anda berperforma pada atau di atas histori performa (rata-rata 7 hari), metrik ini akan menghasilkan nilai maksimum (1,0). Jika persentase keberhasilan Anda menyimpang lebih dari satu faktor dari 4 deviasi standar (juga dihitung selama 7 hari), metrik ini menghasilkan nilai minimum (0,0). Untuk kasus di mana standar deviasi terlalu kecil (kurang dari 2,5%), metrik ini mendasarkan nilai 0,0 dengan penurunan 10% pada persentase keberhasilan.

Untuk semua kasus di antara kasus tersebut, metrik ini memberikan nilai antara 1,0 (sangat yakin bahwa tidak ada pemadaman layanan) dan 0,0 (keyakinan maksimum bahwa terjadi pemadaman).

Oleh karena itu, saat menyiapkan pemberitahuan (akan muncul di bagian berikutnya), sebaiknya Anda mendasarkan nilai 0,5 sebagai nilai minimum. Ini akan sesuai dengan 2 deviasi standar, atau penurunan 5%, mana saja yang lebih tinggi.

4. Menyiapkan Pemberitahuan

Langkah selanjutnya adalah menggunakan semua yang Anda pelajari di bagian sebelumnya untuk menyiapkan peringatan pada project Anda.

Membuat Kebijakan Pemberitahuan

Pemberitahuan otomatis di Google Cloud Platform diatur melalui Kebijakan Pemberitahuan. Anda dapat mengakses Kebijakan Pemberitahuan melalui menu samping, tab Operasi > Pemantauan > Pemberitahuan. Anda dapat membuat kebijakan pemberitahuan baru dengan memilih opsi +BUAT KEBIJAKAN, yang akan membuka layar pembuatan kebijakan pemberitahuan:

6e417d88c2274b3d.png

Ada tiga bagian dalam membuat kebijakan pemberitahuan. Pertama, Anda perlu menentukan apa yang ingin Anda lacak dengan menambahkan kondisi. Menekan tombol ADD KONDISI akan memunculkan jendela yang mirip dengan Metrics Explorer, dengan beberapa kontrol tambahan untuk mengonfigurasi kondisi:

df1ccf7da741e1c7.png

Untuk target, pilih metrik keyakinan yang telah kita bahas di bagian sebelumnya. Pastikan aligner ditetapkan ke delta menggunakan metrik ini (Tampilkan Opsi Lanjutan > Aligner). Langkah berikutnya adalah mengonfigurasi kondisi pemberitahuan dan menggunakan setelan berikut:

4192e0f4ea00dd28.pngS

Kondisi dipicu jika - Ini adalah konfigurasi utama untuk menentukan kapan harus memicu pemberitahuan. Anda dapat memilih opsi Anyer time deret karena kita akan menetapkan nilai minimum pada metrik dan memantau apakah nilai tersebut terlampaui.

Kondisi - Kita ingin pemberitahuan dipicu saat nilai turun di bawah nilai minimum, jadi kita akan menetapkannya ke di bawah. Dengan metrik kami, 1,0 berarti integrasi berfungsi dengan baik dan 0,0 menunjukkan pemadaman pasti.

Nilai minimum - Kami telah membuat metrik keyakinan untuk memberikan hasil terbaik saat nilai ini ditetapkan ke 0,5. Jika ingin mendapatkan pemberitahuan yang lebih sering dan mendapatkan notifikasi untuk insiden yang lebih sedikit, Anda dapat mencoba meningkatkan nilai ini (maks 1,0). Selanjutnya, jika Anda ingin lebih sedikit notifikasi, hanya untuk masalah yang lebih serius, Anda dapat mencoba mengurangi nilai ini (min 0,0).

Untuk - Ini adalah setelan untuk mengidentifikasi berapa lama pemadaman akan berlangsung sebelum Anda mendapatkan pemberitahuan. Sebaiknya pertahankan setelan ini pada nilai terbaru agar mendapatkan notifikasi jika ada poin yang melampaui nilai minimum. Metrik keyakinan kami dipublikasikan setiap 15 menit, dengan melihat tingkat keberhasilan rata-rata dalam periode tersebut.

Setelah selesai menambahkan kondisi, langkah berikutnya adalah memilih saluran notifikasi. Metode notifikasi yang paling sederhana adalah peringatan email. Anda dapat memilih email yang tercantum di bagian dropdown Notification Channels:

3cc10629830e7f13.png

Jika Anda mencentang opsi Beri tahu saat penutupan insiden, akan ada notifikasi lain yang dikirim setelah insiden ditandai sebagai ditutup. Dalam hal ini, Anda juga harus memilih Durasi penutupan otomatis insiden, yang ditetapkan secara default menjadi 7 hari.

Langkah terakhir adalah memberi nama peringatan, dan menambahkan dokumentasi apa pun yang ingin disertakan dalam notifikasi.

686fb1c537fee10.pngS

Sebaiknya berikan dokumentasi, terutama jika Anda bukan orang yang akan menerima pemberitahuan. Menambahkan langkah-langkah seperti tempat memeriksa saat insiden terjadi serta cara melakukan triase dan debug dapat membantu selama pemadaman. Anda dapat membaca Panduan Pemecahan Masalah kami sesuai kebutuhan.

Setelah disimpan, kebijakan pemberitahuan Anda akan dicantumkan di bagian Kebijakan di halaman Pemberitahuan.

c71a001e4df035ee.png

5. Mengurangi Pemadaman Layanan

Setelah menyiapkan pemberitahuan, Anda akan diberi tahu selama pemadaman layanan dari saluran notifikasi yang Anda berikan, serta entri insiden akan dibuat di halaman Alerting.

Menerima Pemberitahuan

Saluran pemberitahuan yang kami sediakan dalam codelab ini adalah email. Setelah disetel, mudah-mudahan Anda tidak menerima pemberitahuan apa pun (tidak ada pemadaman layanan), tetapi jika Anda melakukannya, notifikasi akan terlihat seperti berikut:

43217b0a145c2cd.pngs

Perhatikan bahwa notifikasi pemberitahuan memberikan nilai yang diamati yang melampaui nilai minimum yang Anda tentukan, serta stempel waktu yang menguraikan saat insiden pertama kali dimulai.

Memantau Insiden

Saat terjadi, insiden juga akan dihitung di bagian insiden pada halaman Pemberitahuan.

fdd883a9604ed981.png

Anda dapat mengklik insiden tertentu untuk melihat detail terkait pemadaman tersebut, seperti berapa lama insiden itu berlangsung atau seberapa parah insiden yang terjadi.

Ingat, saat Anda menerima pemberitahuan, langkah pertama terbaik adalah melihat metrik Anda, lalu mencari error yang berkontribusi pada pemadaman log Anda. Anda dapat mengingat kembali cara melakukannya di codelab Men-debug Smart Home.

6. Selamat

17d485868a6771bc.png

Selamat! Anda telah berhasil mempelajari cara menyiapkan pemberitahuan menggunakan metrik yang disediakan untuk project Anda untuk memantau pemadaman layanan secara otomatis dan mendapatkan notifikasi selama gangguan layanan.

Langkah berikutnya

Dari Codelab ini, coba latihan berikut dan jelajahi resource tambahan:

  • Anda dapat menggabungkan apa yang telah dipelajari dalam codelab ini dengan metrik lain yang disediakan untuk project Anda. Anda dapat melihat daftar lengkap metrik yang tersedia di bagian Metrik yang Didukung di halaman Monitoring.
  • Pelajari jenis saluran notifikasi lain untuk pemberitahuan yang dijelaskan di halaman Opsi Notifikasi dalam dokumentasi Google Cloud Platform.