1. לפני שמתחילים
כפי שציינו ב-codelab בנושא ניפוי באגים בבית החכם, אנחנו מפרסמים מדדים ויומנים בפרויקטים של הבית החכם. המדדים עוזרים לכם לקבוע איפה יש בעיות בפעולה לבית החכם, והיומנים שימושיים כשאתם רוצים לבצע ניתוח מעמיק כדי לפתור את הבעיות האלה.

אתם יכולים להגדיר התראות באמצעות המדדים שמופיעים בפרויקט, כדי לעקוב אחרי הפסקות שירות באופן אוטומטי ולקבל התראות במהלך שיבושים בשירות. אנחנו מפרסמים מדד מהימנות כדי להדגיש את השיבושים בפרויקט שלכם, ונסביר עליו ב-Codelab הזה, לצד כל כלי ההתראה האחרים שזמינים לכם ב-Google Cloud.
דרישות מוקדמות
- יש להם שילוב של Works with Smart Home.
- משלימים את ה-Codelab בנושא Debugging the Smart Home.
מה תלמדו
- איך לעקוב אחרי בעיות בביצועים והפרעות בשירות בפרויקט.
- איך יוצרים התראה שמבוססת על סף ומקבלים התראות במהלך שיבושים.
- איך להשתמש במדד מהימנות שמופיע בפרויקט כדי לזהות הפסקות שירות.
2. מעקב אחר הביצועים
מעקב אחרי הביצועים הוא חיוני לשילוב מוצלח עם סביבת Google Home. אנחנו מספקים למפתחים של מכשירים לבית החכם ערכה של כלי מעקב ב-Google Cloud. אתם יכולים להשתמש בכלים האלה כדי לקבל מושג לגבי הביצועים של הפרויקט.
גישה למרכזי בקרה
השלב הראשון כדי לגשת לנתונים הוא להתחבר ל-מסוף Google Cloud ולעבור אל Operations > Monitoring > Dashboards כדי לבדוק את לוחות הבקרה של Google Home. תוכלו לראות שיש כמה לוחות בקרה זמינים, וללוחות הבקרה של הבית החכם יש קידומת של Google Home Analytics.

יצרנו לוחות בקרה נפרדים לכל סוג שילוב. לשילובים של Cloud, Local ו-Matter יש לוח בקרה משלהם, והנתונים של פרוטוקולי הסטרימינג של המצלמות מוצגים בלוח הבקרה Camera Quality. לוחות הבקרה האלה יכילו נתונים רק אם יש לכם שילוב מהסוג המתאים, ופרויקט פעיל שממלא בקשות.
כשפותחים אחת מלוחות הבקרה האלה, התצוגה שמתקבלת נראית כך:

מרכזי הבקרה מכילים תרשימים שונים שבהם מוצגים פרטי הבקשות שהפרויקט מטפל בהן. בכל לוח בקרה של שילוב מוצג תרשים עם המספר הכולל של הבקשות שטופלו בפרויקט, תרשים עם שיעור ההצלחה של סוג השילוב הזה וכמה תרשימים עם סוגי המכשירים והמאפיינים שקשורים לשילוב.
יש שלושה תרשימים שחשובים להערכת הביצועים של הפעולות בבית החכם:

במהלך הפסקות שירות, בדרך כלל רואים מגמת ירידה באחוז ההצלחה ומגמת עלייה בתרשים פירוט השגיאות. מעקב אחרי אחוז ההצלחה של ההפעלה עוזר לזהות את ההשבתה, ובדיקת השגיאות העיקריות בפירוט השגיאות יכולה לעזור בניפוי הבאגים. יכול להיות שתראו גם מגמת עלייה בחביון במהלך הפסקות שירות, כפי שניתן לראות בתרשימים של חביון הבקשות.
חשוב לזכור שהתצוגה שמוגדרת כברירת מחדל עם התרשימים שאתם רואים בלוחות הבקרה של Google Home Analytics היא רק תצוגה שיצרנו עבור הפרויקט שלכם באמצעות נתונים של מדדים לבית חכם. אפשר גם להשתמש ב-Metrics Explorer כדי ליצור תרשימים משלכם מאותם מדדים בסיסיים ולשמור אותם במרכזי הבקרה המותאמים אישית.
Metrics Explorer
הכלי Metrics Explorer מאפשר להציג חתכים של מערך הנתונים של הפרויקט. אפשר לגשת לכלי במסוף Google Cloud דרך Operations > Monitoring > Metrics Explorer.
ב-Google Cloud יש הרבה מדדים שונים, כולל כאלה שלא קשורים לבית חכם. המדדים שאנחנו מספקים לבית חכם מפורטים במשאב actions.googleapis.com/smarthome_action/..., ואפשר לחפש אותם בקלות על ידי הקלדת 'smarthome' בתיבת בחירת המדדים.

חיפוש של 'בית חכם' יציג את כל מדדי הבית החכם שאנחנו מספקים לפרויקט. מידע מפורט על כל אחד מהמדדים שלנו זמין בדפים Monitoring ו-Logging במסמכי התיעוד שלנו.
כשמדובר בניטור הפרויקט, המדד הכי פשוט להתייחסות הוא המדד Request count (שהוא מדד דלתא). במדד הזה מתועדת רשומה לכל הפעלה של בית חכם שהמשתמשים שלכם יזמו, ומתועדים שדות כמו סוג המכשיר, מאפיין, סוג ההפעלה שקשור להפעלה ושדה הסטטוס שמציג את התוצאה.
בחירה במדד הזה תציג מסך עם כל דלי הנתונים, בדומה למה שמוצג כאן:

בעצם, לכל שילוב של תוויות נתונים שמופיע במדד הזה יש משבצת שמתעדת את השינוי (דלתא) בין מרווחי הזמן הקודמים והנוכחיים. אפשר לקבץ או לסנן את הדליים האלה כדי לקבל את פלח הנתונים הרצוי. בנוסף, הנתונים מיושרים למרווחי זמן נבחרים באמצעות פונקציית יישור (DELTA, MEAN, MEDIAN, SUM). בדרך כלל משתמשים בהתאמה מסוג Delta עם מדד Delta, אלא אם יש צורך אחר.
אתם יכולים ליצור את רוב התרשימים שזמינים בלוחות הבקרה של Google Home Analytics באמצעות Metrics Explorer, ולשמור את התרשימים כדי לגשת אליהם מאוחר יותר בלוח בקרה בהתאמה אישית. כדי ליצור תצוגות מורכבות יותר, כמו תרשים יחס, תצטרכו להשתמש ב-MQL – שפת שאילתת מעקב.
3. מדדי הצלחה
כדי לעקוב אחרי הצלחת השילוב, אפשר להשתמש בשיעור ההצלחה שאנחנו מחשבים מתוך מדד מספר הבקשות כאינדיקטור בסיסי, או במידת הביטחון בהצלחה לגישה יותר מיוחדת.
שיעור הצלחה
שיעור ההצלחה מחושב עבור כל השילובים על ידי חלוקת מספר הבקשות המוצלחות במספר הבקשות הכולל. אפשר לגשת אליו מהתרשים 'שיעור ההצלחה של ביצוע ההזמנה' במרכז הבקרה של Analytics ב-Google Home.

התרשים 'שיעור ההצלחה של ביצוע ההזמנה' שימושי מאוד למעקב אחר הביצועים בפרויקט, אבל פחות שימושי כשיוצרים לוחות בקרה בהתאמה אישית או כשמגדירים התראות. שיעור ההצלחה נגזר ממדד מספר הבקשות, ולא מוגדר כמדד בפני עצמו. לכן, כדי להשתמש בו עם אחת מהתכונות האלה, צריך ליצור אותו מחדש באמצעות MQL (שפת שאילתות למעקב) ב-Metrics Explorer.
כדי לעקוב אחרי שיבושים בביצועים של הפרויקט שלך, לדעתנו נדרשת גישה הרבה יותר ממוקדת. לכן יצרנו את מדד רמת הביטחון, שמשתנה בהתאם למידת הסטייה של שיעור ההצלחה הנוכחי של מילוי ההזמנות מהנורמות ההיסטוריות.
מדד מהימנות
הפסקות זמניות יכולות להיות שונות בפרויקטים. הן יכולות להימשך כמה שעות או רק כמה דקות, ולכן קשה לזהות אותן. לשם כך יצרנו בפרויקט מדד מהימנות, שמספק ערך מנורמל לחיזוי מהימנות על סמך הביצועים הקודמים. כדי לגשת למדד המהימנות, מחפשים את smarthome בכלי לבחירת מדדים ובוחרים באפשרות מהימנות ההצלחה של ההפעלה.

כשהשילוב של הבית החכם משיג ביצועים ברמה של הביצועים ההיסטוריים (ממוצע של 7 ימים) או מעליהם, המדד הזה יציג את הערך המקסימלי (1.0). אם אחוז ההצלחה חורג ביותר מ-4 סטיות תקן (שמחושבות גם הן על פני 7 ימים), המדד הזה מחזיר את הערך המינימלי (0.0). במקרים שבהם סטיות התקן קטנות מדי (פחות מ-2.5%), המדד הזה מבסס את הערך 0.0 על ירידה של 10% באחוז ההצלחה.
בכל המקרים שביניהם, המדד הזה מספק ערכים בין 1.0 (בטוח לחלוטין שאין הפסקה זמנית בשירות) ל-0.0 (בטוח לחלוטין שיש הפסקה זמנית בשירות).
לכן, כשמגדירים התראה (בקטע הבא), מומלץ להגדיר ערך של 0.5 כסף. השינוי הזה יתאים ל-2 סטיות תקן או לירידה של 5%, הגבוה מביניהם.
4. הגדרת התראות
השלב הבא הוא להשתמש בכל מה שלמדתם בקטע הקודם כדי להגדיר התראות בפרויקט.
יצירת מדיניות התראות
התראות אוטומטיות ב-Google Cloud מוגדרות באמצעות מדיניות התראות. אפשר לגשת למדיניות ההתראות דרך התפריט הצדדי, בכרטיסייה Operations > Monitoring > Alerting (פעולות > מעקב > התראות). כדי ליצור מדיניות חדשה להתראות, בוחרים באפשרות +יצירת מדיניות. תועברו למסך ליצירת מדיניות להתראות:

התהליך ליצירת מדיניות התראות כולל שלושה חלקים. קודם צריך להוסיף תנאי כדי לקבוע מה רוצים לעקוב אחריו. לחיצה על הלחצן הוספת תנאי תציג חלון דומה לזה של הכלי 'Metrics Explorer', עם כמה אמצעי בקרה נוספים להגדרת התנאי:

בקטע 'יעד', בוחרים את מדד הביטחון שתיארנו בקטע הקודם. מוודאים שהכלי ההתאמה מוגדר לדלתא באמצעות המדד הזה (הצגת אפשרויות מתקדמות > כלי התאמה). השלב הבא הוא להגדיר את תנאי ההתראה באמצעות ההגדרות הבאות:

התנאי מופעל אם – כאן מגדירים את התנאי להפעלת ההתראות. הבחירה באפשרות כל סדרת זמן חורגת תפעל כמו שצריך כי אנחנו הולכים להגדיר סף למדד ולעקוב אחרי החריגה מהערך.
תנאי – אנחנו רוצים שההתראה תופעל כשהערך יירד מתחת לסף, ולכן נגדיר את התנאי כנמוך מ-. לפי המדד שלנו, הערך 1.0 מציין שהשילוב פועל בצורה תקינה, והערך 0.0 מציין שיש הפסקה מוחלטת בשירות.
ערך הסף – יצרנו את מדד המהימנות כדי לספק את התוצאות הכי טובות כשמגדירים את הערך הזה ל-0.5. אם רוצים לקבל התראות בתדירות גבוהה יותר ולקבל התראות על אירועים פחות חמורים, אפשר להגדיל את הערך הזה (עד 1.0). אם רוצים לקבל פחות התראות, רק לגבי בעיות חמורות יותר, אפשר להקטין את הערך הזה (הערך המינימלי הוא 0.0).
למשך – הגדרה שקובעת כמה זמן ההפסקה הזמנית בשירות צריכה להימשך לפני שתקבלו התראה. מומלץ להשאיר את ההגדרה הזו על הערך האחרון כדי לקבל התראה על כל נקודה שחוצה את הסף. מדד מהימנות התוצאות מתפרסם כל 15 דקות, והוא מבוסס על ממוצע ההצלחה בתקופה הזו.
אחרי שמוסיפים תנאי, השלב הבא הוא לבחור את ערוץ ההתראות. השיטה הכי פשוטה לקבלת התראות היא התראות באימייל. אפשר לבחור אימייל מהתפריט הנפתח Notification Channels:

אם מסמנים את האפשרות התראה על סגירת אירוע, תישלח התראה נוספת כשהאירוע יסומן כסגור. במקרה כזה, צריך לבחור גם משך זמן לסגירה אוטומטית של אירוע, שמוגדר כברירת מחדל ל-7 ימים.
בשלב האחרון, נותנים שם להתראה ומוסיפים את המסמכים שרוצים לכלול בהתראות.

מומלץ לספק תיעוד, במיוחד אם אתם לא מי שיקבל את ההתראה. הוספת שלבים כמו איפה לבדוק במהלך אירוע ואיך לתעדף ולנפות באגים יכולה לעזור במהלך הפסקה זמנית בשירות. במקרה הצורך, אפשר לעיין במדריך שלנו לפתרון בעיות.
אחרי ששומרים את מדיניות ההתראות, היא מופיעה בקטע Policies (מדיניות) בדף Alerting (התראות).

5. צמצום ההשבתות
אחרי שתגדירו התראות, תקבלו התראות על הפסקות שירות בערוצי ההתראות שסיפקתם, וייווצר רשומה של אירוע בדף 'התראות'.
קבלת התראות
ערוץ ההתראות שסיפקנו ב-codelab הזה היה אימייל. אחרי שתגדירו את ההתראות, סביר להניח שלא תקבלו התראות (לא יהיו הפסקות שירות), אבל אם תקבלו, ההתראה תיראה כך:

שימו לב שההתראה כוללת את הערך שנצפה ועבר את הסף שציינתם, וגם חותמת זמן שמציינת מתי האירוע התחיל.
מעקב אחרי אירועים
בנוסף, כשיקרו אירועים, הם ייספרו בקטע 'אירועים' בדף 'התראות'.

אפשר ללחוץ על האירוע הספציפי כדי לראות את הפרטים לגבי ההפסקה הזמנית בשירות, כמו משך ההפסקה הזמנית בשירות או חומרת ההפסקה הזמנית בשירות.
חשוב לזכור: כשמקבלים התראות, השלב הראשון הכי טוב הוא לבדוק את המדדים, ואז לחפש ביומנים את השגיאות שגורמות להפסקת השירות. ב-codelab Debugging the Smart Home אפשר לקרוא איך עושים את זה.
6. מזל טוב

מעולה! למדתם איך להגדיר התראות באמצעות המדדים שמופיעים בפרויקט, כדי לעקוב אחרי הפסקות שירות באופן אוטומטי ולקבל התראות בזמן שיבושים בשירות.
השלבים הבאים
בהתבסס על Codelab זה, נסו את התרגילים הבאים וחקרו משאבים נוספים:
- אתם יכולים לשלב את מה שלמדתם ב-codelab הזה עם מדדים אחרים שמופיעים בפרויקט. אפשר לראות את הרשימה המלאה של המדדים הזמינים בקטע מדדים נתמכים בדף Monitoring.
- במאמר אפשרויות התראה במסמכי Google Cloud מוסבר על סוגים אחרים של ערוצי התראה.