ชุดแดชบอร์ดและการแจ้งเตือนนี้ช่วยให้คุณรักษาการผสานรวมกับระบบนิเวศของ Google Home ให้มีคุณภาพสูงได้อย่างเชิงรุก Google มุ่งมั่นที่จะสนับสนุนพาร์ทเนอร์ในการพัฒนาระบบนิเวศคุณภาพสูงสำหรับลูกค้าทุกคน
แดชบอร์ดมี 3 ส่วน โดยแต่ละส่วนครอบคลุมส่วนสำคัญที่มีส่วนช่วยให้การผสานรวมโดยรวมมีคุณภาพ
เมตริกจาก Google ไปยังพาร์ทเนอร์ - วัดประสิทธิภาพการเรียกจาก Google ไปยัง แบ็กเอนด์ระบบคลาวด์ของคุณ
ประสิทธิภาพของระบบ - เมตริกจากพาร์ทเนอร์ไปยัง Google - วัดประสิทธิภาพการเรียก จากระบบของคุณไปยัง Google
ประสิทธิภาพของอุปกรณ์ - ความแม่นยำของสถานะ - วัดความแม่นยำของสถานะที่จัดเก็บไว้ ในระบบของ Google ซึ่งใช้เพื่อแสดงผลการค้นหาของผู้ใช้
เมื่อเมตริกไม่เป็นไปตามค่าเป้าหมาย ระบบจะไฮไลต์เมตริกเป็นสีแดงเพื่อระบุปัญหาที่อาจส่งผลต่อประสบการณ์ของผู้ใช้ ข้อมูลต่อไปนี้จะให้รายละเอียดเกี่ยวกับเป้าหมายแต่ละรายการและเหตุผลที่เป้าหมายเหล่านั้นมีความสำคัญต่อผู้ใช้
หากปุ่มต่อไปนี้ไม่นำคุณไปยังแดชบอร์ดโดยตรง คุณสามารถไปที่แดชบอร์ดได้โดยเลือกหน้าภาพรวม เลือกแดชบอร์ด แล้วเลือก แดชบอร์ด Google Home Vitals (Cloud) จากรายการแดชบอร์ดของฉัน เพื่อดูแดชบอร์ด
เมตริกจาก Google ไปยังพาร์ทเนอร์
เมตริกอัตราความสำเร็จในการค้นหา/ดำเนินการ >= 99.5% จะวัดความถี่ที่ระบบดำเนินการตามคำสั่งของผู้ใช้ได้อย่างถูกต้อง ซึ่งช่วยหลีกเลี่ยงการตอบกลับของ Assistant เช่น "ฉันเข้าถึงอุปกรณ์ไม่ได้" หรือการยืนยันคำสั่งที่ไม่ได้ดำเนินการอย่างไม่ถูกต้อง
อะไรคือตัวกำหนด "ความสำเร็จ"
ระบบจะทำเครื่องหมายธุรกรรมว่าสำเร็จหากแพลตฟอร์ม Google Home ได้รับการตอบกลับที่ถูกต้องซึ่งระบุว่ามีการดำเนินการตามที่ต้องการหรือมีการดึงข้อมูลสถานะที่ขอ
การตอบกลับที่มีข้อยกเว้นที่ไม่บล็อก (เช่น สถานะ SUCCESS พร้อมด้วยข้อยกเว้น lowBattery) จะนับเป็นธุรกรรมที่สำเร็จ
คำสั่งไปถึงอุปกรณ์และระบบดำเนินการตามความตั้งใจของผู้ใช้ได้แม้จะมีคำเตือน
อะไรคือตัวกำหนด "ความล้มเหลว"
ข้อผิดพลาดที่พบใน รหัสข้อผิดพลาดของแพลตฟอร์มทั่วไป ซึ่งทำเครื่องหมายเป็น พาร์ทเนอร์ดำเนินการได้ จะถือเป็น "ความล้มเหลว" เมื่อ คำนวณอัตราความสำเร็จในการค้นหาและดำเนินการ นอกจากนี้ ข้อผิดพลาดที่พบ ใน ข้อผิดพลาดและข้อยกเว้น จะถือเป็น "ความล้มเหลว" ด้วย ยกเว้นกรณีต่อไปนี้
| ข้อยกเว้นของความล้มเหลว | ||
|---|---|---|
| aboveMaximumLightEffectsDuration | armLevelNeeded | inOffMode |
| alreadyArmed | bagFull | lockedToRange |
| alreadyAtMax | belowMinimumLightEffectsDuration | lowBattery |
| alreadyAtMin | binFull | maxSpeedReached |
| alreadyClosed | cancelArmingRestricted | minSpeedReached |
| alreadyDisarmed | deadBattery | notSupported |
| alreadyDocked | degreesOutOfRange | offline |
| alreadyInState | deviceJammingDetected | percentOutOfRange |
| alreadyLocked | deviceNotMounted | rangeTooClose |
| alreadyOff | deviceNotReady | remoteSetDisabled |
| alreadyOn | deviceOffline | safetyShutOff |
| alreadyOpen | deviceTurnedOff | targetAlreadyReached |
| alreadyPaused | discreteOnlyOpenClose | tooManyFailedAttempts |
| alreadyStarted | functionNotSupported | valueOutOfRange |
| alreadyStopped | inAutoMode | |
| alreadyUnlocked | inEcoMode |
เมตริกเวลาในการตอบสนองต่อการค้นหา/ดำเนินการ (p90) <= 1000 มิลลิวินาที จะวัดเวลารอการดำเนินการที่ขอและช่วยให้มั่นใจว่าผู้ใช้ไม่ต้องรอนานเกินไป เช่น รอไม่กี่วินาทีเพื่อให้ไฟดับ
เมตริกเวลาในการตอบสนอง
เวลาในการตอบสนองเป็นตัวบ่งชี้ที่สำคัญว่าการผสานรวมของคุณตอบสนองต่อผู้ใช้ปลายทางได้ดีเพียงใด แดชบอร์ดจะติดตามเวลาในการตอบสนองเปอร์เซ็นไทล์ที่ 90 (P90) ซึ่งแสดงถึงประสบการณ์ของผู้ใช้ที่ "ช้าที่สุด" (เช่น P90 ที่ 800 มิลลิวินาทีหมายความว่า 90% ของคำขอได้รับการตอบกลับภายใน 800 มิลลิวินาทีหรือน้อยกว่า)
Google วัดเวลาในการตอบสนองแตกต่างกันสำหรับการตรวจสอบสถานะเทียบกับคำสั่งอุปกรณ์เพื่อให้มั่นใจในความถูกต้องทางเทคนิค
1. เวลาในการตอบสนองต่อการค้นหา (คำถาม)
เมตริกนี้จะวัดเวลาไปกลับแบบ Cloud-to-cloud เมื่อ Google ขอสถานะปัจจุบันของอุปกรณ์
- เริ่มต้น: Google ส่งคำขอ
action.devices.QUERYไปยัง URL การดำเนินการ - กรอบเวลาการวัด: เวลาที่คลาวด์ใช้ในการรับ ประมวลผล และส่งการตอบกลับ HTTP แบบเต็มกลับไปยัง Google
- สิ้นสุด: Google ได้รับและตอบกลับเพย์โหลดการตอบกลับสุดท้ายจากบริการของคุณ
2. เวลาในการตอบสนองต่อการดำเนินการ (การดำเนินการ)
เมตริกนี้จะวัดเวลาตอบกลับคำสั่งเมื่อ Google ส่งคำขอควบคุมไปยังอุปกรณ์
- เริ่มต้น: Google ส่งคำขอ
action.devices.EXECUTEไปยัง URL การดำเนินการ - กรอบเวลาการวัด: เวลาที่คลาวด์ใช้ในการรับคำสั่งและส่งการตอบกลับการตอบรับ
- สิ้นสุด: Google ได้รับการตอบกลับสถานะ
SUCCESS,PENDINGหรือOFFLINE - ขอบเขตทางเทคนิค: เมตริกนี้จะวัดเวลา "การตอบกลับการตอบรับ" ระหว่างคลาวด์ของ Google กับคลาวด์ของคุณ โดยจะไม่วัดเวลาที่ฮาร์ดแวร์จริง (เช่น หลอดไฟ) ใช้ในการเปลี่ยนสถานะทางกายภาพให้เสร็จสมบูรณ์ เนื่องจากมักเกี่ยวข้องกับเวลาในการตอบสนองของเครือข่ายที่ทำงานร่วมกันในพื้นที่นอกเส้นทางแบบคลาวด์ต่อคลาวด์
ตัวเลือกการลดเวลาในการตอบสนอง
คำแนะนำด้านสถาปัตยกรรมสำหรับการกำหนดเส้นทางตามภูมิศาสตร์
หากการใช้งาน IP แบบ Anycast เป็นไปไม่ได้ เราขอแนะนำทางเลือกที่มีประสิทธิภาพด้านต้นทุนต่อไปนี้เพื่อให้มั่นใจว่าผู้ใช้จะได้รับบริการจากศูนย์ข้อมูลระดับภูมิภาคที่ใกล้ที่สุด
การจัดสรรภาระงานทั่วโลก (GLB)
ใช้ Global Application Load Balancer (มีให้บริการจากผู้ให้บริการระบบคลาวด์รายใหญ่ส่วนใหญ่) แทนการกำหนดเส้นทางแบบคงที่
วิธีการทำงาน: คุณกำหนดค่าจุดแรกเข้าส่วนกลาง (URL) เพียงจุดเดียวที่อยู่บริเวณขอบเครือข่าย ตัวจัดสรรภาระงานจะตรวจหาแหล่งที่มาทางภูมิศาสตร์ของคำขอจากคลัสเตอร์การดำเนินการของ Google โดยอัตโนมัติ และกำหนดเส้นทางการเข้าชมไปยังแบ็กเอนด์ระดับภูมิภาคที่ใช้งานได้ใกล้ที่สุด
ข้อดี: วิธีนี้ให้ประสิทธิภาพของ Anycast โดยมีความซับซ้อนและค่าใช้จ่ายในการกำหนดค่าที่ต่ำกว่าอย่างมาก
DNS ที่รับรู้ตำแหน่งทางภูมิศาสตร์ (GeoDNS)
วิธีการทำงาน: กำหนดค่าผู้ให้บริการ DNS ให้แปลง URL การดำเนินการเป็นที่อยู่ IP ที่แตกต่างกันตามสถานที่ตั้งทางภูมิศาสตร์ของคำขอ DNS
การใช้งาน: ตรวจสอบว่าผู้ให้บริการ DNS ได้รับการเพิ่มประสิทธิภาพสำหรับจุดขาออกของ Google เมื่อบริการการดำเนินการระดับภูมิภาคของ Google (เช่น ในสหรัฐอเมริกา สหภาพยุโรป หรือเอเชีย) แปลโดเมนของคุณ ระบบจะได้รับที่อยู่ IP สำหรับศูนย์ข้อมูลในภูมิภาคนั้นๆ
กลยุทธ์การเพิ่มประสิทธิภาพที่เลเยอร์แอปพลิเคชัน
นอกเหนือจากการกำหนดเส้นทางระดับโครงสร้างพื้นฐานแล้ว คุณยังสามารถใช้กลยุทธ์ต่อไปนี้ที่เลเยอร์แอปพลิเคชันเพื่อลดเวลาในการตอบสนองในการประมวลผลคำขอ
วิธีการพร็อกซีแบบ "Trampoline"
หากคุณต้องดูแลศูนย์ข้อมูลหลัก ให้ใช้เซิร์ฟเวอร์พร็อกซีแบบเบา (Trampoline) ระดับภูมิภาคเพื่อจัดการการเริ่มต้นการเชื่อมต่อ
Google เข้าถึง URL ส่วนกลางของคุณ
พร็อกซีระดับภูมิภาค (เช่น ฟังก์ชัน Nginx หรือ Lambda แบบเบา) ได้รับคำขอ
พร็อกซีส่งต่อเพย์โหลดผ่านแบ็กโบนภายในความเร็วสูงไปยังฐานข้อมูลหลัก
ข้อดี: วิธีนี้ช่วยลดเวลา "การเริ่มต้นการเชื่อมต่อ TCP" ซึ่งมักเป็นปัจจัยที่ทำให้เกิดเวลาในการตอบสนองมากที่สุดสำหรับคำขอระยะไกล
คำแนะนำเกี่ยวกับภูมิภาคของโทเค็นเพื่อการเข้าถึง
ในระหว่างกระบวนการลิงก์บัญชี (OAuth) ระบบของคุณจะระบุภูมิภาคบ้านของผู้ใช้ได้
การใช้งาน: เข้ารหัสตัวระบุภูมิภาคลงใน
access_tokenที่ออกให้กับ Google เมื่อ Google ส่งคำขอการดำเนินการ เกตเวย์ของคุณจะตรวจสอบโทเค็นและกำหนดเส้นทางคำขอไปยังคลัสเตอร์ระดับภูมิภาคที่ถูกต้องได้ทันทีโดยไม่ต้องค้นหาฐานข้อมูล
ประสิทธิภาพของระบบ - เมตริกจากพาร์ทเนอร์ไปยัง Google
การรักษาอัตราความสำเร็จ >= 99.5% ช่วยให้มั่นใจว่าสถานะอุปกรณ์ถูกต้องใน Google Home, มีการเพิ่มและนำอุปกรณ์ออก, ระบบอัตโนมัติทำงาน, และเหตุการณ์ในประวัติปรากฏในแท็บกิจกรรมของGoogle Home app (GHA)
ระบบจะคำนวณอัตราความสำเร็จตามรหัสการตอบกลับ HTTP ที่ Google ส่งคืนเมื่อคลาวด์ของคุณส่งการอัปเดตสถานะ เมตริกจะยกเว้นข้อผิดพลาดภายในของ Google จากจำนวนความล้มเหลวเพื่อไม่ให้พาร์ทเนอร์ถูกลงโทษเนื่องจากปัญหาโครงสร้างพื้นฐานฝั่ง Google การเรียก API ที่รวมอยู่ในการ คำนวณจะอยู่ใน เอกสารอ้างอิง HomeGraph API
อะไรคือตัวกำหนด "ความสำเร็จ"
- 2xx (สำเร็จ): Home Graph ได้รับและประมวลผลการอัปเดตสถานะเรียบร้อยแล้ว
อะไรคือตัวกำหนด "ความล้มเหลว"
- 4xx (ข้อผิดพลาดของพาร์ทเนอร์): ข้อผิดพลาดเหล่านี้แสดงถึงความล้มเหลวและบ่งบอกถึงปัญหาเกี่ยวกับคำขอที่ส่งจากคลาวด์ของคุณ รหัสที่พบบ่อย ได้แก่
- 400 คำขอไม่ถูกต้อง: เซิร์ฟเวอร์ไม่สามารถประมวลผลคำขอเนื่องจากไวยากรณ์ไม่ถูกต้อง สาเหตุที่พบบ่อย ได้แก่ JSON มีรูปแบบไม่ถูกต้องหรือใช้ค่า Null แทน "" สำหรับค่าสตริง
- 404 ไม่พบ: ไม่พบทรัพยากรที่ขอ โดยปกติแล้วข้อผิดพลาดนี้หมายความว่า Google ไม่พบอุปกรณ์ที่ขอ นอกจากนี้ยังอาจหมายความว่าบัญชีผู้ใช้ไม่ได้ลิงก์หรือได้รับ
agentUserIdไม่ถูกต้อง ตรวจสอบว่าagentUserIdตรงกับค่าที่ระบุในการตอบกลับ SYNC และคุณจัดการ IntentDISCONNECTอย่างเหมาะสม - 429 ทรัพยากรหมด: การผสานรวมของคุณใช้โควต้าที่จัดสรรไว้เกิน ดูวิธีการในส่วน "ขั้นตอนที่ 1" ที่อยู่สูงขึ้นในแดชบอร์ดสำหรับการจัดการโควต้า
ประสิทธิภาพของอุปกรณ์ - ความแม่นยำของสถานะ
การมีความแม่นยำของสถานะ >= 99.5% หรือสูงกว่าจะช่วยให้ผู้ใช้เห็นผลลัพธ์ที่ถูกต้องเมื่อดูสถานะอุปกรณ์หรือใช้ฟีเจอร์ AI เช่น ถาม Google Home หากความแม่นยำของสถานะต่ำ ระบบอัตโนมัติอาจไม่ทำงานและรายการประวัติอาจไม่ ปรากฏในแท็บกิจกรรมของ GHA ในเวลาที่ถูกต้อง ดูข้อมูลเพิ่มเติมได้ที่ รายงานสถานะ
แดชบอร์ดคุณภาพจะติดตามข้อมูลนี้ทุกชั่วโมงโดยใช้เมตริก 2 รายการที่แตกต่างกัน ได้แก่ ความแม่นยำโดยรวม และการผสมผสานประเภท/ลักษณะที่ต่ำที่สุด
1. คอมโพเนนต์ความแม่นยำ
เมตริกนี้ได้มาจาก "ตัวอย่าง" ที่ Google สามารถยืนยันสถานะที่รายงานกับผลลัพธ์ Intent ที่ทราบ
2. เมตริกแดชบอร์ด (การคำนวณรายชั่วโมง)
แดชบอร์ดจะคำนวณความแม่นยำตามช่วงเวลา 1 ชั่วโมง หากชั่วโมงใดมีตัวอย่างทั้งหมดน้อยกว่า 100 รายการ (S_Total < 100) ระบบจะตั้งค่าความแม่นยำสำหรับชั่วโมงนั้นเป็น N/A
มุมมองที่ 1: ความแม่นยำโดยรวม (ค่าเฉลี่ยทั่วโลก)
เมตริกนี้แสดงถึงความแม่นยำทั้งหมดของการผสานรวมในอุปกรณ์ทุกประเภทและลักษณะที่รวมกัน โดยจะแสดงค่าเฉลี่ยถ่วงน้ำหนักของประสิทธิภาพของระบบนิเวศทั้งหมด
- การคำนวณ: ความแม่นยำของสถานะทั้งหมดในอุปกรณ์ทุกเครื่อง / สถานะทั้งหมด ในอุปกรณ์ทุกเครื่อง
มุมมองที่ 2: การผสมผสานประเภท/ลักษณะที่ต่ำที่สุด
เมตริกนี้จะระบุหมวดหมู่ที่เฉพาะเจาะจงซึ่งเชื่อถือได้น้อยที่สุดในการผสานรวม และป้องกันไม่ให้อุปกรณ์ที่มีปริมาณมากซึ่งมีคุณภาพสูงซ่อนอุปกรณ์ที่มีปริมาณน้อยซึ่งมีคุณภาพต่ำ ตัวอย่างเช่น หากคุณมีไฟจำนวนมากที่มีความแม่นยำของสถานะสูงกว่า 99.5% แต่มีสวิตช์จำนวนน้อยที่มีความแม่นยำของสถานะต่ำ เมตริกนี้จะไฮไลต์การปรับปรุงที่จำเป็นสำหรับสวิตช์ซึ่งอาจไม่ปรากฏในค่าเฉลี่ย
- การคำนวณ: ค่าต่ำสุดของความแม่นยำของสถานะ / สถานะทั้งหมดสำหรับการผสมผสานลักษณะ/อุปกรณ์ ทั้งหมด