ชุดแดชบอร์ดและการแจ้งเตือนนี้ช่วยให้คุณรักษาการผสานรวมคุณภาพสูงกับระบบนิเวศของ Google Home ได้อย่างมีประสิทธิภาพ Google มุ่งมั่นที่จะ สนับสนุนพาร์ทเนอร์ในการพัฒนาระบบนิเวศคุณภาพสูงสำหรับลูกค้าทุกราย
แดชบอร์ดมี 3 ส่วน โดยแต่ละส่วนจะครอบคลุมส่วนสำคัญที่มีส่วนช่วยใน คุณภาพของการผสานรวมโดยรวม
เมตริกจาก Google ไปยังพาร์ทเนอร์ - วัดสถานะของการเรียกจาก Google ไปยัง แบ็กเอนด์ระบบคลาวด์ของคุณ
สถานะของระบบ - เมตริกพาร์ทเนอร์กับ Google - วัดสถานะของการโทร จากระบบของคุณไปยัง Google
สถานะความสมบูรณ์ของอุปกรณ์ - ความแม่นยำของสถานะ - วัดความแม่นยำของสถานะที่จัดเก็บ ในระบบของ Google ซึ่งใช้เพื่อแสดงผลการค้นหาของผู้ใช้
เมื่อเมตริกไม่เป็นไปตามค่าเป้าหมาย ระบบจะไฮไลต์เป็นสีแดงเพื่อ ระบุปัญหาที่อาจส่งผลต่อประสบการณ์ของผู้ใช้ ข้อมูลต่อไปนี้ จะให้รายละเอียดเกี่ยวกับเป้าหมายแต่ละรายการและเหตุผลที่เป้าหมายเหล่านั้นมีความสําคัญต่อผู้ใช้
หากปุ่มต่อไปนี้ไม่นำคุณไปยังแดชบอร์ดโดยตรง คุณจะไปที่แดชบอร์ดได้โดยเลือกหน้าภาพรวม เลือกแดชบอร์ด แล้วเลือกแดชบอร์ด Google Home Vitals (ระบบคลาวด์) จากรายการแดชบอร์ดของฉันเพื่อดูแดชบอร์ด
เมตริกจาก Google ถึงพาร์ทเนอร์
เมตริกอัตราความสำเร็จในการค้นหา/ดำเนินการ >= 99.5% จะวัดความถี่ที่ระบบดำเนินการตามคำสั่งของผู้ใช้ได้อย่างถูกต้อง ซึ่งจะช่วยหลีกเลี่ยงการตอบกลับของ Assistant เช่น "ฉันเข้าถึงอุปกรณ์ไม่ได้" หรือการยืนยันคำสั่งที่ไม่ถูกต้องซึ่งไม่ได้ดำเนินการให้
"ความสำเร็จ" คืออะไร
ระบบจะทำเครื่องหมายธุรกรรมว่าสำเร็จหากแพลตฟอร์ม Google Home ได้รับการตอบกลับที่ถูกต้องซึ่งระบุว่าดำเนินการตามที่ตั้งใจไว้แล้วหรือดึงข้อมูลสถานะที่ขอแล้ว
การตอบกลับที่มีข้อยกเว้นที่ไม่บล็อก (เช่น สถานะ SUCCESS
พร้อมด้วยข้อยกเว้น lowBattery) จะถือเป็นการทำธุรกรรมที่สำเร็จ
คำสั่งไปถึงอุปกรณ์แล้วและระบบได้ดำเนินการตามความตั้งใจแม้จะมีคำเตือนก็ตาม
"ความล้มเหลว" คืออะไร
ข้อผิดพลาดที่พบใน รหัสข้อผิดพลาดของแพลตฟอร์มที่พบบ่อย ซึ่งทําเครื่องหมายเป็นพาร์ทเนอร์ดําเนินการได้จะถือเป็น "ความล้มเหลว" เมื่อ คํานวณอัตราความสําเร็จของ QUERY และ EXECUTE
เมตริกเวลาในการตอบสนองของคำค้นหา/การดำเนินการ (เปอร์เซ็นไทล์ที่ 90) <= 1,000 มิลลิวินาทีจะวัดเวลาในการรอการดำเนินการที่ขอ และช่วยให้มั่นใจว่าผู้ใช้ไม่ต้องรอนานเกินไป เช่น รอไม่กี่วินาทีเพื่อให้ไฟดับ
เมตริกเวลาในการตอบสนอง
เวลาในการตอบสนองเป็นตัวบ่งชี้ที่สำคัญว่าการผสานรวมของคุณตอบสนองต่อ ผู้ใช้ปลายทางได้ดีเพียงใด แดชบอร์ดจะติดตามเวลาในการตอบสนองเปอร์เซ็นไทล์ที่ 90 (P90) ซึ่ง แสดงถึงประสบการณ์ของผู้ใช้ที่ "ช้าที่สุด" (เช่น P90 ที่ 800 มิลลิวินาที หมายความว่าระบบรับทราบคำขอ 90% ในเวลาไม่เกิน 800 มิลลิวินาที)
Google วัดเวลาในการตอบสนองแตกต่างกันสำหรับการตรวจสอบสถานะเทียบกับคำสั่งอุปกรณ์ เพื่อ ให้มั่นใจในความถูกต้องทางเทคนิค
1. เวลาในการตอบสนองต่อคำค้นหา (คำถาม)
ซึ่งจะวัดเวลาไปกลับของ Cloud-to-cloud เมื่อ Google ถามถึงสถานะปัจจุบันของอุปกรณ์
- เริ่มต้น: Google ส่ง
action.devices.QUERYคำขอไปยัง URL การจัดการคำสั่งซื้อ - กรอบเวลาการวัดผล: เวลาที่ระบบคลาวด์ใช้ในการรับ ประมวลผล และ ส่งการตอบกลับ HTTP แบบเต็มกลับไปยัง Google
- สิ้นสุด: Google ได้รับและรับทราบเพย์โหลดการตอบกลับสุดท้ายจาก บริการของคุณ
2. เวลาในการตอบสนองของ EXECUTE (การดำเนินการ)
ซึ่งจะวัดเวลาการรับทราบคำสั่งเมื่อ Google ส่งคำขอควบคุมไปยังอุปกรณ์
- เริ่มต้น: Google ส่ง
action.devices.EXECUTEคำขอไปยัง URL การจัดการคำสั่งซื้อ - กรอบเวลาการวัดผล: เวลาที่ใช้สำหรับระบบคลาวด์ในการรับคำสั่งและ ส่งการตอบกลับเพื่อรับทราบ
- สิ้นสุด: Google ได้รับการตอบกลับสถานะ
SUCCESS,PENDINGหรือOFFLINE - ขอบเขตทางเทคนิค: เมตริกนี้จะวัดเวลา "การรับทราบการตอบกลับ" ระหว่างระบบคลาวด์ของ Google กับระบบคลาวด์ของคุณ โดยจะไม่วัดเวลาที่ฮาร์ดแวร์จริง (เช่น หลอดไฟ) ใช้ในการเปลี่ยนสถานะจริง ให้เสร็จสมบูรณ์ เนื่องจากมักเกี่ยวข้องกับเวลาในการตอบสนองของเครือข่าย Mesh ในพื้นที่ที่อยู่นอกเส้นทางจากระบบคลาวด์ไปยังระบบคลาวด์
ตัวเลือกการลดเวลาในการตอบสนอง
คำแนะนำด้านสถาปัตยกรรมสำหรับการกำหนดเส้นทางตามภูมิศาสตร์
หากใช้ IP แบบ Anycast ไม่ได้ เราขอแนะนำทางเลือกอื่นที่คุ้มค่าใช้จ่ายต่อไปนี้เพื่อให้มั่นใจว่าผู้ใช้จะได้รับการบริการจากศูนย์ข้อมูลระดับภูมิภาคที่ใกล้ที่สุด
การจัดสรรภาระงานทั่วโลก (GLB)
ใช้ Global Application Load Balancer แทนการกำหนดเส้นทางแบบคงที่ (พร้อมให้บริการจากผู้ให้บริการระบบคลาวด์รายใหญ่ส่วนใหญ่)
วิธีการทำงาน: คุณกำหนดค่าจุดแรกเข้าส่วนกลาง (URL) เพียงจุดเดียวที่ อยู่บริเวณขอบของเครือข่าย ตัวจัดสรรภาระงานจะตรวจหาต้นทางทางภูมิศาสตร์ของคำขอจากคลัสเตอร์การปฏิบัติตามคำสั่งของ Google โดยอัตโนมัติ และกำหนดเส้นทางการรับส่งข้อมูลไปยังแบ็กเอนด์ระดับภูมิภาคที่ใกล้ที่สุดซึ่งทำงานได้ดี
ประโยชน์: วิธีนี้จะช่วยให้ทราบประสิทธิภาพของ Anycast โดยมีความซับซ้อนในการกำหนดค่าและค่าใช้จ่ายที่ต่ำกว่าอย่างมาก
DNS ที่รับรู้ตำแหน่งทางภูมิศาสตร์ (GeoDNS)
วิธีการทำงาน: กำหนดค่าผู้ให้บริการ DNS เพื่อแก้ไข URL การดำเนินการตามคำสั่งไปยังที่อยู่ IP ต่างๆ ตามตำแหน่งทางภูมิศาสตร์ของคำค้นหา DNS
การติดตั้งใช้งาน: ตรวจสอบว่าผู้ให้บริการ DNS ได้รับการเพิ่มประสิทธิภาพสำหรับจุดขาออกของ Google เมื่อบริการจัดการตามภูมิภาคของ Google (เช่น ในสหรัฐอเมริกา สหภาพยุโรป หรือเอเชีย) แก้ไขโดเมนของคุณ บริการจะได้รับที่อยู่ IP สำหรับศูนย์ข้อมูลในภูมิภาคนั้นๆ
กลยุทธ์การเพิ่มประสิทธิภาพที่เลเยอร์แอปพลิเคชัน
นอกเหนือจากการกำหนดเส้นทางระดับโครงสร้างพื้นฐานแล้ว คุณยังใช้กลยุทธ์ต่อไปนี้ ที่เลเยอร์แอปพลิเคชันเพื่อลดเวลาในการตอบสนองในการประมวลผลคำขอได้ด้วย
วิธีการพร็อกซี "Trampoline"
หากต้องดูแลศูนย์ข้อมูลหลัก ให้ใช้พร็อกซีเซิร์ฟเวอร์แบบเบาในระดับภูมิภาค (Trampolines) เพื่อจัดการการแฮนด์เชคครั้งแรก
Google จะเข้าถึง URL ทั่วโลกของคุณ
พร็อกซีระดับภูมิภาค (เช่น ฟังก์ชัน Nginx หรือ Lambda แบบเบา) จะรับคำขอ
พร็อกซีจะส่งต่อเพย์โหลดผ่านแบ็กโบนภายในความเร็วสูงไปยังฐานข้อมูลหลัก
ประโยชน์: วิธีนี้จะช่วยลดเวลา "TCP Handshake" ซึ่งมักเป็นสาเหตุหลักที่ทำให้เกิดเวลาในการตอบสนองสำหรับคำขอระยะไกล
คำแนะนำเกี่ยวกับภูมิภาคของโทเค็นเพื่อการเข้าถึง
ในระหว่างกระบวนการลิงก์บัญชี (OAuth) ระบบของคุณจะระบุภูมิภาคบ้านของผู้ใช้ได้
การติดตั้งใช้งาน: เข้ารหัสตัวระบุภูมิภาคใน
access_tokenที่ออกให้ Google เมื่อ Google ส่งคำขอการดำเนินการตามคำสั่ง เกตเวย์จะ ตรวจสอบโทเค็นและกำหนดเส้นทางคำขอไปยังคลัสเตอร์ระดับภูมิภาคที่ถูกต้องได้ทันที โดยไม่ต้องค้นหาในฐานข้อมูล
สถานะของระบบ - เมตริกพาร์ทเนอร์กับ Google
การรักษาอัตราความสำเร็จ >= 99.5% จะช่วยให้มั่นใจได้ว่าสถานะอุปกรณ์ใน Google Home ถูกต้อง มีการเพิ่มและนำอุปกรณ์ออก มีการทริกเกอร์การทำงานอัตโนมัติ และเหตุการณ์ในประวัติจะปรากฏในแท็บกิจกรรมของGoogle Home app (GHA)
อัตราความสำเร็จจะคำนวณตามรหัสการตอบกลับ HTTP ที่ Google ส่งคืนเมื่อคลาวด์พุชการอัปเดตสถานะ เมตริกนี้จะยกเว้นข้อผิดพลาดภายในของ Google จากจำนวนความล้มเหลวเพื่อให้มั่นใจว่าพาร์ทเนอร์จะไม่ถูก ลงโทษเนื่องจากปัญหาโครงสร้างพื้นฐานฝั่ง Google การเรียก API ที่รวมอยู่ในการคำนวณ จะอยู่ในเอกสารอ้างอิง HomeGraph API
"ความสำเร็จ" คืออะไร
- 2xx (สำเร็จ): Home Graph ได้รับและประมวลผลการอัปเดตสถานะเรียบร้อยแล้ว
"ความล้มเหลว" คืออะไร
- 4xx (ข้อผิดพลาดของพาร์ทเนอร์): ข้อผิดพลาดเหล่านี้แสดงถึงความล้มเหลวและบ่งชี้ถึงปัญหาเกี่ยวกับ
คำขอที่ส่งจากระบบคลาวด์ของคุณ รหัสที่ใช้กันโดยทั่วไปมีดังนี้
- 400 คำขอไม่ถูกต้อง: เซิร์ฟเวอร์ประมวลผลคำขอไม่ได้เนื่องจาก ไวยากรณ์ไม่ถูกต้อง สาเหตุที่พบบ่อย ได้แก่ JSON ที่มีรูปแบบไม่ถูกต้องหรือใช้ค่า Null แทนค่าสตริง ""
- 404 ไม่พบ: ไม่พบทรัพยากรที่ขอ โดยปกติแล้ว ข้อความนี้
หมายความว่า Google ไม่พบอุปกรณ์ที่ขอ นอกจากนี้ยังอาจหมายความว่าบัญชีผู้ใช้ไม่ได้ลิงก์ไว้หรือได้รับ
agentUserIdที่ไม่ถูกต้อง ตรวจสอบว่าagentUserIdตรงกับค่าที่ระบุในการตอบกลับ SYNC และคุณจัดการเจตนาDISCONNECTอย่างถูกต้อง - 429 ทรัพยากรหมด: การผสานรวมของคุณใช้โควต้าที่จัดสรรไว้เกินแล้ว ดูวิธีการจัดการโควต้าได้ในส่วน "ขั้นตอนที่ 1" ที่อยู่ด้านบนของแดชบอร์ด
ประสิทธิภาพการทำงานของอุปกรณ์ - ความแม่นยำของสถานะ
การมีความแม่นยำของสถานะ >= 99.5% จะช่วยให้มั่นใจได้ว่าผู้ใช้จะเห็นผลลัพธ์ที่ถูกต้องเมื่อดูสถานะอุปกรณ์หรือใช้ฟีเจอร์ AI เช่น ถาม Home หากความแม่นยำของสถานะต่ำ การทำงานอัตโนมัติอาจไม่เริ่มทำงาน และรายการประวัติอาจไม่ ปรากฏในแท็บกิจกรรมของ GHA ในเวลาที่เหมาะสม ดูข้อมูลเพิ่มเติมได้ที่สถานะรายงาน
แดชบอร์ดคุณภาพจะติดตามข้อมูลนี้ทุกชั่วโมงโดยใช้เมตริกที่แตกต่างกัน 2 รายการ ได้แก่ ความถูกต้องโดยรวม และชุดค่าผสมประเภท/ลักษณะที่ต่ำที่สุด
1. องค์ประกอบความแม่นยำ
เมตริกนี้ได้มาจาก "ตัวอย่าง" ที่ Google สามารถยืนยันสถานะที่รายงานกับผลลัพธ์ของความตั้งใจที่ทราบ
2. เมตริกแดชบอร์ด (การคำนวณรายชั่วโมง)
แดชบอร์ดจะคำนวณความแม่นยำตามช่วงเวลา 1 ชั่วโมง หากชั่วโมงใดมีตัวอย่างรวมน้อยกว่า 100 รายการ (S_Total < 100) ความแม่นยำของชั่วโมงนั้นจะตั้งค่าเป็น N/A
มุมมองที่ 1: ความแม่นยำโดยรวม (ค่าเฉลี่ยทั่วโลก)
ซึ่งแสดงถึงความแม่นยำโดยรวมของการผสานรวมในอุปกรณ์ทุกประเภท และลักษณะที่รวมกัน โดยจะแสดงค่าเฉลี่ยถ่วงน้ำหนักของสถานะ ทั้งระบบนิเวศ
- การคำนวณ: ความแม่นยำของสถานะทั้งหมดในอุปกรณ์ทั้งหมด / สถานะทั้งหมดทั้งหมด ในอุปกรณ์ทั้งหมด
มุมมอง 2: ค่าผสมประเภท/ลักษณะที่ต่ำที่สุด
ซึ่งจะระบุหมวดหมู่ที่เฉพาะเจาะจงซึ่งไม่น่าเชื่อถือที่สุดในการผสานรวม ซึ่งจะป้องกันไม่ให้อุปกรณ์ที่มีปริมาณสูงซึ่งมีคุณภาพสูงซ่อนอุปกรณ์ที่มีปริมาณต่ำซึ่งมีคุณภาพต่ำ ตัวอย่างเช่น หากคุณมีปริมาณหลอดไฟสูงที่มีความแม่นยำของสถานะสูงกว่า 99.5% แต่มีปริมาณสวิตช์ต่ำที่มีความแม่นยำของสถานะต่ำ แสดงว่าต้องปรับปรุงสวิตช์ที่อาจสูญหายไปในค่าเฉลี่ย
- การคำนวณ: ความแม่นยำของรัฐ / รัฐทั้งหมดขั้นต่ำสำหรับชุดค่าผสมลักษณะ/อุปกรณ์ทั้งหมด