Google Home Vitals (ระบบคลาวด์)

ชุดแดชบอร์ดและการแจ้งเตือนนี้ช่วยให้คุณรักษาการผสานรวมคุณภาพสูงกับระบบนิเวศของ Google Home ได้อย่างมีประสิทธิภาพ Google มุ่งมั่นที่จะ สนับสนุนพาร์ทเนอร์ในการพัฒนาระบบนิเวศคุณภาพสูงสำหรับลูกค้าทุกราย

แดชบอร์ดมี 3 ส่วน โดยแต่ละส่วนจะครอบคลุมส่วนสำคัญที่มีส่วนช่วยใน คุณภาพของการผสานรวมโดยรวม

  1. เมตริกจาก Google ถึงพาร์ทเนอร์ - วัดความสมบูรณ์ของการเรียกจาก Google ไปยังแบ็กเอนด์ระบบคลาวด์ของคุณ

  2. สถานะของระบบ - เมตริกพาร์ทเนอร์กับ Google - วัดสถานะของการเรียกจากระบบของคุณไปยัง Google

  3. สถานะความสมบูรณ์ของอุปกรณ์ - ความแม่นยำของสถานะ - วัดความแม่นยำของสถานะที่จัดเก็บ ในระบบของ Google ซึ่งใช้เพื่อตอบคำค้นหาของผู้ใช้

เมื่อเมตริกไม่เป็นไปตามค่าเป้าหมาย ระบบจะไฮไลต์เป็นสีแดงเพื่อ ระบุปัญหาที่อาจส่งผลต่อประสบการณ์ของผู้ใช้ ข้อมูลต่อไปนี้ จะให้รายละเอียดเกี่ยวกับเป้าหมายแต่ละรายการและเหตุผลที่เป้าหมายเหล่านั้นมีความสําคัญต่อผู้ใช้

หากปุ่มต่อไปนี้ไม่นำคุณไปยังแดชบอร์ดโดยตรง คุณจะไปที่แดชบอร์ดได้โดยเลือกหน้าภาพรวม เลือกแดชบอร์ด แล้วเลือกแดชบอร์ด Google Home Vitals (ระบบคลาวด์) จากรายการแดชบอร์ดของฉันเพื่อดูแดชบอร์ด

ไปที่แดชบอร์ด

เมตริกจาก Google ถึงพาร์ทเนอร์

เมตริกอัตราความสำเร็จในการค้นหา/ดำเนินการ >= 99.5% จะวัดความถี่ที่ระบบดำเนินการตามคำสั่งของผู้ใช้ได้อย่างถูกต้อง ซึ่งจะช่วยหลีกเลี่ยงการตอบกลับของ Assistant เช่น "ฉันเข้าถึงอุปกรณ์ไม่ได้" หรือการยืนยันคำสั่งที่ไม่ถูกต้องซึ่งไม่ได้ดำเนินการ

"ความสำเร็จ" คืออะไร

ระบบจะทำเครื่องหมายธุรกรรมว่าสำเร็จหากแพลตฟอร์ม Google Home ได้รับการตอบกลับที่ถูกต้องซึ่งระบุว่าดำเนินการตามที่ตั้งใจไว้แล้วหรือดึงข้อมูลสถานะที่ขอแล้ว

การตอบกลับที่มีข้อยกเว้นที่ไม่บล็อก (เช่น สถานะ SUCCESS พร้อมด้วยข้อยกเว้น lowBattery) จะถือเป็นการทำธุรกรรมที่สำเร็จ คำสั่งไปถึงอุปกรณ์และระบบตอบสนองความตั้งใจของผู้ใช้ได้แม้จะมีคำเตือน

"ความล้มเหลว" มีคำจำกัดความว่าอย่างไร

ข้อผิดพลาดที่พบใน รหัสข้อผิดพลาดของแพลตฟอร์มที่พบบ่อย ซึ่งทําเครื่องหมายเป็นพาร์ทเนอร์ดําเนินการได้จะถือเป็น "ความล้มเหลว" เมื่อ คํานวณอัตราความสําเร็จของ QUERY และ EXECUTE นอกจากนี้ ข้อผิดพลาดที่พบ ในข้อผิดพลาดและข้อยกเว้น ยังถือเป็น "ความล้มเหลว" ด้วย โดยมีข้อยกเว้นต่อไปนี้

ข้อยกเว้นที่เกิดจากความล้มเหลว
aboveMaximumLightEffectsDuration armLevelNeeded inOffMode
alreadyArmed bagFull lockedToRange
alreadyAtMax belowMinimumLightEffectsDuration lowBattery
alreadyAtMin binFull maxSpeedReached
alreadyClosed cancelArmingRestricted minSpeedReached
alreadyDisarmed deadBattery notSupported
alreadyDocked degreesOutOfRange ออฟไลน์
alreadyInState deviceJammingDetected percentOutOfRange
alreadyLocked deviceNotMounted rangeTooClose
alreadyOff deviceNotReady remoteSetDisabled
alreadyOn deviceOffline safetyShutOff
alreadyOpen deviceTurnedOff targetAlreadyReached
alreadyPaused discreteOnlyOpenClose tooManyFailedAttempts
alreadyStarted functionNotSupported valueOutOfRange
alreadyStopped inAutoMode
alreadyUnlocked inEcoMode

เมตริกเวลาในการตอบสนองของคำค้นหา/การดำเนินการ (เปอร์เซ็นไทล์ที่ 90) <= 1,000 มิลลิวินาทีจะวัดเวลาในการรอการดำเนินการที่ขอ และช่วยให้มั่นใจว่าผู้ใช้ไม่ต้องรอนานเกินไป เช่น รอไม่กี่วินาทีเพื่อให้ไฟดับ

เมตริกเวลาในการตอบสนอง

เวลาในการตอบสนองเป็นตัวบ่งชี้ที่สำคัญว่าการผสานรวมของคุณตอบสนองต่อ ผู้ใช้ปลายทางได้ดีเพียงใด แดชบอร์ดจะติดตามเวลาในการตอบสนองเปอร์เซ็นไทล์ที่ 90 (P90) ซึ่ง แสดงถึงประสบการณ์ของผู้ใช้ที่ "ช้าที่สุด" (เช่น P90 ที่ 800 มิลลิวินาที หมายความว่าระบบรับทราบคำขอ 90% ในเวลาไม่เกิน 800 มิลลิวินาที)

Google วัดเวลาในการตอบสนองแตกต่างกันสำหรับการตรวจสอบสถานะเทียบกับคำสั่งอุปกรณ์ เพื่อให้มั่นใจในความถูกต้องทางเทคนิค

1. เวลาในการตอบสนองต่อคำค้นหา (คำถาม)

ซึ่งจะวัดเวลาไปกลับของ Cloud-to-cloud เมื่อ Google ถามถึงสถานะปัจจุบันของอุปกรณ์

  • เริ่มต้น: Google ส่งaction.devices.QUERYคำขอไปยัง URL การจัดการคำสั่งซื้อ
  • กรอบเวลาการวัด: เวลาที่ระบบคลาวด์ใช้ในการรับ ประมวลผล และ ส่งการตอบกลับ HTTP แบบเต็มกลับไปยัง Google
  • สิ้นสุด: Google ได้รับและรับทราบเพย์โหลดการตอบกลับสุดท้ายจาก บริการของคุณ

2. เวลาในการตอบสนองของ EXECUTE (การดำเนินการ)

ซึ่งจะวัดเวลาการรับทราบคำสั่งเมื่อ Google ส่งคำขอควบคุมไปยังอุปกรณ์

  • เริ่มต้น: Google ส่งaction.devices.EXECUTEคำขอไปยัง URL การจัดการคำสั่งซื้อ
  • กรอบเวลาการวัดผล: เวลาที่ใช้สำหรับระบบคลาวด์ในการรับคำสั่งและส่งการตอบรับเพื่อรับทราบ
  • สิ้นสุด: Google ได้รับการตอบกลับสถานะ SUCCESS, PENDING หรือ OFFLINE
  • ขอบเขตทางเทคนิค: เมตริกนี้จะวัดเวลา "การรับทราบการตอบกลับ" ระหว่างระบบคลาวด์ของ Google กับระบบคลาวด์ของคุณ โดยจะไม่วัดเวลาที่ฮาร์ดแวร์จริง (เช่น หลอดไฟ) ใช้ในการเปลี่ยนสถานะจริง ให้เสร็จสมบูรณ์ เนื่องจากมักเกี่ยวข้องกับเวลาในการตอบสนองของเครือข่ายที่ทำงานร่วมกันในพื้นที่ที่อยู่นอกเส้นทางจากระบบคลาวด์ไปยังระบบคลาวด์

ตัวเลือกการลดเวลาในการตอบสนอง

คำแนะนำด้านสถาปัตยกรรมสำหรับการกำหนดเส้นทางตามภูมิศาสตร์

หากใช้ IP แบบ Anycast ไม่ได้ เราขอแนะนำทางเลือกอื่นที่คุ้มค่าต่อไปนี้เพื่อให้มั่นใจว่าผู้ใช้จะได้รับการบริการจากศูนย์ข้อมูลระดับภูมิภาคที่อยู่ใกล้ที่สุด

  1. การจัดสรรภาระงานทั่วโลก (GLB)

    ใช้ Global Application Load Balancer แทนการกำหนดเส้นทางแบบคงที่ (พร้อมให้บริการจากผู้ให้บริการระบบคลาวด์รายใหญ่ส่วนใหญ่)

    • วิธีการทำงาน: คุณกำหนดค่าจุดแรกเข้าส่วนกลาง (URL) เพียงจุดเดียวที่อยู่บริเวณขอบของเครือข่าย ตัวจัดสรรภาระงานจะตรวจหาต้นทางทางภูมิศาสตร์ของคำขอจากคลัสเตอร์ Fulfillment ของ Google โดยอัตโนมัติ และกำหนดเส้นทางการรับส่งข้อมูลไปยังแบ็กเอนด์ระดับภูมิภาคที่ใกล้ที่สุดซึ่งทำงานได้ดี

    • ประโยชน์: วิธีนี้จะช่วยให้ทราบประสิทธิภาพของ Anycast โดยมีความซับซ้อนในการกำหนดค่าและต้นทุนที่ต่ำกว่าอย่างมาก

  2. DNS ที่รับรู้ตำแหน่งทางภูมิศาสตร์ (GeoDNS)

    • วิธีการทำงาน: กำหนดค่าผู้ให้บริการ DNS เพื่อแก้ไข URL การดำเนินการตามคำสั่งไปยังที่อยู่ IP ต่างๆ ตามสถานที่ตั้งทางภูมิศาสตร์ของคำค้นหา DNS

    • การติดตั้งใช้งาน: ตรวจสอบว่าผู้ให้บริการ DNS ได้รับการเพิ่มประสิทธิภาพสำหรับจุดขาออกของ Google เมื่อบริการจัดการตามภูมิภาคของ Google (เช่น ในสหรัฐอเมริกา สหภาพยุโรป หรือเอเชีย) แก้ไขโดเมนของคุณ บริการจะได้รับที่อยู่ IP สำหรับศูนย์ข้อมูลในภูมิภาคนั้นๆ

กลยุทธ์การเพิ่มประสิทธิภาพที่เลเยอร์แอปพลิเคชัน

นอกเหนือจากการกำหนดเส้นทางระดับโครงสร้างพื้นฐานแล้ว คุณยังใช้กลยุทธ์ต่อไปนี้ ที่เลเยอร์แอปพลิเคชันเพื่อลดเวลาในการตอบสนองในการประมวลผลคำขอได้ด้วย

  1. วิธีการพร็อกซี "Trampoline"

    หากต้องดูแลศูนย์ข้อมูลหลัก ให้ใช้พร็อกซีเซิร์ฟเวอร์แบบเบาในระดับภูมิภาค (Trampolines) เพื่อจัดการการแฮนด์เชคครั้งแรก

    1. Google จะเข้าถึง URL ทั่วโลกของคุณ

    2. พร็อกซีระดับภูมิภาค (เช่น ฟังก์ชัน Nginx หรือ Lambda แบบเบา) จะรับคำขอ

    3. พร็อกซีจะส่งต่อเพย์โหลดผ่านแกนหลักภายในความเร็วสูงไปยังฐานข้อมูลหลัก

    ประโยชน์: วิธีนี้จะช่วยลดเวลา "TCP แฮนด์เชค" ซึ่งมักเป็นสาเหตุที่ทำให้เกิดเวลาในการตอบสนองที่ยาวนานที่สุดสำหรับคำขอที่ส่งจากระยะไกล

  2. คำแนะนำเกี่ยวกับภูมิภาคของโทเค็นเพื่อการเข้าถึง

    ในระหว่างกระบวนการลิงก์บัญชี (OAuth) ระบบของคุณจะระบุภูมิภาคบ้านของผู้ใช้ได้

    การติดตั้งใช้งาน: เข้ารหัสตัวระบุภูมิภาคใน access_token ที่ออกให้ Google เมื่อ Google ส่งคำขอการดำเนินการตามคำสั่ง เกตเวย์จะตรวจสอบโทเค็นและกำหนดเส้นทางคำขอไปยังคลัสเตอร์ระดับภูมิภาคที่ถูกต้องได้ทันทีโดยไม่ต้องค้นหาในฐานข้อมูล

สถานะของระบบ - เมตริกพาร์ทเนอร์ถึง Google

การรักษาอัตราความสำเร็จ >= 99.5% จะช่วยให้มั่นใจได้ว่าสถานะอุปกรณ์ใน Google Home ถูกต้อง มีการเพิ่มและนำอุปกรณ์ออก มีการทริกเกอร์การทำงานอัตโนมัติ และเหตุการณ์ในประวัติจะปรากฏในแท็บกิจกรรมของGoogle Home app (GHA)

อัตราความสำเร็จจะคำนวณตามรหัสการตอบกลับ HTTP ที่ Google ส่งคืนเมื่อคลาวด์ของคุณพุชการอัปเดตสถานะ เมตริกนี้จะยกเว้นข้อผิดพลาดภายในของ Google จากจำนวนความล้มเหลว เพื่อให้มั่นใจว่าพาร์ทเนอร์จะไม่ถูก ลงโทษเนื่องจากปัญหาโครงสร้างพื้นฐานฝั่ง Google การเรียก API ที่รวมอยู่ในการ คำนวณจะอยู่ใน เอกสารอ้างอิง HomeGraph API

"ความสำเร็จ" คืออะไร

  • 2xx (สำเร็จ): Home Graph ได้รับและประมวลผลการอัปเดตสถานะเรียบร้อยแล้ว

"ความล้มเหลว" มีคำจำกัดความว่าอย่างไร

  • 4xx (ข้อผิดพลาดของพาร์ทเนอร์): ข้อผิดพลาดเหล่านี้แสดงถึงความล้มเหลวและบ่งชี้ถึงปัญหาเกี่ยวกับ คำขอที่ส่งจากระบบคลาวด์ของคุณ รหัสที่ใช้กันโดยทั่วไปมีดังนี้
    • 400 คำขอไม่ถูกต้อง: เซิร์ฟเวอร์ไม่สามารถประมวลผลคำขอเนื่องจากไวยากรณ์ไม่ถูกต้อง สาเหตุที่พบบ่อย ได้แก่ JSON ที่มีรูปแบบไม่ถูกต้องหรือใช้ค่า Null แทนค่า "" สำหรับค่าสตริง
    • 404 ไม่พบ: ไม่พบทรัพยากรที่ขอ โดยปกติแล้ว หมายความว่า Google ไม่พบอุปกรณ์ที่ขอ นอกจากนี้ยังอาจหมายความว่าบัญชีผู้ใช้ ไม่ได้ลิงก์ไว้หรือได้รับ agentUserId ที่ไม่ถูกต้อง ตรวจสอบว่า agentUserId ตรงกับค่าที่ระบุในการตอบกลับ SYNC และคุณจัดการเจตนา DISCONNECT อย่างถูกต้อง
    • 429 ทรัพยากรหมด: การผสานรวมของคุณใช้โควต้าที่จัดสรรไว้เกินแล้ว ดูวิธีการจัดการโควต้าได้ในส่วน "ขั้นตอนที่ 1" ที่อยู่ด้านบนของแดชบอร์ด

ประสิทธิภาพการทำงานของอุปกรณ์ - ความถูกต้องของสถานะ

การมีความแม่นยำของสถานะ >= 99.5% จะช่วยให้มั่นใจได้ว่าผู้ใช้จะเห็นผลลัพธ์ที่ถูกต้องเมื่อดูสถานะอุปกรณ์หรือใช้ฟีเจอร์ AI เช่น ถาม Google Home หากความแม่นยำของสถานะต่ำ การทำงานอัตโนมัติอาจไม่เริ่มทำงาน และรายการประวัติอาจไม่ ปรากฏในแท็บกิจกรรมของGHAในเวลาที่เหมาะสม ดูข้อมูลเพิ่มเติมได้ที่สถานะรายงาน

แดชบอร์ดคุณภาพจะติดตามข้อมูลนี้ทุกชั่วโมงโดยใช้เมตริกที่แตกต่างกัน 2 รายการ ได้แก่ ความถูกต้องโดยรวม และชุดค่าผสมประเภท/ลักษณะที่ต่ำที่สุด

1. องค์ประกอบความแม่นยำ

เมตริกนี้ได้มาจาก "ตัวอย่าง" ที่ Google สามารถยืนยันสถานะที่รายงาน เทียบกับผลลัพธ์ของความตั้งใจที่ทราบ

2. เมตริกแดชบอร์ด (การคำนวณรายชั่วโมง)

แดชบอร์ดจะคำนวณความแม่นยำตามช่วงเวลา 1 ชั่วโมง หากชั่วโมงใดมีตัวอย่างทั้งหมดน้อยกว่า 100 รายการ (S_Total < 100) ระบบจะตั้งค่าความแม่นยำของชั่วโมงนั้นเป็น N/A

มุมมองที่ 1: ความแม่นยำโดยรวม (ค่าเฉลี่ยทั่วโลก)

ซึ่งแสดงถึงความแม่นยำโดยรวมของการผสานรวมในอุปกรณ์ทุกประเภท และลักษณะที่รวมกัน โดยจะแสดงค่าเฉลี่ยแบบถ่วงน้ำหนักของสถานะ ทั้งระบบนิเวศ

  • การคำนวณ: ความแม่นยำของสถานะทั้งหมดในอุปกรณ์ทั้งหมด / สถานะทั้งหมดทั้งหมด ในอุปกรณ์ทั้งหมด

มุมมอง 2: คอมโบประเภท/ลักษณะที่ต่ำที่สุด

ซึ่งจะระบุหมวดหมู่ที่เฉพาะเจาะจงซึ่งไม่น่าเชื่อถือที่สุดในการผสานรวม ซึ่งจะป้องกันไม่ให้อุปกรณ์ที่มีปริมาณสูงซึ่งมีคุณภาพสูงซ่อนอุปกรณ์ที่มีปริมาณต่ำซึ่งมีคุณภาพต่ำ ตัวอย่างเช่น หากคุณมีปริมาณหลอดไฟจำนวนมากที่มีความแม่นยำของสถานะสูงกว่า 99.5% แต่มีปริมาณสวิตช์น้อยที่มีความแม่นยำของสถานะต่ำ แสดงว่าต้องปรับปรุงสวิตช์ที่อาจสูญหายไปในค่าเฉลี่ย

  • การคำนวณ: ความแม่นยำของรัฐ / รัฐทั้งหมดขั้นต่ำสำหรับชุดค่าผสมลักษณะ/อุปกรณ์ทั้งหมด