โครงสร้างพื้นฐาน NVIDIA GB200 NVL72 และการเดินสาย MPO-8 APC สำหรับหน่วยปรับขนาดได้ (Scalable Units)
เจาะลึกสถาปัตยกรรมการเดินสายของ Blackwell Scalable Unit (SU) ที่ 8 แร็คเชื่อมต่อกันด้วยสายใยแก้วนำแสงที่ใช้งานอยู่ 9,216 เส้น
DGX GB200 Scalable Unit (SU) แสดงถึงการเปลี่ยนแปลงครั้งสำคัญในสถาปัตยกรรมศูนย์ข้อมูล SU เป็นหน่วยประมวลผล 576-GPU ที่รวมเข้าด้วยกันและเชื่อมต่อกันด้วยสายใยแก้วนำแสงที่ใช้งานอยู่ 9,216 เส้น ScaleFibre นำเสนอสายหลักที่สิ้นสุดปลายสายอย่างแม่นยำ ซึ่งจำเป็นต่อการจัดการความหนาแน่นนี้
โครงสร้างเครือข่าย SuperPOD ทางกายภาพ 4 แบบ
NVIDIA แบ่ง SU ออกเป็นชั้นทางกายภาพที่แตกต่างกันเพื่อแยกทราฟฟิก GPU
MN-NVL (NVLink 5)
ขยายในแนวตั้ง (Scale-Up)เครือข่าย ‘ภายใน’ แร็คที่เชื่อมต่อ GPU 72 ตัวด้วยความเร็ว 1.8 TB/s
- ไม่มีใยแก้วนำแสง
- แบ็คเพลนทองแดงแบบพาสซีฟ
- คอนเนคเตอร์แบบ Blind-mate
InfiniBand สำหรับการประมวลผล
ขยายในแนวนอน (Scale-Out)โครงสร้างเครือข่าย ‘East-West’ หลักสำหรับการฝึกอบรมหลายโหนดขนาดใหญ่
- ใยแก้วนำแสงที่ใช้งานอยู่ 4,608 เส้นต่อ SU
- โทโพโลยีที่ปรับให้เหมาะสมกับราง
- Quantum-3/Quantum-2
พื้นที่จัดเก็บและ In-Band
ส่วนหน้าโครงสร้างเครือข่ายแบบ Ethernet สำหรับการนำเข้าข้อมูลและการจัดเตรียมที่ความเร็วสูง
- ปัจจัยการบล็อก 5:3
- BlueField-3 DPU offload
- รองรับ VXLAN/RoCE
การจัดการ OOB (Out-of-Band)
ระนาบควบคุมเครือข่ายแยกสำหรับระบบ Telemetry ของฮาร์ดแวร์, BMC และการจัดการ PDU
- RJ45/Cat6 ทองแดง
- สวิตช์ระดับ SN2201
- ความปลอดภัยแบบ Physical air-gap
เมตริก SU ระดับ Exascale
Scalable Unit (SU) 8 แร็คแสดงถึงองค์ประกอบพื้นฐานของ NVIDIA AI Factory
9,216
ใยแก้วนำแสงที่ใช้งานต่อ SU4,608
สายใยแก้วนำแสงสำหรับการประมวลผลเท่านั้น5:3
อัตราส่วนการบล็อกของพื้นที่จัดเก็บ400G/800G
ความเร็วพอร์ตพื้นฐานการเชื่อมต่อ SU สามระดับ
ระดับ A: เซิร์ฟเวอร์ไปยังลีฟสวิตช์
ใยแก้วนำแสง 1,152 เส้นต่อแร็ค โดยใช้สายหลักใยแก้วนำแสงจำนวนมากหรือสายจัมเปอร์เพื่อเชื่อมต่อโหนด NVL72 กับลีฟสวิตช์
ระดับ B: ลีฟสวิตช์ไปยังสไปน์สวิตช์
การรวมทราฟฟิกที่จัดแนวรางภายใน SU โดยใช้ลิงก์แบบ 1:1 ที่ไม่บล็อกสำหรับการประมวลผล
ระดับ C: สไปน์สวิตช์ไปยังคอร์สวิตช์
การขยายขนาดเกินกว่า SU ไปยังพื้นที่คอร์ส่วนกลางโดยใช้สายหลักจำนวนมาก
การเชื่อมต่อแบบดั้งเดิม (Point-to-Point)
- ✕ความซับซ้อนด้วยมือ: ต้องใช้สายแพทช์เดี่ยว 9,216 เส้นต่อบล็อก 8 แร็ค
- ✕การอุดตันของกระแสลม: ชุดสายเคเบิลหนาแน่นขัดขวางทางออกของระบบระบายความร้อนด้วยของเหลว
- ✕โปรไฟล์ความเสี่ยง: มีโอกาสสูงที่จะเกิด ‘การเชื่อมต่อผิดพลาด’ ระหว่างการแพทช์แบบ 1:1 ด้วยมือ
- ✕เวลาในการติดตั้ง: มากกว่า 115 ชั่วโมงสำหรับการเดินสายและการติดฉลากด้วยมือต่อ SU
การเดินสายหลักแบบโมดูลาร์ใยแก้วนำแสงจำนวนมาก
- ✓Plug-and-Play: รวมใยแก้วนำแสงหลายพันเส้นเข้าเป็นสายหลักสำเร็จรูปที่ปรับแต่งได้ เช่น 128F/144F/256F/288F/576F
- ✓การเพิ่มประสิทธิภาพทางความร้อน: สายเคเบิลเส้นผ่านศูนย์กลางเล็กช่วยเพิ่มการไหลเวียนของอากาศในแร็คที่หนาแน่น
- ✓ประสิทธิภาพเส้นทาง: รวมใยแก้วนำแสงที่ใช้งานอยู่ 1,152 เส้นต่อแร็คเข้ากับสายหลัก MPO จำนวนมาก
- ✓โปรไฟล์การติดตั้ง: ติดตั้งรวดเร็วผ่านชุดประกอบที่ทดสอบจากโรงงานและมีการสิ้นสุดปลายสายล่วงหน้า
การเติบโตของใยแก้วนำแสงที่ใช้งาน: จากโหนดถึง SuperPOD เต็มรูปแบบ
ความซับซ้อนของการเดินสายภาพจำลอง Scalable Unit
บล็อกการประมวลผล 8 แร็ค
NVIDIA GB200 SU (Scalable Unit) ประกอบด้วย 8 แร็ค แต่ละแร็คมีระบบ DGX GB200 NVL72 พร้อม GPU 72 ตัว
การกระจายสายหลักใยแก้วนำแสงจำนวนมาก
รวมใยแก้วนำแสงหลายพันเส้นในแร็คเข้าเป็นสายหลักความหนาแน่นสูง เพื่อให้มีพื้นที่สำหรับกระแสลม, การติดตั้งที่รวดเร็ว และการใช้เส้นทางน้อยที่สุด
การระบายความร้อนด้วยของเหลว
แผ่นทำความเย็นที่ระบายความร้อนด้วยของเหลวช่วยรักษาสภาพแวดล้อมของถาดให้คงที่ ทำให้ OSFP ทรานส์ซีฟเวอร์ระบายความร้อนได้อย่างมีประสิทธิภาพผ่านฮีทซิงค์
Technical FAQ
ออกแบบ AI Factory ของคุณ
ScaleFibre นำเสนอโซลูชันการเดินสายเคเบิลที่ติดตั้งสำเร็จรูปสำหรับการติดตั้ง NVIDIA DGX SuperPOD
ติดต่อเรารับรายละเอียดเกี่ยวกับสายหลักใยแก้วนำแสงจำนวนมากสำหรับ NVIDIA DGX SU ของคุณ


