NVIDIA GB200 NVL72 인프라 및 스케일러블 유닛을 위한 MPO-8 APC 케이블링
8개의 랙이 9,216개의 활성 광섬유 가닥으로 수렴되는 Blackwell 스케일러블 유닛(SU)의 케이블링 아키텍처를 분석합니다.
DGX GB200 스케일러블 유닛(SU)은 데이터센터 아키텍처의 큰 변화를 의미합니다. SU는 9,216개의 활성 광섬유 가닥으로 상호 연결된 통합 576-GPU 개체입니다. ScaleFibre는 이러한 밀도를 관리하는 데 필요한 정밀 종단 트렁크를 제공합니다.
4가지 물리적 SuperPOD 패브릭
NVIDIA는 GPU 트래픽을 격리하기 위해 SU를 별개의 물리적 계층으로 분할합니다.
MN-NVL (NVLink 5)
스케일업72개 GPU를 1.8TB/s로 연결하는 ‘내부’ 랙 네트워크.
- 광섬유 없음
- 수동 구리 백플레인
- 블라인드-메이트 커넥터
Compute InfiniBand
스케일아웃대규모 다중 노드 훈련을 위한 주요 ‘동서’ 패브릭.
- SU당 4,608개의 활성 광섬유
- 레일 최적화 토폴로지
- 퀀텀-3/퀀텀-2
Storage & In-Band
프론트엔드고속 데이터 수집 및 프로비저닝을 위한 이더넷 기반 패브릭.
- 5:3 블로킹 팩터
- BlueField-3 DPU 오프로드
- VXLAN/RoCE 지원
OOB Management
제어 플레인하드웨어 원격 측정, BMC 및 PDU 관리를 위한 격리된 네트워크.
- RJ45/Cat6 구리
- SN2201 스위치 티어
- 물리적 에어갭 보안
엑사스케일 SU 지표
8-랙 스케일러블 유닛은 NVIDIA AI 팩토리의 기본 구성 요소를 나타냅니다.
9,216
SU당 활성 광섬유4,608
컴퓨팅 전용 가닥5:3
스토리지 블로킹 비율400G/800G
네이티브 포트 속도SU 연결의 세 가지 수준
레벨 A: 서버-리프
고밀도 광섬유 트렁크 또는 점퍼를 사용하여 랙당 1,152개의 광섬유로 NVL72 노드를 리프 스위치에 연결합니다.
레벨 B: 리프-스파인
SU 내에서 레일 정렬 트래픽을 컴퓨팅을 위한 1:1 논블로킹 링크를 사용하여 집계합니다.
레벨 C: 스파인-코어
SU를 넘어 중앙 코어 영역으로 고밀도 트렁크를 사용하여 확장합니다.
레거시 패칭 (지점 간)
- ✕수동 복잡성: 8-랙 블록당 9,216개의 개별 패치 코드 필요.
- ✕공기 흐름 방해: 밀집된 케이블 번들이 액체 냉각 배기 경로를 막음.
- ✕위험 프로필: 수동 1:1 패칭 중 ‘교차 레일’ 발생 가능성 높음.
- ✕배포 시간: SU당 수동 라우팅 및 라벨링에 115시간 이상 소요.
모듈형 고밀도 광섬유 트렁킹
- ✓플러그 앤 플레이: 수천 개의 광섬유를 사전 종단된 128F/144F/256F/288F/576F 맞춤형 트렁크로 통합.
- ✓열 최적화: 소직경 케이블이 밀집된 랙에서 공기 흐름을 극대화.
- ✓경로 효율성: 랙당 1,152개의 활성 광섬유를 고밀도 MPO 백본으로 통합.
- ✓설치 프로필: 사전 종단된 공장 테스트 조립품을 통해 신속한 배포.
활성 광섬유 증가: 노드에서 전체 SuperPOD까지
케이블링 복잡성시각화된 스케일러블 유닛
8-랙 컴퓨팅 블록
NVIDIA GB200 SU(스케일러블 유닛)는 각각 72개의 GPU를 갖춘 DGX GB200 NVL72 시스템을 수용하는 8개의 랙으로 구성됩니다.
고밀도 광섬유 트렁크 분배
수천 개의 랙 광섬유를 고밀도 트렁크로 통합하여 공기 흐름 확보, 신속한 설치 및 최소한의 경로 사용을 가능하게 합니다.
액체 냉각
액체 냉각 콜드 플레이트는 트레이 환경을 안정화하여 OSFP 트랜시버가 라이딩 방열판을 통해 효과적으로 열을 방출할 수 있도록 합니다.
Technical FAQ
AI 팩토리 설계
ScaleFibre는 NVIDIA DGX SuperPOD 배포를 위한 사전 종단 케이블링 솔루션을 제공합니다.
문의하기NVIDIA DGX SU를 위한 고밀도 광섬유 트렁크에 대한 자세한 정보를 얻으세요.


