NVIDIA GB300 서버의 대규모 배송 9 월부터 시작합니다-널리 퍼진 냉각수 누출 보고서에도 불구하고 GB200 수요는 여전히 ‘강력한’남아 있습니다.
Dell과 아마도 다른 NVIDIA 파트너는 GB300 기반 서버의 초기 생산을 시작했지만, 이러한 기계의 대규모 선적은 2025 년 9 월에만 시작될 것으로 예상됩니다. 디지 타임. 전략적 설계 재사용과 공급망 전체의 조정이 개선되어 이전 세대보다 롤아웃이 더 원활하게 진행될 것으로 예상됩니다. 그러나 액체 냉각은 여전히 원래 디자인 제조업체 (ODM)의 도전을 나타냅니다.
Blackwell Ultra 로의 전환
Digitimes에 따르면 더 빠른 전환을 가능하게하는 주요 요인 중 하나는 현재 GB200 플랫폼에서 사용되는 마더 보드 설계를 유지하기로 한 NVIDIA의 결정입니다. 그러나 Nvidia가 파트너에게 이전보다 훨씬 더 많은 자유를주기 때문에 그게 전부는 아닙니다. GB300의 경우 Nvidia는보다 모듈 식 접근법으로 이동하고 있습니다. 반달. NVIDIA는 완전히 조립 된 마더 보드를 제공하는 대신 SXM 퍽 모듈, 별도의 BGA 패키지의 Grace CPU 및 Axiado의 HMC (Hardware Management Controller)에 B300 GPU를 제공한다고합니다. 고객은 이제 나머지 마더 보드 구성 요소를 자체적으로 공급하며 CPU 메모리는 다양한 공급 업체에서 얻을 수있는 표준 SOCAMM 메모리 모듈을 사용합니다. Nvidia는 이전과 같이 스위치 트레이 및 구리 백플레인을 계속 제공합니다. 재사용은 완전한 재 설계가 필요하지 않으며 생산 프로세스를 간소화하고 위험을 줄입니다.
GB200을 사용하여 NVIDIA는 B200 GPU, Grace CPU, 512GB의 LPDDR5X 메모리 및 전원 전달 구성 요소를 포함한 완전한 Bianca 마더 보드를 제공합니다. 모두 단일 인쇄 회로 보드 (PCB)에 통합되었습니다. NVIDIA는 또한이 시스템에 스위치 트레이 및 구리 백플레인을 공급합니다.
GB300이 현재 검증 및 초기 생산 단계에 있으므로 ODM은 큰 장애물을보고하지 않습니다. 디지 타임 주장. 파트너의 피드백에 따르면 구성 요소 자격이 계획대로 진행되고 있으며 Nvidia는 3 분기 동안 꾸준히 출력을 늘릴 수 있습니다. Digitimes에 따르면 2025 년 4 분기에는 선적량이 크게 증가 할 것으로 예상된다.
Compute Boards의 주요 공급 업체 인 Wistron은 GB200과 GB300의 세대 중첩으로 인해 이번 분기 수익이 평평하게 유지 될 것이라고 보고서는 밝혔다. 좋은 소식으로, 전환은 현재 플랫폼으로의 전환과 비교하여 원활하게 진행되는 것으로 보이며, NVIDIA의 실리콘 문제, 조밀 한 서버 레이아웃 및 냉각 요구 사항으로 인해 여러 지연이 발생했습니다. 지금까지 서버 ODM은 적용 가능한 모든 문제를 관리하는 방법을 배운 것 같습니다.
냉각 누출
GB200은 데이터 센터에 높은 볼륨으로 배송되지만 액체 냉각 시스템에 지속적인 문제에 직면했다고합니다. 디지 타임. 주요 실패는 빠른 연결 피팅으로 발생하며, 이는 공장 스트레스 테스트를 받음에도 불구하고 누출 경향이 있음을 보여주었습니다. 데이터 센터 운영자는 현지화 된 셧다운 및 광범위한 누출 테스트와 같은 조치를 채택하여 응답했습니다. 즉, 하드웨어 신뢰성보다 배포 속도와 성능을 우선 순위로 삼는 것을 의미합니다.
GB300 이상
GB300 이외에도 Nvidia는 AI 서버를 위해 차세대 코드 명 Vera Rubin 플랫폼을 준비하고 있습니다. 이 플랫폼은 두 단계로 출시됩니다. 첫 번째 단계는 Grace CPU를 Vera CPU 및 Blackwell GPU로 Rubin GPU로 대체하지만 현재 Oberon Rack을 유지하면 NVL144 이름이 전달됩니다 (72 개의 듀얼 컴퓨팅 Chiplet GPU 패키지 사용에도 불구하고). 두 번째 단계에는 Vera CPU가있는 완전히 새로운 Kyber 랙과 4 개의 Compute Chiplets가있는 Rubin Ultra GPU가 포함됩니다.
Rubin GPU가 Blackwell GPU보다 전력 배가 고프질 것으로 예상되므로 차세대 플랫폼은 액체 냉각에 대한 의존도를 높일 것입니다. 성능에 필요한이 냉각 방법은 디지 타임 보고서. GB200 시스템에서 배치 전당 배관 설치 및 수압의 가변성으로 인해 누출을 완전히 제거하기가 어려워서 배포 후 서비스 요구 사항 및 인건비가 크게 높아졌습니다.
따르다 Google 뉴스의 Tom의 하드웨어 피드에서 최신 뉴스, 분석 및 리뷰를 얻으려면. 다음 버튼을 클릭하십시오.
Post Comment