엔비디아, 차세대 인공지능 시스템 베라 루빈 공개...전력 효율 10배 ↑

2026.02.26 15:44:41

헬로티 etech@hellot.net

 

미 반도체 기업 엔비디아가 차세대 인공지능 시스템 ‘베라 루빈(Vera Rubin)’을 공개하고 기존 시스템 대비 전력 효율을 10배 높였다고 밝혔다.

 

미국 경제방송 CNBC가 보도한 바에 따르면, 엔비디아의 실적 발표가 예정된 가운데 현재 랙스케일 시스템 판매가 급증하고 있지만, 시장의 관심은 올해 말 출시 예정인 차세대 인공지능 시스템 베라 루빈에 쏠려 있다. 베라 루빈은 약 130만 개의 부품으로 구성되며, 엔비디아는 이 시스템이 직전 세대인 그레이스 블랙웰(Grace Blackwell) 대비 와트당 성능이 10배 높다고 주장했다.

 

CNBC는 캘리포니아주 산타클라라에 위치한 엔비디아 본사에서 베라 루빈 실물을 단독으로 확인했다고 전했다. 엔비디아는 새 인공지능 시스템이 전 세계에서 조달한 복잡한 부품 네트워크로 구성돼 있다고 설명했다.

 

 

엔비디아에 따르면, 베라 루빈의 핵심 칩은 72개의 루빈 그래픽처리장치(GPU)와 36개의 베라 중앙처리장치(CPU)로 구성되며, 이들 칩은 주로 대만반도체제조(TSMC)가 생산한다. 이 밖에 액침식 냉각 요소, 전력 시스템, 컴퓨트 트레이 등 다른 부품들은 중국, 베트남, 태국, 멕시코, 이스라엘, 미국 등 최소 20개 국가에 위치한 80여 개 이상의 공급업체로부터 조달된다.

 

엔비디아가 직면한 주요 과제 중 하나는 인공지능 수요 급증에 따른 전 세계적인 메모리 부족으로 인한 비용 상승이다. 엔비디아 인공지능 인프라 책임자인 디온 해리스(Dion Harris)는 인터뷰에서 회사가 공급업체에 “매우 세부적인 수요 예측”을 제공해 왔다고 말했다.

 

해리스 책임자는 “우리가 출하하는 모든 물량이 공급망에서 충족될 수 있도록 정렬하고 있다”고 밝히며 “우리는 좋은 상황에 있다”고 말했다. CNBC는 이러한 대응이 급격히 늘어나는 인공지능 인프라 수요를 뒷받침하기 위한 전략이라고 전했다.

 

엔비디아는 인공지능 프로세서 시장을 지배하고 있지만, 어드밴스드 마이크로 디바이시스(AMD), 브로드컴(Broadcom)의 맞춤형 실리콘, 구글(Google)의 텐서 프로세싱 유닛(TPU) 등과의 경쟁이 점점 치열해지고 있다. 엔비디아는 2029년까지 미국에서 최대 5천억 달러 규모의 인공지능 인프라를 제조할 계획이며, 여기에는 TSMC의 미국 애리조나 신규 공장에서 생산될 블랙웰 GPU도 포함된다.

 

그레이스 블랙웰 시스템은 2024년부터 생산에 들어가 단일 시스템에서 구현 가능한 연산 능력의 수준을 크게 끌어올렸다는 평가를 받았다. 베라 루빈은 2026년 하반기 출하가 예상되며, 엔비디아를 한 단계 더 높은 수준으로 끌어올리는 차세대 시스템으로 소개되고 있다.

 

엔비디아 창업자이자 최고경영자 젠슨 황(Jensen Huang) CEO는 1월에 이 시스템이 이미 완전한 생산 단계에 들어갔다고 발표했다. 황 CEO는 1월 6일(현지 시간) 미국 라스베이거스에서 열린 소비자가전전시회(CES)에서 베라 루빈 인공지능 플랫폼에 대해 연설했다.

 

리서치 업체 퓨처럼 그룹(Futurum Group)의 다니엘 뉴먼(Daniel Newman)은 CNBC에 “이 시스템들은 거대하다. 모든 연산, 네트워킹, 케이블, 냉각 요소를 갖추고 있다”고 말했다. 그는 “모든 시스템이 절대적인 최고 효율과 최고 성능을 위해 단일 랙으로 통합돼 있는데, 이는 과거 서버가 설계되던 방식과는 다르다”고 평가했다.

 

CNBC에 따르면, 베라 루빈 랙은 미국을 포함해 대만, 멕시코의 폭스콘(Foxconn) 신규 공장 등 여러 지역에서 제조되며, 무게는 거의 2톤에 달한다. 이 랙에는 총 약 1300개의 마이크로칩이 탑재되는데, 이는 그레이스 블랙웰 시스템의 864개와 비교해 대폭 늘어난 수치다.

 

엔비디아는 베라 루빈을 설치와 수리가 더 쉬운 단순한 모듈형 시스템으로 설계했다. 각 수퍼칩은 랙에 장착된 18개의 컴퓨트 트레이 중 하나에서 몇 초 만에 분리해 꺼낼 수 있도록 설계됐다.

 

반면 블랙웰 시스템에서는 해당 부품들이 기판에 납땜돼 있어 교체와 수리가 상대적으로 까다로웠다. 엔비디아는 이러한 설계 변경을 통해 운영과 유지보수 효율을 높일 수 있다고 설명했다.

 

엔비디아는 새 시스템이 전력 소비량 자체는 직전 세대의 두 배 수준이 될 것으로 예상하면서도, 와트당 성능이 10배 향상돼 전체적으로 훨씬 높은 효율을 제공한다고 밝혔다. CNBC는 인공지능 인프라 확장 과정에서 에너지 소비가 가장 중요한 이슈 중 하나인 상황에서 이 변화가 의미가 크다고 전했다.

 

미즈호 증권(Mizuho Securities)의 분석가 조던 클라인(Jordan Klein)은 “가장 중요한 것은 소비 전력당 얼마나 많은 토큰을 처리할 수 있는가”라고 말했다. 클라인 분석가는 “그 수치를 조정해 곡선을 끌어올릴수록, 지출한 1달러당 수익률이 더 높아질 것”이라고 분석했다.

 

CNBC에 따르면, 엔비디아는 2개의 루빈 GPU와 1개의 베라 CPU로 구성된 베라 루빈 수퍼칩을 공개했으며, 이 수퍼칩에는 총 1만7천 개의 부품이 포함돼 있다. 이 수퍼칩 역시 2월 13일(현지 시간) 산타클라라 본사에서 처음 공개됐다.

 

베라 루빈은 엔비디아 시스템 가운데 처음으로 100% 수랭식 냉각 방식을 채택했다. 해리스 책임자는 이 방식이 기존 증발식 냉각 대비 데이터센터의 물 사용량을 “훨씬 적게” 만드는 데 도움이 된다고 설명했다.

 

엔비디아는 랙 단위 가격을 공개하지 않고 있다. 다만 퓨처럼 그룹은 베라 루빈 랙 가격이 그레이스 블랙웰 대비 약 25%가량 상승해, 시스템당 약 350만~400만 달러 수준이 될 것으로 추정했다.

 

CNBC는 주요 고객사들이 엔비디아 의존도를 분산하기 위해 자체 실리콘을 활용한 인공지능 서버를 확충하고 있다고 전했다. CNBC는 지난해 10월 아마존웹서비스(Amazon Web Services) 데이터센터를 방문해, 트레이늄 2(Trainium 2) 칩으로 구성된 ‘울트라 서버’로 가득 찬 현장을 확인했다.

 

한편 구글 데이터센터에는 자체 개발한 TPU 랙이 대규모로 설치돼 있는 것으로 알려졌다. 이와 같이 주요 클라우드 사업자들이 자사 칩을 탑재한 서버를 확충하며 엔비디아와의 균형을 모색하는 움직임이 이어지고 있다.

 

올해 말에는 경쟁사 AMD가 첫 랙스케일 시스템인 ‘헬리오스(Helios)’를 출시하며 본격적인 경쟁이 예상된다. CNBC에 따르면, AMD는 최근 메타(Meta)로부터 최대 6기가와트(GW) 규모의 용량 확보 약정을 따냈다.

 

클라인 분석가는 “고객들은 더 많은 용량을 원하면서도, 동시에 엔비디아를 견제할 수 있는 실질적인 ‘세컨드 소스’를 원하기 때문에 헬리오스에 대한 수요가 상당할 것”이라고 전망했다. 그는 이러한 움직임이 인공지능 칩 시장 내 경쟁 구도를 더욱 강화할 것으로 내다봤다.

 

경쟁 상황과 관련해 해리스 책임자는 “도전하는 모든 이들에게 경의를 표한다”고 말하면서도, “그러나 이것은 결코 단순한 작업이 아니다”라고 말했다.

 

헬로티 |

Copyright ⓒ 첨단 & Hellot.net






검색