글로벌 공급망 재편과 미국 내 제조 기반 강화라는 두 가지 전략적 목표 동시 해결 엔비디아가 미국 내에서 인공지능(AI) 슈퍼컴퓨터를 처음으로 생산하기 위한 대규모 제조 계획을 발표했다. 이 계획은 글로벌 공급망 재편과 미국 내 제조 기반 강화라는 두 가지 전략적 목표를 동시에 달성하려는 시도로 평가된다. 엔비디아는 최근 미국 애리조나주 피닉스에 위치한 TSMC의 반도체 공장에서 차세대 AI 칩인 '블랙웰(Blackwell)'의 생산을 시작했다. 또한, 텍사스주 휴스턴과 댈러스에는 각각 폭스콘과 위스트론과 협력해 AI 슈퍼컴퓨터 제조 공장을 건설 중이다. 이들 공장은 향후 12~15개월 내에 대량 생산에 돌입할 예정이다 . 엔비디아는 향후 4년간 TSMC, 폭스콘, 위스트론, 앰코(Amkor), SPIL 등과 협력하여 미국 내에서 최대 5,000억 달러 규모의 AI 인프라를 생산할 계획이다. 이를 통해 수십만 개의 일자리를 창출하고, 미국의 경제 안보를 강화할 것으로 기대된다. 이러한 움직임은 미국 정부의 반도체 산업 육성 정책과도 맞물려 있다. 최근 미국은 중국과의 무역 갈등 속에서 자국 내 반도체 생산을 확대했으며, 엔비디아의 이번 발표는 이러한
AI 슈퍼컴퓨터, 기업의 대규모 최신 모델 포함한 AI 훈련과 배포 및 확장 지원 엔비디아가 세계에서 가장 강력한 AI 슈퍼컴퓨터 중 하나를 구축하기 위해 마이크로소프트와 다년간 협력한다고 밝혔다. 해당 슈퍼컴퓨터는 엔비디아 GPU, 네트워킹 및 AI 소프트웨어 풀 스택과 결합된 마이크로소프트 애저의 고급 슈퍼컴퓨팅 인프라로 기업의 대규모 최신 모델을 포함한 AI 훈련과 배포 및 확장을 지원한다. 애저의 클라우드 기반 AI 슈퍼컴퓨터에는 AI 분산 훈련 및 추론에 최적화한 ND 및 NC 시리즈 가상 머신이 포함된다. 이는 엔비디아의 고급 AI 스택을 통합한 최초의 퍼블릭 클라우드로, 수만 개의 엔비디아 A100 및 H100 GPU, 엔비디아 퀀텀-2 400Gb/s 인피니밴드 네트워킹 및 엔비디아 AI 엔터프라이즈 소프트웨어 제품군이 플랫폼에 추가됐다. 협업의 일환으로 엔비디아는 애저의 확장 가능한 가상 머신 인스턴스를 활용해 생성형 AI의 발전을 연구하고 가속화할 것으로 보인다. 생성형 AI는 메가트론 튜링 NLG 530B와 같은 기본 모델이 새로운 텍스트, 코드, 디지털 이미지, 비디오 또는 오디오를 생성하는 자율 학습 알고리즘의 기반이 되며 AI 분야에서
퓨어스토리지가 세계에서 가장 빠른 AI 슈퍼컴퓨터가 될 것으로 기대되는 메타의 인공지능(AI) 리서치 슈퍼클러스터(RSC)를 협력 지원한다. 지난 1월 24일(현지시간), 메타는 AI 연구원들이 수 조 개의 사례를 통한 학습과 수 백 개의 언어 연구, 그리고 텍스트, 사진 및 영상의 유기적인 통합 분석을 통해 새로운 AR(증강현실) 도구 등 고성능의 AI 모델을 개발할 수 있도록 RSC를 개발한다고 밝혔다. 궁극적으로, 메타는 RSC를 통해 차세대 주요 컴퓨팅 플랫폼인 메타버스에 핵심적인 기술인 AI 기반 애플리케이션 및 제품 등을 구축할 계획이다. RSC를 위해 강력한 성능 및 확장성을 제공하는 스토리지가 필요했던 메타는 퓨어스토리지를 스토리지 파트너로 선정했다. 그리고 간소성, 안정성 및 지속가능성을 갖춘 퓨어스토리지의 플래시어레이 및 플래시블레이드를 통해 정형 및 비정형 데이터 모두를 신속하게 분석하는 탁월한 성능을 RSC에 제공하게 됐다. 퓨어스토리지는 오랫동안 메타의 기술 파트너로 인정받으며 지난 2017년에는 메타의 1세대 AI 연구 인프라스트럭처의 설계를 도왔고, 그 이후로도 지속적으로 메타의 AI 연구를 위해 협력해왔다. 이번 파트너 선정 발표
엔비디아는 현재 최대 엔비디아 DGX A100 고객 시스템인 메타의 AI 슈퍼컴퓨터를 통해 메타 AI 연구원에게 5 엑사플롭스급 AI 성능을 제공할 것이라고 밝혔다. 메타의 AI 슈퍼컴퓨터는 최첨단 엔비디아 시스템, 인피니밴드 패브릭 및 소프트웨어를 통해 수천 개의 GPU에서 최적화가 가능하다. 메타 플랫폼스는 지금까지의 연구 시스템 중 가장 강력할 것이라고 믿는 시스템을 위해 엔비디아의 기술을 선택하며 엔비디아에 큰 신뢰를 보였다. AI 리서치 슈퍼클러스터(RSC)는 이미 AI를 발전시키기 위한 새로운 모델을 훈련시키고 있다. 메타의 RSC가 완전히 구축되면 엔비디아 DGX A100 시스템의 최대 고객 설치가 될 것으로 예상된다. 메타는 블로그를 통해 "RSC가 서로 다른 언어를 사용하는 대규모 집단에게 실시간 음성 통역을 지원해 연구 프로젝트 협력을 원활히 하거나 AR 게임을 함께 하도록 하는 완전히 새로운 AI 시스템을 구축하는 데 도움이 되기를 바란다"고 밝혔다. 메타는 RSC가 완전히 구축되면 올해 말 이를 활용해 매개 변수가 1조 개가 넘는 AI 모델을 훈련하는 것을 목표로 하고 있다. 이는 실시간으로 유해한 내용을 파악하는 것과 같은 작업에 대한