조 단위 파라미터도 거뜬...AWS, 울트라서버로 AI 슈퍼컴퓨팅 가속

URL복사

기존 GPU 인스턴스 대비 최대 20배 향상된 연산 성능 및 11배 높은 메모리 용량 제공

아마존웹서비스(AWS)가 초거대 생성형 AI 훈련과 추론을 위한 차세대 인프라로, 엔비디아의 최신 슈퍼칩 ‘그레이스 블랙웰(Grace Blackwell)’ 기반의 P6e-GB200 울트라서버를 공개했다. 이는 기존 GPU 인스턴스 대비 최대 20배 향상된 연산 성능과 11배 높은 메모리 용량을 제공하며, AWS 역사상 가장 강력한 GPU 기반 인프라로 평가된다.

이번에 함께 공개된 P6-B200 인스턴스는 중대형 AI 워크로드에 유연하게 대응할 수 있도록 구성됐다. 두 제품 모두 엔비디아 블랙웰 GPU를 중심으로 설계됐으며, 대규모 AI 시스템과 실시간 고성능 추론이 요구되는 에이전틱 AI 시스템을 위한 솔루션이다.

P6e-GB200 울트라서버는 최대 72개의 엔비디아 블랙웰 GPU를 NV링크로 연결해 하나의 컴퓨팅 유닛처럼 동작하며, FP8 연산 기준 360페타플롭스의 성능과 총 13.4테라바이트의 고대역폭 GPU 메모리를 제공한다. 이와 함께 4세대 EFA 네트워크를 통해 초당 최대 28.8테라비트의 대역폭을 구현했다.

반면, P6-B200 인스턴스는 8개의 블랙웰 GPU와 1.4TB GPU 메모리, 5세대 인텔 제온 스케일러블 프로세서를 탑재해, 다양한 AI 학습 및 추론 환경에서 높은 호환성과 효율성을 제공한다. 기존 세대 인스턴스 대비 최대 2.25배 향상된 연산 성능과 향상된 네트워크 처리 능력을 갖췄다.

초대형 언어모델처럼 조 단위 파라미터를 처리하는 워크로드에는 P6e-GB200이 적합하다. GB200 NVL72 아키텍처는 통합된 메모리 공간과 NV링크 기반 저지연 구조를 통해, 전문가 혼합 모델과 초대형 컨텍스트 윈도우 처리에 최적화된 추론 환경을 제공한다. P6-B200 인스턴스는 기존 x86 환경에서 GPU 워크로드를 이식하고자 하는 기업에 유리하다. 코드 변경을 최소화하면서 최신 GPU 인프라로의 전환이 가능하며, 다양한 AI 소프트웨어 스택과의 호환성도 뛰어나다.

두 인프라 모두 AWS의 6세대 니트로 시스템을 기반으로 구동된다. 이는 고객 데이터에 대한 접근을 원천 차단하고, 시스템 중단 없이 펌웨어 업데이트를 지원하는 라이브 업데이트 기능을 제공한다. 이러한 보안성과 운영 안정성은 특히 민감한 데이터 환경에서 AI 워크로드를 운영하는 기업에 중요한 선택 기준이 된다.

P6e-GB200은 액체 냉각 방식을 채택해 높은 밀도의 GPU 환경에서도 안정적인 열 관리를 가능하게 한다. 공랭 방식의 P6-B200과 혼합 운영이 가능한 유연한 인프라 구성이 가능해, 데이터센터의 물리적 제약을 최소화한다. 또한, EC2 울트라클러스터를 기반으로 대규모 GPU 노드 간 통신을 최적화해, 고속 분산 학습에 유리한 구조를 갖췄다.

AWS는 두 인프라를 세이지메이커 하이퍼팟과 아마존 EKS, DGX 클라우드 등 다양한 방식으로 배포할 수 있도록 구성했다. 세이지메이커 하이퍼팟은 자동화한 GPU 클러스터 운영과 예측 가능한 학습 계획을 제공하며, 오류 복구 및 GPU 상태 모니터링 기능을 갖춘 포괄적인 관리 환경을 지원한다.

EKS 기반의 쿠버네티스 운영 환경에서도 P6e-GB200과 P6-B200 인스턴스 모두 활용 가능하며, 토폴로지 인식 기능을 통해 울트라서버 ID에 따라 워크로드를 최적화해 배치할 수 있다. P6e-GB200 울트라서버는 엔비디아 DGX 클라우드를 통해서도 제공될 예정으로, 전문화된 AI 소프트웨어 스택과 엔비디아의 기술 지원을 바탕으로 AI 프로젝트의 속도와 효율성을 높일 수 있다.

헬로티 서재창 기자 |

[인더스트리 솔루션 인사이트] 로봇이 된 공장, 소프트웨어가 된 산업

공장이 움직인다. 단순한 자동화를 넘어, 공장 전체가 하나의 거대한 로봇처럼 작동하는 ‘피지컬 AI(Physical AI)’ 시대가 도래했다. 이 가운데, 공장의 하드웨어 중심 운영은 소프트웨어 기반 플랫폼으로 전환되고 있으며, 이 과정에서 맥락을 이해하는 인공지능(AI), 디지털 트윈(Digital Twin), 시뮬레이션 등 기술이 핵심 역할을 한다. 현시점 제조업은 제품 생산을 이상의 가치를 추구하고 있으며, 시스템 자체를 수출하는 산업으로 진화하는 중이다. 이번 특집은 한국과학기술원(KAIST)의 ‘소프트웨어 정의 공장(SDF)’부터 네이버 ‘인공지능(AI) 에이전트’, 다임리서치 시뮬레이션 기술, 유니티 실시간 3차원(3D) 솔루션까지 제조업 혁신의 최전선 기술 방법론을 짚는다. [특집] 로봇이 된 공장, 소프트웨어가 된 산업 [Real-time 3D] 게임 넘어 산업 현장으로…실감나는 상호작용 경험이 ‘산업 DX’ 핵심 [AI Simulation] 제조·물류 현장 ‘물리적 AI’ 시대 도래…AI 시뮬레이션으로 미래를 현실로 [Physical AI] 공장이 하나의 거대한 로봇 된다…KAIST, 피지컬 AI로 제조 혁신 선언 [AI Agent] AI 에

애로우, AI·ML 기반 자동화 워크플로로 진단 정확도 향상하다

애로우 일렉트로닉스(이하 애로우)가 의료 영상 분야에서 인공지능(AI) 활용 방안을 담은 백서를 발표했다. 이번 백서는 MRI, CT, PET 등 대용량 의료 데이터를 기반으로 한 진단 과정에서 나타나는 다양한 과제를 짚고 이를 해결하기 위한 AI·머신러닝(ML) 기반 분석 기술과 고성능 컴퓨팅 인프라 전략을 제시한다. 의료 영상 데이터는 전 세계 의료 데이터의 30% 이상을 차지하며 2025년까지 지속적으로 증가할 것으로 예상된다. 기존 진단 방식은 방사선 전문의의 경험과 수동 해석에 크게 의존했지만 데이터 복잡성과 환자 증가로 인해 한계가 뚜렷하다. 특히 초기 병변은 신호가 약하거나 대비가 낮아 탐지가 어렵고 환자 간 해부학적 다양성이나 영상 기법 차이로 인해 오진 가능성도 크다. AI와 ML은 이러한 제약을 극복할 수 있는 도구로, 다중 모달리티 데이터를 분석해 미묘한 이상을 식별하고 종양 탐지·분류·치료 반응 예측 등 진단 효율성을 높인다. 백서에 따르면 AI 통합은 기존 방사선학 워크플로를 수동 중심에서 데이터 기반 자동화 파이프라인으로 전환한다. 이미지 수집 이후 GPU·AI 가속기를 활용한 병렬 처리와 NVMe SSD 기반 저장 장치, 고대역폭

경전기차(LEV)의 설계 혁신, 모듈형 파워트레인이 이끈다

지속가능한 미래 모빌리티의 핵심, 경전기차(LEV)의 성장세가 눈부시다. 글로벌 전기차 시장이 2024년 1조3280억 달러 규모에 도달하며, 이 중 LEV는 도심 통근 및 개인 이동 수단으로 빠르게 확산되고 있다. 이 전자책은 바로 이러한 흐름 속에서, 모듈형 파워트레인 설계를 중심으로 한 LEV 기술과 전략을 종합적으로 다루고 있다. 애로우 일렉트로닉스는 eBook을 통해 설계자와 제조사, 시스템 통합자들이 직면한 에너지 밀도 최적화, 열관리, 확장성, 규제 대응 등 핵심 과제를 제시하고, 이를 해결하기 위한 트랙션 인버터, HMI, ADAS, TPMS, 온보드 충전기 등 주요 하위 시스템별 설계 인사이트를 제공한다. 특히 Melexis, ST, Infineon, NXP, Analog Devices 등 주요 반도체·센서 업체들의 솔루션이 체계적으로 소개돼, 제품 선택에 실질적인 가이드가 된다. 주목할 점은, AI 기반 예측 유지보수, 디지털 트윈, 배터리 교체 기술 등 LEV의 미래까지 폭넓게 조망한다는 것이다. 단순한 부품 나열을 넘어, 확장 가능하고 유연한 모듈식 설계의 전략적 가치를 강조하며, 고속 충전·스마트 커넥티비티·자율주행 요소까지 아우르는

애로우, 고성능 LEV 인버터 설계로 모빌리티 전환 가속하다

애로우 일렉트로닉스(이하 애로우)가 소형 전기차(LEV: Light Electric Vehicle) 시장을 겨냥한 차세대 트랙션 인버터 참조 설계를 발표했다. 이번 백서는 전기 이륜차, 삼륜차, 마이크로 모빌리티 등 다양한 LEV 플랫폼에 빠르고 유연하게 적용 가능한 전력변환 솔루션을 제시하고 있다. 이번 참조 설계는 48V, 72V, 96V DC 전압 애플리케이션을 지원하며, 3kW에서 최대 15kW까지 전력 확장이 가능한 모듈형 구조로 설계됐다. NXP의 S32K3xx MCU와 Vishay의 하프브리지 MOSFET 기반 전력 모듈을 바탕으로 하드웨어와 임베디드 소프트웨어가 통합된 형태다. IEC61508 표준을 기반으로 한 기능 안전과 내장형 과전류 보호, 실시간 열 모니터링 등의 안정성 기능도 제공한다. 특히 고효율 전력변환을 위한 최적화된 PWM 제어, 최대 1000V 절연, 온도 센서 3개 지원, 회전식 리졸버 및 홀센서 기반 속도 피드백 기능 등 다양한 LEV 환경에 필요한 정밀 제어 기능이 포함됐다. 전원 보드는 최대 80V / 200A의 하프브리지 MOSFET을 통합해 낮은 온저항과 열저항 특성을 갖추고 있으며, 기생 인덕턴스를 최소화한 설계로

[인더스트리 솔루션 인사이트] 기술이 바꾸는 물류의 법칙, 지금이 전환점

물류 산업이 인공지능(AI), 자동화(Automation), 소프트웨어 중심 운영(SDx) 등으로 급속히 재편되고 있다. 이번 특집은 이러한 변화의 최전선을 다룬다. 첫 번째는 수직 적재 자동화 설비로 공간 효율과 작업 안전을 높인 사례를 소개한다. 두 번째는 AI 기반 배차 최적화 엔진 ‘루티’를 통해 공차율을 줄이고 운송비를 절감한 성과를 조명한다. 세 번째는 스피드플로우의 컨베이어 기술로 상하차 시간을 획기적으로 줄이고 배송 회전율을 높인 실증 사례를 담았다. 마지막은 창고 운영을 실시간으로 제어하는 창고실행시스템(WES) 시스템으로, 물류의 중심축이 하드웨어에서 소프트웨어로 이동하고 있음을 보여준다. 네 가지 사례는 물류의 병목을 기술로 해결하며, 물류가 기업 경쟁력을 좌우하는 핵심 인프라임을 입증한다. [특집] 기술이 바꾸는 물류의 법칙, 지금이 전환점 [수직 적재 자동화] 비정형 대상물도 스마트하게…낡은 창고에 ‘수직 적재’ 효율 DNA 심다 [물류 배차 최적화] AI로 물류 배차 비효율 잡는 법…‘AI 최적화 엔진’이 해답 [상하차 혁신 사례] “화물차 상하차, 이제는 5분이면 충분”…스피드플로우의 도전 [WES 도입 사례] ‘테슬라식 물류’의

반도체