AWS, 트레이니움2 칩 기반 아마존 EC2 인스턴스 공식 출시

URL복사

아마존웹서비스(AWS)는 오늘 AWS 리인벤트(re:Invent)에서 AWS 트레이니움2 칩 기반의 아마존 EC2 인스턴스를 공식 출시했다고 발표했다. (출처 : 게티이미지뱅크)

아마존 EC2 인스턴스 비롯해 트레이니움2 울트라서버, 차세대 트레이니움3 칩도 공개

아마존웹서비스(AWS)는 오늘 AWS 리인벤트(re:Invent)에서 AWS 트레이니움2 칩 기반의 아마존 EC2 인스턴스를 공식 출시했다고 발표했다. 이와 함께 거대언어모델(LLM) 및 파운데이션 모델(FM)의 학습과 추론을 지원하는 트레이니움2 울트라서버와 차세대 트레이니움3 칩도 함께 공개했다.

아마존 EC2 Trn2 인스턴스(이하 Trn2 인스턴스)는 16개의 트레이니움2 칩을 탑재하여 최대 20.8 페타플롭스(PF)의 연산 성능을 제공한다. 이는 수십억 개의 매개변수를 가진 LLM의 학습 및 배포에 적합하다. Trn2 인스턴스는 동일한 비용으로 기존 GPU 기반 EC2 P5e 및 P5en 인스턴스 대비 30~40% 더 나은 가격 대비 성능을 제공하며, 메모리 대역폭도 크게 개선되어 비용 효율성이 뛰어나다.

아마존 EC2 Trn2 울트라서버(이하 Trn2 울트라서버)는 완전히 새로운 EC2 제품군으로, 초고속 뉴런링크(NeuronLink) 기술을 사용해 64개의 트레이니움2 칩을 연결하여 최대 83.2 피크 페타플롭스의 연산 성능을 제공한다. 이는 단일 Trn2 인스턴스 대비 연산, 메모리, 네트워킹 성능을 각각 4배로 확장해 세계 최대 규모의 모델 학습과 배포를 가능하게 한다.

AWS는 앤스로픽과 협력해 수십만 개의 트레이니움2 칩을 포함하는 EC2 울트라클러스터를 구축하고 있다. 이 프로젝트는 ‘프로젝트 레이니어(Project Rainier)’로 명명되었으며, 현재 세대의 최첨단 AI 모델 훈련에 사용된 엑사플롭스의 5배 이상의 성능을 갖출 것으로 기대된다. AWS는 차세대 AI 학습 칩인 트레이니움3도 공개했다. 트레이니움3는 트레이니움2 대비 최대 2배 성능과 40% 개선된 에너지 효율성을 제공하며, 이를 통해 고객은 더 큰 모델을 더 빠르게 구축하고 실시간 성능을 극대화할 수 있다.

데이비드 브라운(David Brown) AWS 컴퓨팅 및 네트워킹 부문 부사장은 "트레이니움2는 AWS가 개발한 칩 중 가장 강력한 성능을 자랑하며, 대규모 및 최첨단 생성형 AI 워크로드를 지원하기 위해 설계되었다. 이 칩은 학습과 추론 모두에서 최고의 가격 대비 성능을 제공한다"고 말했다.

이어 그는 "매개변수가 수조 개에 달하는 모델이 등장하면서, 고객들에게 대규모 모델을 효율적으로 학습하고 운영할 수 있는 새로운 접근 방식이 필요해졌다. Trn2 울트라서버는 AWS에서 가장 빠른 학습 및 추론 성능을 제공하며, 모든 규모의 조직이 세계 최대 모델을 더 빠르고 비용 효율적으로 학습하고 배포할 수 있도록 돕는다"고 말했다.

모델의 규모가 커짐에 따라, 고객들은 학습 시간을 단축하고 추론 지연 시간을 줄이기 위해 컴퓨팅 및 네트워킹 인프라의 한계에 도전하고 있다. AWS는 이미 GPU 및 머신러닝 칩 기반 인스턴스를 포함한 가장 광범위하고 심층적인 AI/ML용 가속화 EC2 인스턴스를 제공하고 있다.

그러나 현재 시점에서 가장 빠른 가속화 인스턴스에도 불구하고, 고객들은 더욱 정교해진 모델을 더 낮은 비용에 더 빠르게 학습하고 운영할 수 있는 성능과 확장성을 요구하고 있다. 모델이 복잡해지고 데이터 양이 증가함에 따라 클러스터 크기만 단순히 늘리는 것은 병렬 처리의 한계로 인해 훈련 속도를 높이는 데 한계가 있다. 동시에, 실시간 추론에 대한 요구는 단일 인스턴스 아키텍처의 성능 한계를 넘어서는 상황이다.

AWS의 Trn2 인스턴스는 기존 GPU 기반 EC2 인스턴스 대비 30~40% 뛰어난 가격 대비 성능을 제공한다. 단일 Trn2 인스턴스는 16개의 트레이니움2 칩을 초고속 뉴런링크(NeuronLink) 기술로 연결해 20.8 피크 페타플롭스의 연산 성능을 제공하며, 이는 수십억 개의 매개변수를 가진 대규모 모델의 학습 및 배포에 최적화되어 있다.

더 많은 컴퓨팅 능력이 필요한 대규모 모델의 경우, Trn2 울트라서버는 단일 Trn2 인스턴스의 한계를 넘어 학습 규모를 확장함으로써 학습 시간을 단축하고, 제품 출시 속도를 가속화하며, 모델 정확도를 개선하기 위한 신속한 반복을 가능하게 한다. Trn2 울트라서버는 초고속 뉴런링크를 사용해 4개의 Trn2 서버를 하나의 대형 서버로 묶어, 64개의 트레이니움2 칩을 통해 생성형 AI 워크로드를 확장할 수 있다. 추론 워크로드의 경우, 고객은 Trn2 울트라서버를 사용해 운영 환경에서 수조 개의 매개변수를 가진 모델의 실시간 추론 성능을 개선할 수 있다.

AWS는 앤스로픽과 협력해 프로젝트 레이니어로 명명된 EC2 울트라클러스터를 구축하고 있다. 이 클러스터는 수십만 개의 트레이니움2 칩을 포함하며, 3세대 저지연 페타비트 규모의 AWS 엘라스틱 패브릭 어댑터(EFA) 네트워킹을 통해 분산 모델 학습을 확장하며, 현재 세대 AI 모델 훈련에 사용된 엑사플롭스의 5배 이상 성능을 제공할 것으로 기대된다.

앤스로픽의 대표 제품은 전 세계 수백만 사용자들이 신뢰하는 LLM인 '클로드(Claude)'다. AWS와의 협력을 통해 클로드 모델을 트레이니움2에 최적화하고 있으며, 트레이니움2는 현재까지 AWS에서 가장 진보된 AI 하드웨어다. 또한, 앤스로픽은 이전 클러스터의 5배가 넘는 수십만 개의 트레이니움2 칩을 사용하여 아마존 베드록에서 클로드를 사용하는 고객에게 최상의 성능을 제공할 계획이다.

데이터브릭스의 모자이크 AI는 기업이 고품질 에이전트 시스템을 구축하고 배포할 수 있도록 지원한다. 데이터 레이크하우스를 기반으로 구축되어 고객이 기업 데이터를 기반으로 모델을 보다 안전하게 설정하고 도메인에 특화된 출력을 제공할 수 있도록 지원한다. 트레이니움의 높은 성능과 비용 효율성 덕분에 고객은 낮은 비용으로 모자이크 AI 모델의 학습을 확장할 수 있다.

전 세계적으로 모든 고객 부문에서 모자이크 AI에 대한 수요가 계속 확대되는 상황에서 트레이니움2의 출시는 데이터브릭스 및 고객들에게 큰 혜택이 될 것으로 보인다. 세계 최대 데이터 및 AI 기업 중 하나인 데이터브릭스는 트레이니움2를 활용해 고객에게 더 나은 결과를 제공하고 총 소유 비용(TCO)을 최대 30% 낮출 계획이다.

허깅페이스는 5백만 명 이상의 연구자, 데이터 과학자, 머신러닝 엔지니어, 소프트웨어 개발자로 구성된 커뮤니티로, 2백만 개 이상의 모델, 데이터셋, AI 애플리케이션을 공유하는 AI 빌더를 위한 선도적인 플랫폼이다. 허깅페이스는 지난 몇 년간 AWS와의 협력해 옵티멈 뉴런(Optimum Neuron) 오픈소스 라이브러리를 통해 개발자들이 AWS 인퍼런시아와 트레이니움의 성능 및 비용 효율을 쉽게 경험할 수 있도록 했다. 현재는 AWS 마켓플레이스에서 제공되는 HUGS 자체 배포 서비스에도 최적화되어 있다. 트레이니움2 출시로 허깅페이스 사용자들은 더욱 향상된 성능으로 모델을 빠르게 개발하고 배포할 수 있게 됐다.

풀사이드는 AI가 경제적으로 가치 있는 일과 과학적 진보를 주도하는 세상을 만드는 것을 목표로 하고 있다. 이들은 소프트웨어 개발이 인간 수준의 지능을 구현하는 신경망의 첫 번째 주요 단계가 될 것이라고 믿고 있다. 이를 실현하기 위해 개발자들이 생성형 AI를 활용할 수 있도록 기초 모델, API, 어시스턴트를 구축하고 있다. 해당 기술을 구현하기 위한 핵심은 제품을 구축하고 실행하는 데 사용하는 인프라다.

풀사이드의 고객들은 AWS 트레이니움2를 활용해 다른 AI 액셀러레이터와는 차별화된 가격 대비 성능으로 워크로드를 확장할 수 있다. 또한, 풀사이드는 Trn2 울트라서버로 향후 모델을 학습할 계획이며, EC2 P5 인스턴스 대비 40%의 비용을 절감할 수 있을 것으로 기대하고 있다.

AWS는 차세대 AI 학습 칩인 트레이니움3를 공개했다. 트레이니움3는 3나노미터 공정 노드로 제작된 최초의 AWS 칩으로 성능, 전력 효율성, 밀도에 대한 새로운 기준을 제시할 것으로 예상된다. 트레이니움3 기반 울트라서버는 Trn2 울트라서버 대비 4배 더 높은 성능을 제공할 것으로 예상되며, 이를 통해 고객은 모델 구축 시 더욱 빠르게 반복하고 배포 시 우수한 실시간 성능을 제공할 수 있다. 최초의 트레이니움3 기반 인스턴스는 2025년 말 출시될 예정이다.

뉴런 SDK는 트레이니움 칩에서 모델을 실행할 수 있도록 최적화하는 컴파일러, 런타임 라이브러리, 도구를 제공한다. 이를 통해 개발자는 모델을 최적화하여 트레이니움 칩에서 최적의 성능을 발휘할 수 있다. 뉴런은 기본적으로 쟉스와 파이토치와 같은 인기 프레임워크와 통합되어 있어 고객이 기존 코드와 워크플로우를 최소한의 코드 변경으로 트레이니움에서 계속 사용할 수 있다. 뉴런은 또한 허깅페이스 모델 허브의 10만 개 이상의 모델을 지원한다. 뉴런 커널 인터페이스(NKI)를 통해 개발자는 베어메탈 트레이니움 칩에 접근할 수 있어, 까다로운 워크로드의 성능을 극대화할 수 있는 컴퓨팅 커널을 작성할 수 있다.

뉴런 소프트웨어는 최소한의 코드 변경으로 공급업체별 솔루션에 종속되지 않고도 쟉스와 같은 인기 있는 프레임워크를 사용하여 트레이니움2에서 모델을 쉽게 학습하고 배포할 수 있다. 구글은 네이티브 OpenXLA 통합을 통해 고객이 대규모 학습 및 추론에 쟉스를 사용할 수 있도록 지원하여 사용자가 Trn2 인스턴스를 빠르게 시작할 수 있는 쉽고 이식 가능한 코딩 경로를 제공한다. 업계 전반의 오픈 소스 협업과 트레이니움2의 출시로 구글은 ML 커뮤니티 전반에서 쟉스의 채택이 증가할 것으로 예상하며, 이는 전체 ML 생태계에 중요한 이정표가 될 것으로 보인다.

Trn2 인스턴스는 현재 미국 동부(오하이오) AWS 리전에서 사용 가능하며, 추가 리전에서도 곧 제공될 예정이다. Trn2 울트라서버는 현재 프리뷰 상태로 제공되고 있다.

헬로티 서재창 기자 |

[인더스트리 솔루션 인사이트] AW 2026 주목할 베스트 솔루션 (2편)

제36회 스마트공장·자동화산업전(AW 2026)은 제조 인공지능 전환(AX) 시대를 관통하는 산업·공장 자동화(FA) 및 스마트 팩토리(Smart Factory) 기술의 현재와 미래를 집약적으로 보여주는 아시아 최대 산업자동화 전시회다. 내년 전시 현장에서는 제조 경쟁력을 좌우할 솔루션이 등판했고, 이를 기반으로 한 전시회는 각종 산업의 전략이 교차하는 바로미터 역할을 해왔다. 그동안 AW에서 소개된 수많은 기술과 제품은 국내 제조기업의 체질을 강화하고 글로벌 시장에서 차별화된 경쟁력을 확보하는 토대가 됐다. 이번 특집에서는 내년 3월 열리는 AW 2026에 참가한 기업들 가운데, 제조 AX 시대를 이끌 주목할 만한 제품과 솔루션을 조명한다. [특집] AW 2026 주목할 베스트 솔루션 (2편) [스마트 물류] 공장은 이미 자동화됐다, 문제는 ‘물류의 뇌’ [스마트 제조 SW] 데이터 끊김 없는 공장…“ERP·MES 유기적 결합이 지능형 공장 이끌어” [로보틱스] 중국서 검증된 로봇 하드웨어 파워, 국내 로봇 제조 시장의 ‘메기 효과’ 될까 [스마트 물류] 바퀴 달린 모든 것을 AMR로…업계가 ‘맞춤형 자율주행’에 주목하는 이유 [제조 AI] 제조 AI 성공

애로우, 공기열원 히트펌프로 보는 차세대 HVAC 설계 전략

애로우 일렉트로닉스(이하 애로우)가 공기열원 히트펌프(ASHP)를 탈탄소화와 에너지 효율 향상을 동시에 실현하는 차세대 HVAC 시스템의 핵심 대안으로 제시했다. 애로우는 ASHP를 단순한 냉난방 설비가 아닌 규제 대응, 지속가능성 전략, 시장 차별화를 함께 충족하는 확장 가능한 플랫폼으로 정의하며 주거용부터 상업용까지 폭넓은 적용 가능성을 강조한다. ASHP 확산 과정에서는 투자 대비 효과, 확장성, 지속가능성이라는 비즈니스 요구와 함께 극한 환경에서도 유지되는 신뢰성, 안정적인 제어와 통신, 에너지·환경 규제 준수라는 기술적 과제가 동시에 제기된다. 애로우는 이러한 복합 요구를 개별 기술 단위가 아닌 시스템 수준에서 통합적으로 설계해야 한다는 점을 핵심 전제로 제시한다. 특히 미국 혁신 및 제조법(AIM 법)에 따른 냉매 규제 변화는 HVAC 설계 전반의 구조적 전환을 촉발하고 있다. 2025년 이후 고(高) 지구온난화지수(GWP) 냉매 사용이 제한되면서 R-32, R-454B 등 저GWP 냉매로의 전환이 요구되고 있으며 이는 냉매 교체를 넘어 제어 로직, 센서 구성, 안전 메커니즘, 전력 전자 장치까지 포함한 시스템 아키텍처 전반의 재설계를 의미한다.

[인더스트리 솔루션 인사이트] 사람을 닮은 기계, 산업을 다시 쓰다

휴머노이드 로봇(Humanoid Robot)은 더 이상 먼 미래의 상상이 아니다. 산업과 사회 전반에서 ‘체화 AI(Embodied AI)’의 결정체로 자리매김하며, 새로운 패러다임 전환을 예고하고 있다. 이번 특집은 휴머노이드 혁명이 어떻게 진행되고 있는지, 그리고 왜 지금이 그 변곡점인지를 조망한다. 작은 온디바이스 AI(On-device AI)부터 정밀한 로봇 핸드, 실행 가능한 피지컬 AI(Physical AI)까지. 각 기사는 로봇이 단순한 기계적 존재를 넘어 스스로 판단하고 행동하는 지능형 주체로 진화하는 과정을 담고 있다. 이번 특집을 통해 독자들은 ‘움직이는 인공지능’의 현재와 미래를 입체적으로 이해할 수 있을 것이다. [특집] 사람을 닮은 기계, 산업을 다시 쓰다 [휴머노이드 로봇] 로봇의 다음 폼팩터는 ‘인간형’…현재진행형 ‘휴머노이드 혁명’ [로봇 핸드] 휴머노이드 완성의 열쇠 ‘로봇 핸드’…원익로보틱스, ‘정밀 조작’ 혁신에 힘 싣다 [온디바이스 AI] AI 시대, ‘작지만 똑똑한’ 로봇이 뜬다…이미 예고된 온디바이스 AI 혁명 [로봇 기술적 과제] 중국·미국은 달리고 있다…한국 로봇 기술, AI 접목으로 반격 시동 [피지컬 AI] 실행

[인더스트리 솔루션 인사이트] 비용에서 전략으로...물류 산업의 빅 리셋

물류 산업은 지금 거대한 전환의 한복판에 서 있다. 인공지능(AI)과 각종 플랫폼 기술이 촉발한 혁신은 단순히 배송 속도를 높이는 차원을 넘어, 물류를 첨단 전략 산업으로 재편하고 있다. 이번 특집은 이러한 흐름을 세 가지로 풀어냈다. 첫 번째는 물류가 ‘스마트’에서 ‘AI 물류’로 넘어가는 과정이다. 무인화·자동화·데이터 기반 운영은 이미 현장을 바꾸고 있으며, 글로벌 경쟁력 확보의 핵심이 되고 있다. 두 번째는 ‘화물 추적(Cargo Visibility)’이다. 단순한 위치 확인을 넘어 화물 상태와 리스크까지 실시간으로 관리하는 체계는 물류를 ‘비용’ 산업에서 ‘전략’ 산업으로 끌어올리고 있다. 마지막은 글로벌 무역 격변 속에서 중소 포워더의 생존 전략이다. 대기업과 IT 플랫폼이 주도하는 시장에서 서비스형 소프트웨어(SaaS) 기반 디지털 전환(DX)은 생존의 문제임을 보여준다. 중요한 것은 물류는 이제 국가 경제와 글로벌 경쟁력의 전면에 서 있는 미래 산업이라는 점이다. [특집] 비용에서 전략으로…물류 산업의 빅 리셋 [변화, 혁신 그리고 물류] AI와 플랫폼이 뒤흔드는 물류…혁신 없이는 버티기 힘들다 [Cargo Visibility] 물류가 전략 산

[인더스트리 솔루션 인사이트] 로봇이 다시, 인간을 정의하다...휴머노이드 AI 시대 시작

로봇은 더 이상 공장의 팔과 다리가 아니다. 그것은 인간이 무엇을 하고, 무엇을 하지 않아야 하는지를 다시 묻는 철학적 존재로 진화하고 있다. 산업용 로봇에서 피지컬 AI(Physical AI), 그리고 휴머노이드로 이어지는 변화의 흐름은 단순한 자동화의 진보가 아니다. 그것은 인간의 노동·공간·역할을 재정의하며, 사회 구조 전체를 다시 짜는 ‘문명적 전환’의 서막이다. 이번 특집은 그 전환의 최전선에 선 네 명의 전문가를 통해 로봇의 진짜 미래를 탐구한다. 김진오 한국AI·로봇산업협회장이 제시한 ‘로봇 트랜스포메이션(RX)’은 산업을 설계의 언어로 재해석하며, 류석현 한국기계연구원장이 이끄는 ‘K-휴머노이드’는 인간과 산업의 공진화를 그린다. 글렌 버세스 몬트리올대학교 교수는 데이터 생태계의 격차를, 데니스 홍 캘리포니아 대학교 로스앤젤레스 교수는 인간 중심의 로봇 철학을 말한다. 그들이 던지는 메시지는 하나다. "로봇은 인간을 대체하지 않는다. 인간을 확장한다” [특집] 로봇이 다시, 인간을 정의하다...휴머노이드 AI 시대 시작 [로봇 트랜스포메이션] “RX가 먼저, AX는 그다음”…로봇 트랜스포메이션이 바꾼 산업지도 [K-휴머노이드] “사람을 닮은 로

최신뉴스