닫기
배너

레드햇, AWS와 AI 추론 성능 강화 위한 협업 확대

URL복사

 

레드햇은 AWS 상에서 레드햇 AI와 AWS AI 실리콘을 통해 엔터프라이즈급 생성형 AI를 지원하기 위해 AWS와의 협업을 확대한다고 3일 밝혔다. 이번 협업의 핵심은 기업이 기반 하드웨어와 관계없이 고성능·고효율 AI 추론을 대규모로 실행할 수 있도록 유연성을 제공하는 데 있다.

 

생성형 AI 확산과 이에 따른 대규모 AI 추론의 수요 증가는 기업이 기존 IT 인프라를 재정비하도록 만들고 있다. IDC는 “2027년까지 전 세계 조직의 약 40%가 성능 최적화, 비용 효율성, 특수 컴퓨팅 요구에 대응하기 위해 ARM 기반 및 AI/ML 전용 칩을 포함한 맞춤형 실리콘을 사용할 것”이라고 전망했다. 이는 고성능 AI 애플리케이션을 위한 최적화된 연산 구조의 필요성이 높아지고 있음을 의미한다.

 

레드햇과 AWS의 협업은 레드햇의 플랫폼 역량과 AWS의 클라우드 인프라, 그리고 AI 전용 칩셋인 ‘AWS 인퍼런시아2(AWS Inferentia2)’ 및 ‘AWS 트레이니움3(AWS Trainium3)’의 결합을 기반으로, 기업이 완전한(full-stack) 생성형 AI 전략을 구축하도록 지원하는 데 초점을 둔다. 이번 협업에서 발표된 주요 내용은 다음과 같다.

 

첫째, vLLM 기반 ‘레드햇 AI 인퍼런스 서버’가 AWS 인퍼런시아2 및 트레이니움3을 비롯한 AWS AI 칩과 함께 실행될 수 있도록 지원된다. 이를 통해 모든 세대의 생성형 AI 모델을 위한 공통 추론 레이어를 제공해 AI 배포 확장 시 성능 향상, 지연 시간 감소, 비용 효율성 개선을 기대할 수 있다. 특히 GPU 기반 Amazon EC2 대비 최대 30~40% 향상된 가격 대비 성능을 제공한다.

 

둘째, 양사는 AWS 상에서 제공되는 ‘AWS 레드햇 오픈시프트 서비스’와 ‘레드햇 오픈시프트’, ‘레드햇 오픈시프트 AI’에 ‘AWS 뉴런’ 오퍼레이터를 도입했다. 이를 통해 고객은 AWS 가속기를 활용한 AI 워크로드 실행을 더욱 원활하게 지원받을 수 있다.

 

셋째, AWS AI 칩 지원을 통해 레드햇 사용자는 수요가 많은 고성능 가속기에 보다 쉽게 접근할 수 있다. 레드햇은 또한 ‘레드햇 앤서블 오토메이션 플랫폼’용 ‘amazon.ai 인증 앤서블 컬렉션’을 출시해 AWS 상의 AI 서비스 오케스트레이션도 지원한다.

 

넷째, 레드햇과 AWS는 vLLM의 AWS AI 칩 플러그인 최적화를 위해 협업하고 있다. 레드햇은 vLLM의 상업적 주요 기여 기업으로서 AWS 환경에서 AI 추론 및 학습을 강화하기 위한 기술적 기반을 구축하고 있다.

 

레드햇은 데이터센터부터 엣지 환경까지 다양한 영역에서 AWS와 협력하며 하이브리드 클라우드 기반 AI 도입을 지원하고 있다. 이번 협력 확대는 기업이 생성형 AI 성능을 최적화하는 과정에서 비용·성능·확장성 문제를 해결하도록 돕는 전략적 조치로 평가된다.

 

AWS 뉴런 커뮤니티 오퍼레이터는 레드햇 오픈시프트 또는 AWS 레드햇 오픈시프트 서비스 사용자에게 오픈시프트 오퍼레이터허브에서 제공된다. AWS AI 칩을 지원하는 레드햇 AI 인퍼런스 서버는 2026년 1월 개발자 프리뷰로 공개될 예정이다.

 

조 페르난데스 레드햇 AI 사업부 부사장 겸 총괄 매니저는 “레드햇 AI 인퍼런스 서버와 AWS AI 칩을 결합함으로써 조직이 향상된 효율성과 유연성을 기반으로 AI 워크로드를 배포·확장할 수 있도록 지원하고 있다”고 말했다.

 

콜린 브레이스 AWS 안나푸르나 랩 부사장은 “레드햇과의 협력은 기업이 오픈소스의 유연성과 AWS 인프라, AI 가속기를 결합해 파일럿부터 프로덕션까지 생성형 AI를 대규모로 배포하는 데 도움을 준다”고 밝혔다.

 

헬로티 이창현 기자 |














배너


배너


주요파트너/추천기업