알리바바 클라우드, 글로벌 고객 AI 역량 강화 나선다

2025.04.09 15:08:14

이창현 기자 atided@hellot.net

 

알리바바 클라우드는 8일 온라인으로 열린 ‘스프링 론치 2025(Spring Launch 2025)’에서 글로벌 고객을 위한 신규 AI 모델, 개발 플랫폼, 인프라 업그레이드를 대거 발표하며 전 세계 AI 혁신을 가속화하겠다는 의지를 밝혔다.

 

셀리나 위안 알리바바 클라우드 인텔리전스 글로벌 사업 부문 회장은 “전 세계 기업들의 디지털 전환 수요에 대응하기 위해 일련의 PaaS 서비스와 AI 기술 업데이트를 발표했다”며 “이번 업그레이드를 통해 더욱 안전한 고성능의 서비스를 제공하고, 기업이 AI 중심의 세상에서 보다 빠르게 혁신과 확장을 해나가도록 지원하겠다”고 밝혔다.

 

이어 “클라우드와 AI가 글로벌 성장의 핵심 기반이 되는 추세에 따라 고객의 진화하는 필요에 부응해 핵심 제품을 지속 강화해 나갈 것”이라고 강조했다.

 

 

이번 온라인 이벤트에서 알리바바 클라우드는 자사의 기초 모델 접근성을 확대하고 인프라 제품을 업그레이드함으로써 글로벌 고객을 위한 새로운 서비스를 발표했다. 해당 모델들은 싱가포르 지역의 가용 영역을 통해 제공되며 알리바바 클라우드의 독자적인 초거대 언어 모델(LLM) 시리즈 ‘Qwen’의 최신 모델들을 포함한다.

 

대표 모델로는 대규모 Mixture of Experts(MoE) 구조의 ‘Qwen-Max’, 복잡한 분석적 사고를 위한 추론 모델 ‘QwQ-Plus’, 고도화된 멀티모달 문제 해결이 가능한 비주얼 추론 모델 ‘QVQ-Max’, 텍스트·이미지·음성을 통합한 엔드 투 엔드 멀티모달 모델 ‘Qwen2.5-Omni-7B’ 등이 있다.

 

QwQ-Plus는 고도화된 분석적 사고에 특화된 추론 모델로, 복잡한 질의응답(QA) 작업이나 전문가 수준의 수학 문제 등 높은 난도의 과제를 정밀하고 알고리즘 기반으로 해결한다. 한편 QVQ-Max는 시각적 입력과 사고의 흐름(Chain-of-Thought)을 모두 지원하는 시각 추론 모델로 복합적인 멀티모달 문제를 높은 정확도와 확장된 추론 역량을 통해 효과적으로 처리한다.

 

알리바바 클라우드는 생성형 AI 및 초거대 언어 모델(LLM)에 대한 확장 가능하고 비용 효율적이며 사용자 친화적인 솔루션 수요 증가에 대응하기 위해 PaaS 기반의 AI 플랫폼인 ‘PAI(Platform for AI)’의 주요 기능을 대폭 업그레이드했다.

 

PAI-EAS(Elastic Algorithm Service)는 다중 노드 아키텍처 기반의 분산 추론 기능을 처음으로 도입해, MoE(Mixture of Experts) 구조와 초장문 처리 수요 증가로 인한 초대규모 모델의 요구사항을 충족하고 기존 단일 노드 아키텍처의 한계를 해결한다.

 

또한 성능 향상과 비용 절감을 위해 프리필(prefill)-디코드(decode) 분리 기능(prefill-decode disaggregation function)을 새롭게 적용했다. 해당 기능은 Qwen2.5-72B 모델로 적용 시 동시 처리량이 92%, 초당 토큰 처리 속도(Tokens Per Second, TPS)가 91% 향상되는 성과를 보여주며 확장성과 효율성을 크게 개선했다.

 

이에 더해 PAI-모델 갤러리(PAI-Model Gallery)는 약 300개에 달하는 최첨단 오픈소스 모델을 포괄적으로 제공하도록 업그레이드됐다. 여기에는 알리바바 클라우드의 독자적인 오픈소스 모델인 Qwen 및 Wan 시리즈 전체가 포함되며 모두 코드 작성 없이 손쉽게 배포하고 관리할 수 있는 통합 환경에서 이용할 수 있다.

 

이 플랫폼은 다양한 컴퓨팅 자원 기반의 배포 방식을 지원하며 모델 성능에 대한 인사이트를 제공하는 성능 평가 기능과 대형 모델의 지식을 소형 모델로 이전해 배포 비용을 절감할 수 있는 모델 경량화 기능도 함께 제공한다.

 

AI 시대에 요구되는 데이터 활용 역량도 강화됐다. 알리바바 클라우드는 자사의 생성형 AI 모델 및 애플리케이션 개발 플랫폼인 모델 스튜디오에 데이터 웨어하우스 ‘애널리틱DB’를 통합해 RAG 솔루션을 위한 권장 벡터 데이터베이스로 제공한다. 이번 업그레이드는 조직의 독자적인 지식 베이스를 모델 스튜디오에서 제공하는 AI 모델 및 도구와 직접 연결해, 상황 인식형 애플리케이션 개발을 간소화한다.

 

헬로티 이창현 기자 |

Copyright ⓒ 첨단 & Hellot.net





상호명(명칭) : (주)첨단 | 등록번호 : 서울,자00420 | 등록일자 : 2013년05월15일 | 제호 :헬로티(helloT) | 발행인 : 이종춘 | 편집인 : 김진희 | 본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2012년 4월1일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호 copyright(c) HelloT all right reserved.