아마존 노바 마이크로, 아마존 노바 라이트 등 4개의 최첨단 모델 포함해
아마존웹서비스(이하 AWS)는 오늘 AWS 리인벤트에서 광범위한 작업에서 최첨단 인텔리전스와 업계 선도적인 가격 대비 성능을 제공하는 차세대 파운데이션 모델(FM)인 '아마존 노바(Amazon Nova)'를 발표했다.
아마존 노바 모델은 아마존 베드록에서 사용 가능하며, 아마존 노바 마이크로(매우 빠른 텍스트-텍스트 변환 모델), 아마존 노바 라이트, 아마존 노바 프로, 아마존 노바 프리미어(텍스트, 이미지, 비디오를 처리하여 텍스트를 생성하는 멀티모달 모델)를 포함한다. 아마존은 또한 두 가지 추가 모델인 아마존 노바 캔버스(스튜디오급 이미지 생성) 및 아마존 노바 릴(스튜디오급 비디오 생성)을 출시했다.
로힛 프라사드(Rohit Prasad) 아마존 인공 일반 지능(AGI) 수석부사장은 "아마존 내부적으로 약 1,000개의 생성형 AI 애플리케이션이 진행 중이며, 애플리케이션 개발자가 여전히 고민하는 문제를 전반적으로 파악하고 있다"며 "새로운 아마존 노바 모델은 내부 및 외부 개발자의 이러한 과제 해결을 돕고, 지연 시간, 비용 효율성, 맞춤화, 검색 증강 생성(RAG), 에이전트 기능에서 의미 있는 진전을 이루면서 강력한 인텔리전스와 콘텐츠 생성을 제공하고자 한다"고 말했다.
아마존 노바는 4개의 최첨단 모델을 포함한다. 첫 번째인 아마존 노바 마이크로는 매우 낮은 비용으로 가장 낮은 지연 시간의 응답을 제공하는 텍스트 전용 모델이다. 다음은 이미지, 비디오, 텍스트 입력 처리가 빠른 저비용 멀티모달 모델인 아마존 노바 라이트, 광범위한 작업에 대해 정확성, 속도, 비용의 최적의 조합을 제공하는 고성능 멀티모달 모델인 아마존 노바 프로다.
끝으로, 복잡한 추론 작업과 맞춤형 모델 학습을 위한 최고의 교사 모델로 사용되는 아마존의 가장 강력한 멀티모달 모델인 아마존 노바 프리미어다. 아마존 노바 마이크로, 아마존 노바 라이트, 아마존 노바 프로는 현재 정식 사용 가능하며, 아마존 노바 프리미어는 2025년 1분기에 출시될 예정이다.
아마존 노바 모델들을 다양한 업계 표준 벤치마크로 테스트한 결과, 아마존 노바 마이크로, 아마존 노바 라이트, 아마존 노바 프로는 각각의 카테고리에서 최고 수준의 모델들과 경쟁력 있는 성능을 보여줬다. 아마존 노바 마이크로는 적용 가능한 11개의 모든 벤치마크에서 메타의 라마 3.1 8B와 비교해 동등하거나 더 나은 성능을 보였으며, 적용 가능한 12개의 모든 벤치마크에서 구글의 제미나이 1.5 플래시-8B보다 동등하거나 더 나은 성능을 보였다. 아마존 노바 마이크로는 초당 210개의 출력 토큰이라는 업계 최고의 속도로, 빠른 응답이 필요한 애플리케이션에 이상적이다.
아마존 노바 라이트 역시 동일한 인텔리전스 등급의 다른 모델과 비교해 경쟁력이 있다. 오픈AI의 GPT-4o 미니와 비교해 19개 중 17개의 벤치마크에서, 구글의 제미나이 1.5 플래시-8B와 비교해 21개 중 17개의 벤치마크에서, 앤스로픽의 클로드 하이쿠 3.5와 비교해 12개 중 10개의 벤치마크에서 동등하거나 더 나은 성능을 보였다. 텍스트 벤치마크에서의 정확성 외에도, 아마존 노바 라이트는 VATEX, 차트QA, 독VQA와 같은 벤치마크로 측정된 비디오, 차트, 문서 이해도에서 두각을 나타냈다.
아마존 노바 라이트는 또한 버클리 함수 호출 리더보드로 측정된 함수 호출과 비쥬얼웹벤치(웹 브라우저 동작 접지 벤치마크)와 마인드2웹(일반적 멀티모달 에이전트 벤치마크)로 측정된 브라우저와 컴퓨터 화면에서의 동작을 위한 시각적 요소 이해의 핵심 기능에서도 뛰어난 성능을 보인다.
아마존 노바 프로는 오픈AI의 GPT-4o와 비교해 20개 중 17개의 벤치마크에서, 구글의 제미나이 1.5 프로와 비교해 21개 중 16개의 벤치마크에서, 앤트로픽 클로드 소네트 3.5v2와 비교해 20개 중 9개의 벤치마크에서 동등하거나 더 나은 성능을 보였다. 텍스트와 시각적 인텔리전스 벤치마크에서의 정확성 외에도, 아마존 노바 프로는 종합 RAG 벤치마크(CRAG), 버클리 함수 호출 리더보드, 마인드2웹으로 측정된 지시사항 준수와 멀티모달 에이전트 워크플로우에서 탁월한 성능을 보인다.
아마존 노바 마이크로, 라이트, 프로는 200개 이상의 언어를 지원한다. 아마존 노바 마이크로는 128K 입력 토큰의 컨텍스트 길이를 지원하며, 아마존 노바 라이트와 아마존 노바 프로는 300K 토큰 또는 30분의 비디오 처리를 지원하는 컨텍스트 길이를 제공한다. 2025년 초에는 2M 이상의 입력 토큰 컨텍스트 길이를 지원할 예정이다.
헬로티 서재창 기자 |