아마존웹서비스(AWS)가 OpenAI의 오픈 웨이트 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’를 아마존 베드록과 아마존 세이지메이커 AI를 통해 제공한다고 7일 밝혔다. 이를 통해 AWS 고객은 고성능 AI 모델을 기반으로 생성형 AI 애플리케이션을 보다 빠르고 유연하게 구축할 수 있게 됐다. OpenAI의 새로운 오픈 웨이트 파운데이션 모델 2종은 추론 성능과 효율성을 갖춘 최신 LLM으로, AWS의 글로벌 클라우드 인프라를 통해 수백만 고객에게 제공된다. 특히 gpt-oss-120b는 아마존 베드록에서 실행 시 제미니(Gemini) 대비 10배, 딥시크-R1(DeepSeek-R1) 대비 18배, OpenAI o4 모델 대비 7배 높은 가격 대비 성능을 제공한다고 AWS는 설명했다. 아마존 베드록을 통해 고객은 OpenAI 모델 기반 AI 에이전트를 손쉽게 배포하고, 보안·확장성을 갖춘 프로덕션 환경에서 운영할 수 있다. 보안 장치를 구성해 유해 콘텐츠의 최대 88%를 차단하는 ‘가드레일(Guardrails)’ 기능도 제공된다. 향후 커스텀 모델 임포트, 지식 베이스, 모델 커스터마이제이션 기능도 추가 지원될 예정이다. 아마존 세이지메이커
엔비디아가 오픈AI와 함께 새로운 오픈 웨이트(open-weight) AI 추론 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’ 개발에 참여했다. 이번 협력은 전 세계 개발자, 기업, 스타트업, 정부 등이 첨단 AI 기술을 직접 활용할 수 있는 개방형 모델 보급에 속도를 내기 위한 것이다. 오픈AI는 현지 시간 5일 두 모델을 공개하며, 산업과 규모를 불문하고 생성형 AI, 추론형 AI, 피지컬 AI, 헬스케어, 제조 등 다양한 분야에서 활용 가능하다고 밝혔다. gpt-oss 모델은 엔비디아 H100 GPU로 훈련됐으며, 전 세계 수억 개의 쿠다(CUDA) 기반 GPU에서 최적의 추론 성능을 발휘하도록 설계됐다. 모델은 현재 엔비디아 NIM 마이크로서비스 형태로 제공돼 GPU 가속 인프라 어디서든 배포할 수 있다. 데이터 프라이버시와 엔터프라이즈급 보안 기능을 제공하며, 차세대 엔비디아 블랙웰(Blackwell) 플랫폼에 최적화돼 GB200 NVL72 시스템에서 초당 150만 토큰 처리 성능을 구현한다. 젠슨 황 엔비디아 CEO는 “오픈AI는 엔비디아 AI 위에서 혁신을 이뤄왔고, 이번 gpt-oss 모델 공개는 전 세계 개발자들이 오픈소스 기반으