닫기
배너

엔비디아·오픈AI, gpt-oss 공개로 개방형 AI 생태계 확장한다

URL복사

엔비디아가 오픈AI와 함께 새로운 오픈 웨이트(open-weight) AI 추론 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’ 개발에 참여했다. 이번 협력은 전 세계 개발자, 기업, 스타트업, 정부 등이 첨단 AI 기술을 직접 활용할 수 있는 개방형 모델 보급에 속도를 내기 위한 것이다. 

 

오픈AI는 현지 시간 5일 두 모델을 공개하며, 산업과 규모를 불문하고 생성형 AI, 추론형 AI, 피지컬 AI, 헬스케어, 제조 등 다양한 분야에서 활용 가능하다고 밝혔다. gpt-oss 모델은 엔비디아 H100 GPU로 훈련됐으며, 전 세계 수억 개의 쿠다(CUDA) 기반 GPU에서 최적의 추론 성능을 발휘하도록 설계됐다.

 

모델은 현재 엔비디아 NIM 마이크로서비스 형태로 제공돼 GPU 가속 인프라 어디서든 배포할 수 있다. 데이터 프라이버시와 엔터프라이즈급 보안 기능을 제공하며, 차세대 엔비디아 블랙웰(Blackwell) 플랫폼에 최적화돼 GB200 NVL72 시스템에서 초당 150만 토큰 처리 성능을 구현한다. 젠슨 황 엔비디아 CEO는 “오픈AI는 엔비디아 AI 위에서 혁신을 이뤄왔고, 이번 gpt-oss 모델 공개는 전 세계 개발자들이 오픈소스 기반으로 최첨단 애플리케이션을 만들 수 있도록 하는 중요한 계기”라고 말했다.

 

엔비디아 블랙웰은 NVFP4 4비트 정밀도 기술을 포함해 전력과 메모리 요구를 줄이면서도 대규모 언어 모델의 고정밀 추론을 지원한다. 이를 통해 수조 개 파라미터 규모의 모델을 실시간 배포할 수 있으며, 기업의 AI 투자 효율을 높일 수 있다. 

 

엔비디아는 gpt-oss 모델을 텐서RT-LLM, 플래시인퍼(FlashInfer), 허깅페이스(Hugging Face), 라마.cpp(llama.cpp), 올라마(Ollama), vLLM 등 주요 오픈 프레임워크와 호환되도록 최적화했다. 이를 통해 개발자는 선호하는 환경에서 모델을 자유롭게 활용할 수 있다. 

 

이번 협력은 양사의 긴밀한 관계를 다시 한번 보여준다. 2016년 젠슨 황 CEO가 엔비디아의 첫 AI 슈퍼컴퓨터 DGX-1을 직접 오픈AI에 전달한 것을 시작으로, 양사는 대규모 AI 훈련을 위한 핵심 기술을 지속적으로 개발해왔다. 현재 전 세계 250개 국가에서 약 650만 명의 개발자가 900개 이상의 엔비디아 소프트웨어 개발 키트를 사용하며, gpt-oss 모델 역시 이 생태계 안에서 빠르게 확산될 전망이다.

 

헬로티 서재창 기자 |













배너

배너


배너


주요파트너/추천기업