엔비디아가 오픈AI와 함께 새로운 오픈 웨이트(open-weight) AI 추론 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’ 개발에 참여했다. 이번 협력은 전 세계 개발자, 기업, 스타트업, 정부 등이 첨단 AI 기술을 직접 활용할 수 있는 개방형 모델 보급에 속도를 내기 위한 것이다. 오픈AI는 현지 시간 5일 두 모델을 공개하며, 산업과 규모를 불문하고 생성형 AI, 추론형 AI, 피지컬 AI, 헬스케어, 제조 등 다양한 분야에서 활용 가능하다고 밝혔다. gpt-oss 모델은 엔비디아 H100 GPU로 훈련됐으며, 전 세계 수억 개의 쿠다(CUDA) 기반 GPU에서 최적의 추론 성능을 발휘하도록 설계됐다. 모델은 현재 엔비디아 NIM 마이크로서비스 형태로 제공돼 GPU 가속 인프라 어디서든 배포할 수 있다. 데이터 프라이버시와 엔터프라이즈급 보안 기능을 제공하며, 차세대 엔비디아 블랙웰(Blackwell) 플랫폼에 최적화돼 GB200 NVL72 시스템에서 초당 150만 토큰 처리 성능을 구현한다. 젠슨 황 엔비디아 CEO는 “오픈AI는 엔비디아 AI 위에서 혁신을 이뤄왔고, 이번 gpt-oss 모델 공개는 전 세계 개발자들이 오픈소스 기반으
인공지능 분야에서 지식 체계나 데이터베이스를 그래프로 저장하고 활용하는 사례가 급증하지만, 일반적으로 복잡도가 높은 그래프 연산은 GPU 메모리의 제한으로 인해 매우 작은 규모의 그래프 등 비교적 단순한 연산만 처리할 수 있다는 한계가 있다. KAIST 연구진이 25대의 컴퓨터로 2000초가 걸리던 연산을 한 대의 GPU 컴퓨터로 처리할 수 있는 세계 최고 성능의 연산 프레임워크를 개발하는데 성공했다. KAIST는 전산학부 김민수 교수 연구팀이 한정된 크기의 메모리를 지닌 GPU를 이용해 1조 간선 규모의 초대규모 그래프에 대해 다양한 연산을 고속으로 처리할 수 있는 스케줄러 및 메모리 관리 기술들을 갖춘 일반 연산 프레임워크(일명 GFlux, 지플럭스)를 개발했다고 27일 밝혔다. 연구팀이 개발한 지플럭스 프레임워크는 그래프 연산을 GPU에 최적화된 단위 작업인 ‘지테스크(GTask)’로 나누고, 이를 효율적으로 GPU에 배분 및 처리하는 특수한 스케줄링 기법을 핵심 기술로 한다. 그래프를 GPU 처리에 최적화된 자체 개발 압축 포맷인 HGF로 변환해 SSD와 같은 저장장치에 저장 및 관리한다. 기존 표준 포맷인 CSR로 저장할 경우 1조 간선 규모의 그래