“피지컬 AI 골든타임” 엔비디아, 신규 물리 엔진과 최신 RFM으로 로보틱스 진화 가속화

2025.10.03 16:57:52

최재규 기자 mandt@hellot.net

 

엔비디아, 구글 딥마인드, 디즈니 리서치 공동 개발 물리 시뮬레이션 엔진 공개

엔비디아 ‘아이작 GR00T N1.6’ 추론 모델, ‘코스모스 WFM’ 업데이트 전개

로봇 추론 능력 및 피지컬 AI(Physical AI) 모델 훈련 가속화 기대...어질리티·보스턴다이내믹스 선제 도입

 

 

엔비디아가 구글 딥마인드, 디즈니 리서치와 함께 오픈소스 기반 ‘뉴턴 물리 엔진(Newton Physics Engine)’을 자사 오픈소스 애플리케이션 프레임워크 ‘아이작 랩(NVIDIA Isaac Lab)’에 공개했다. 이로써 로보틱스 시뮬레이션의 새로운 표준을 제시했다고 평가받았다.

 

이번 기술은 지난달 27일부터 나흘간 서울 삼성동 전시장 코엑스에서 개막한 ‘제9회 로봇학습국제학술대회(Conference on Robot Learning 2025, CoRL 2025)’ 현장에서 강조됐다.

 

엔비디아가 기술 발표 무대로 삼은 CoRL 2025는 로보틱스와 머신러닝(Machine Learning)의 교차점에서 이뤄지는 연구 발전을 공유·탐구하는 글로벌 연례 국제 로봇 콘퍼런스다. 이 학술대회는 인공지능(AI)과 머신러닝을 활용한 로봇 공학 연구의 최신 동향을 공유한다.

 

로봇 조작, 내비게이션, 이동, 주행 등 로보틱스의 핵심 문제와 관련된 알고리즘·데이터셋·벤치마크에 초점을 맞춘다. 특히 시뮬레이션 실험이 실제 로봇에 적용 가능함을 입증하는 것을 중요하게 다룬다.

 

엔비디아는 이 행사를 통해 범용 로봇 개발을 위한 ‘로봇 파운데이션 모델(RFM)’인 ‘엔비디아 아이작 GR00T N1.6(NVIDIA Isaac GR00T N1.6)’를 내세웠다. 이는 비전·언어·행동(Vision-Language-Action, VLA) 모델과 새로운 AI 인프라, 뉴턴 물리 엔진을 아이작 랩에서 이용 가능하도록 제공한다.

 

이 중 리눅스 재단(Linux Foundation)이 관리하는 뉴턴 물리 엔진은 그래픽처리장치(GPU) 가속 오픈소스 물리 엔진이다. 사측은 자사 파이썬(Python) 기반 고성능 수치 컴퓨팅 프레임워크 ‘엔비디아 워프(NVIDIA Warp)’를 기반으로 한다고 설명했다. 여기에 회사가 핵심으로 이용하는 범용 오픈소스 표준 ‘오픈 USD(Universal Scene Description, OpenUSD)’ 또한 이번 엔진의 토대라고 덧붙였다.

 

뉴턴 물리 엔진은 복잡한 관절, 균형, 움직임을 가진 휴머노이드 로봇(Humanoid Robot)이 기존 물리 엔진의 한계를 시험하는 과정에서 중점으로 활약할 전망이다. 이는 유연한 설계와 다양한 물리 솔버(Physical Solver)와의 호환성을 특징으로 한다. 여기서 물리 솔버는 현실의 물리 법칙을 계산·해결하는 핵심 소프트웨어 모듈이다.

 

이를 통해 로봇이 눈이나 자갈 위를 걷거나, 컵과 과일을 다루는 등 복잡한 동작을 시뮬레이션하고 현실 세계에 구현하도록 돕는다. 취리히 연방공과대학교(ETH Zurich) 로보틱스 시스템스 랩과 뮌헨 공과대학교(Technical University of Munich) 등 연구기관들이 이미 이번 엔진을 도입하며 그 효용성을 입증하고 있다.

 

뉴턴 물리 엔진을 품은 최신 아이작 GR00T N1.6 버전에는 피지컬 AI(Physical AI)를 위해 개발된 오픈 맞춤형 추론 VLM인 ‘엔비디아 코스모스 리즌(NVIDIA Cosmos Reason)’이 통합될 예정이다. 코스모스 리즌은 로봇이 심층 사고를 하는 두뇌 역할을 담당하며 기존의 지식·상식·물리학을 활용해 모호한 지시를 단계별 계획으로 전환한다. 더불어 새로운 상황을 처리하며 다양한 작업에 걸쳐 일반화할 수 있도록 한다.

 

 

다른 한편, 엔비디아는 오픈소스 ‘코스모스 월드 파운데이션 모델(COSMOS World Foundation Models, CWFM)’의 신규 업데이트도 발표했다. 이 모델은 개발자가 텍스트·이미지·영상 등 프롬프트를 활용해 피지컬 AI 모델 훈련을 수행하도록 지원한다. 다양한 데이터를 대규모로 생성해 개발을 가속화할 수 있다.

 

특히 곧 출시되는 ‘코스모스 프리딕트 2.5(Cosmos Predict 2.5)’는 세 가지 CWFM의 성능을 단일 모델로 통합한다. 이로써 개발 복잡성을 줄이고 효율성을 높일 것으로 기대받는다. 최대 30초의 긴 동영상 생성과 다중 뷰 카메라 출력 도한 지원해, 더욱 풍부한 세계 시뮬레이션을 구현할 것으로 분석된다.

 

로봇에게 물체를 잡는 법을 학습시키는 파지(Grasping) 훈련용 업데이트로 진행된다. 엔비디아 실시간 3차원(3D) 시뮬레이션·협업 플랫폼 ‘엔비디아 옴니버스(NVIDIA Omniverse)’ 기반의 아이작 랩 2.3 개발자 프리뷰에 이 내용이 담겼다. 여기에는 새로운 정밀 파지 워크플로우가 추가됐다.

 

이 워크플로우는 다관절 손과 팔이 탑재된 로봇을 훈련시킨다. 훈련은 중력·마찰·무게 등 다양한 요소를 변경하며, 가상 환경에서 자동화된 커리큘럼을 통해 진행된다. 회사는 보스턴다이내믹스(Boston Dynamics)의 휴머노이드 로봇 ‘아틀라스(Atlas)’는 이를 적용해 파지 기술을 학습했다고 밝혔다.

 

엔비디아는 이러한 첨단 기술 및 소프트웨어 라이브러리를 최대한 활용하도록 하는 새로운 AI 인프라도 공개했다. 초대형 AI 인프라 시스템 ‘GB200 NVL72’는 사측 중앙처리장치(CPU)인 ‘그레이스(Grace)’ 36개와 차세대 GPU 아키텍처 ‘블랙웰(Blackwell)’ 72개를 통합한 랙 규모 시스템이다. 복잡한 추론과 피지컬 AI 작업을 가속화할 전망이다.

 

이와 함께 회사의 RTX 프로(RTX PRO) 서버는 로봇 개발 워크로드 전반을 위한 단일 아키텍처를 제공한다. 특히 블랙웰로 구동되는 차세대 자율 로봇용 AI 슈퍼컴퓨팅 플랫폼 ‘엔비디아 젯슨 토르(NVIDIA Jetson Thor)’는 로봇이 실시간 지능형 상호작용을 위한 다중 AI 워크플로우 실행을 지원한다.

 

해당 플랫폼은 구글 딥마인드, 피겨AI(Figure AI), 메타(Meta) 등 파트너사들이 도입해, 고성능 피지컬 AI 워크로드의 돌파구를 마련하고 있다. 앞선 GPU 및 시뮬레이션 프레임워크 등 엔비디아 기술은 CoRL 2025에서 채택된 논문에 절반 가까이 인용되는 등 로보틱스 연구 가속화에 기여하는 중이다.

 

레브 레바레디언(Rev Lebaredian) 엔비디아 옴니버스 및 시뮬레이션 기술 부문 부사장은 “로보틱스 개발자들이 아이작 GR00T를 ‘두뇌’로, 뉴턴을 ‘신체’ 시뮬레이션으로, 엔비디아 옴니버스를 ‘훈련장’으로 활용하는 차세대 업데이트를 진행하게 됐다”고 설명했다.

 

끝으로 “이 기술들은 휴머노이드가 예측 불가능한 세상에서 추론·적응하며 안전하게 행동하는 능력, 즉 피지컬 AI의 차세대 영역인 일상으로 로봇을 가져오기 위한 방법론”이라고 전했다.

 

헬로티 최재규 기자 |

Copyright ⓒ 첨단 & Hellot.net






검색