구글 딥마인드, 자가 학습하는 ‘탁구 로봇’ 공개...겨룰수록 숙련도↑

2025.07.26 18:10:48

최재규 기자 mandt@hellot.net

 

로봇 간 경쟁 통한 자가 향상 학습 입증

생성형 AI(Generative) 모델 제미나이(Gemini), ‘코치’ 역할 수행

인간 개입 없이 스스로 경험하며 성능 발전...바둑 알파고(AlphaGo) 메커니즘 차용해

 

 

구글의 인공지능(AI) 조직 구글 딥마인드(Google DeepMind)가 스스로 학습하는 ‘탁구 로봇’을 공개했다.

 

딥마인드는 지난 21일(현지시간) 미국 전기전자공학회(IEEE)에서 발간하는 과학기술 전문지 ‘IEEE 스펙트럼(IEEE Spectrum)’을 통해 두 개의 로봇 팔(Robot Arm)이 탁구공을 받아 치는 해당 로봇을 선보였다. 공개된 영상에는 로봇 팔이 탁구대 양쪽에서 레일을 따라 이동하며, 상대 로봇 팔이 넘긴 공을 받아치며 랠리를 하는 장면이 담겼다.

 

구글 딥마인드는 지난해 8월 인간과 탁구하는 로봇을 공개한 바 있다. 이번에 발표한 탁구 로봇은 이를 개선한 것으로, 로봇 간 경기를 통해 스스로 학습하며 기술을 익히는 형태로 진화했다.

 

딥마인드 측은 “이 탁구 로봇 실험을 통해 인간의 개입 없이도 로봇이 스스로 학습하고 발전하는 ‘자가 향상(Self-Improvement)’ 기반 로봇 시스템의 가능성을 입증하고자 한다”고 밝혔다. 즉, 로봇 개발 자체가 목적이라기보다, 로봇이 인간이 주입하지 않아도 스스로 경험을 통해 성능을 향상하는 데 의미가 있다는 것이다.

 

 

딥마인드 로보틱스 팀은 이 로봇 개발에 있어, 지난 2016년 등장한 바둑 AI ‘알파고(AlphaGo)’에서의 메커니즘을 차용했다고 밝혔다. 로봇끼리 서로 경쟁해 학습하게 하는 방식인 셈이다. 한쪽이 더 나은 전략을 찾으면 상대도 적응해야 하므로, 실력 향상이 자연스럽게 반복될 수 있다는 분석이다.

 

연구진은 탁구가 빠른 속도로 움직이는 공을 정확한 각도와 힘으로 받아치는 정밀한 제어 능력과 전략적 판단력 등이 요구되는 것에 주목했다. 이는 로봇이 실시간 상호작용과 복잡한 물리 법칙을 이해하고, 적응형 전략을 배우는 데 최적의 환경이라고 판단했다.

 

이번 로봇은 처음에는 두 로봇이 랠리를 이어가는 연습부터 시작해 경쟁 모드로 전환하고, 사람과 대결도 병행했다. 사람이 더 다양한 공을 보낼 수 있어, 로봇이 학습할 수 있는 샷의 분포가 넓어지기 때문이다.

 

여기에 이미지·동영상 등 시각적 콘텐츠 및 텍스트를 분석해 상호 연관성을 파악하는 ‘비전언어모델(VLM)’을 코치로 활용했다. 이 과정에서 자사 생성형 AI 모델 ‘제미나이(Gemini)’가 로봇의 동작을 관찰해 개선 방향을 제시하면 로봇이 이를 통해 행동을 발전시키는 형태다.

 

파나그 산테티(Panag Sanketi) 구글 딥마인드 로보틱스 팀 수석 엔지니어는 “향후 제조 현장, 가정, 의료 등 다양한 분야에서 자율적이고 적응력 높은 로봇이 등장하는 데 있어, 이번 탁구 로봇은 작지만 강력한 출발점이 될 수 있다”고 밝혔다. 그러면서 “AI와 로봇의 융합이 실제 삶에 기여할 수 있는 구체적 해답을 제시할 수 있을 것”이라고 기대를 표했다.

 

헬로티 최재규 기자 |

Copyright ⓒ 첨단 & Hellot.net





상호명(명칭) : (주)첨단 | 등록번호 : 서울,자00420 | 등록일자 : 2013년05월15일 | 제호 :헬로티(helloT) | 발행인 : 이종춘 | 편집인 : 김진희 | 본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2012년 4월1일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호 copyright(c) HelloT all right reserved.