3D 포인트 클라우드(Point Cloud) 기반 인공지능(AI) 모델이 학습해야 하는 데이터량을 크게 줄이면서도 성능을 유지할 수 있는 기술이 개발됐다. 자율주행차와 로봇 등 대규모 3D 데이터를 다루는 분야에서 학습 시간과 연산 비용을 줄이는 데 큰 도움이 될 것으로 기대된다.
UNIST 인공지능대학원 심재영 교수팀은 3D 포인트 클라우드 데이터를 효과적으로 압축해 학습 효율을 높이는 ‘데이터 증류(dataset distillation)’ 기술을 개발했다고 1일 밝혔다.
데이터 증류는 대규모 학습 데이터에서 핵심 특징만을 추출해 ‘요약 데이터’를 만드는 기술이지만, 3D 포인트 클라우드는 점의 순서가 정해져 있지 않고 물체가 회전된 경우가 많아 적용이 어려운 형태로 꼽혀 왔다. 요약 데이터의 완성도를 높이려면 원본 데이터와 비교·매칭 과정이 필수지만, 이러한 특성 때문에 엉뚱한 부위가 비교되거나 같은 물체도 서로 다른 물체로 인식되는 문제가 발생한다.
연구팀은 이 문제를 해결하기 위해 두 가지 핵심 기술을 결합했다. 첫째, 순서가 일정하지 않은 점 데이터의 의미 구조를 자동으로 정렬해주는 손실 함수(SADM)를 적용했다. 둘째, 물체의 회전 각도를 AI가 스스로 조정하며 최적화하도록 하는 방향 최적화(learnable rotation) 기법을 도입했다.
그 결과 원본 대비 수십 분의 1 수준으로 데이터를 줄이면서도 모델 성능을 유지할 수 있음이 확인됐다. 특히 ModelNet40 데이터셋에서는 원본 크기의 25분의 1로 압축한 요약 데이터로 학습하더라도 80.1% 인식 정확도를 기록해, 전체 데이터를 사용했을 때의 87.8%와 큰 차이를 보이지 않았다. 높은 압축률에서도 학습 효율과 성능을 균형 있게 확보할 수 있음을 보여주는 성과다.
심재영 교수는 “3D 점 데이터의 무질서한 구조와 회전 불확실성 때문에 기존 데이터 증류 기술이 겪던 매칭 오류를 근본적으로 해결한 기술”이라며 “자율주행, 드론, 로봇, 디지털 트윈 등 대규모 3D 데이터 기반 산업에서 학습 비용과 시간을 크게 줄일 수 있을 것”이라고 말했다.
이번 연구는 인공지능 분야 최상위 국제학회인 ‘신경정보처리시스템학회(NeurIPS) 2025’에 정식 논문으로 채택됐으며, 과학기술정보통신부 한국연구재단과 정보통신기획평가원의 지원을 받아 수행됐다. NeurIPS 2025는 12월 2일부터 7일까지 미국 샌디에이고에서 열린다.
헬로티 이창현 기자 |














































