자연발화 동영상 및 발화 음성 데이터 등 주요 데이터 구축에 집중
한국딥러닝이 '2024년 초거대 AI 데이터 구축사업'의 일환인 '인체 및 객체 3D 데이터 구축' 사업의 수행기관으로 선정돼 사업을 진행 중이라고 26일 밝혔다.
2024년 초거대 AI 데이터 구축사업은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하며, 초거대 AI 데이터 구축을 통해 AI 생태계를 조성하고 AI 일상화를 실현하기 위해 기획됐다. '인체 및 객체 3D 데이터 구축' 사업은 얼굴 및 포즈 데이터셋의 품질을 검증하기 위한 3D 얼굴 및 포즈 생성 모델을 개발하는 것을 목표로 한다. 구축된 데이터는 모션·포즈 관련 실감형 디지털 콘텐츠 제작과 3D 애니메이션 분야에 활용될 예정이다.
한국딥러닝은 이번 사업을 통해 약 1000시간에 해당하는 24만 건의 자연발화 동영상 및 발화 음성 데이터, 2만4000건의 표정·포즈 모션 데이터, 72만 건 이상의 표정·포즈 3D 스캐닝 데이터를 구축한다. 또한, 오디오 스크립트 및 음성 해설 데이터를 포함한 데이터셋 12만 건도 함께 구축할 예정이다.
실생활에서 흔히 접할 수 있는 중대형 객체의 2D 이미지 및 3D 데이터에 대한 데이터셋 구축도 함께 진행한다. 총 4만3200건의 다각도 2D 이미지와 800건의 3D 모델링 에셋, 800건의 텍스처 이미지, 800건의 라벨링 통합 데이터 등을 포함한다.
구축된 데이터의 품질 검증을 위한 3D 얼굴 및 포즈 생성 모델과 3D 객체 생성 모델도 개발한다. 다각도로 촬영된 2D 이미지를 활용해 3D 객체를 생성하고, 3D 스캐닝 데이터에 대한 오류를 보정해주는 AI 모델을 개발함으로써 데이터의 품질을 검증하고 실용성을 높일 계획이다. 이를 통해 데이터의 실제 활용성을 높이고, 다양한 분야에서 활용 가능한 고품질 데이터를 제공할 예정이다.
한편, 한국딥러닝은 정부 사업 및 공공조달 분야를 중심으로 공공기관에 특화된 AI 솔루션을 구축해 오고 있다. 이미지·비디오·텍스트·음성 등의 멀티모달 데이터를 활용해 OCR 문자인식, 객체 검출, 영상 이해, 이미지 생성, 3D 모델 생성 등 다양한 비전 AI 솔루션을 제공한다.
독자적인 생성형 AI 기술력을 토대로 이미지 및 3D 모델 생성 솔루션을 제공하고 있다. 기존 이미지 데이터들의 특정 스타일이나 패턴을 학습 후, 프롬프트 입력을 통해 새로운 이미지 데이터를 생성해내는 솔루션을 제공한다. 또한, 텍스트 입력만으로 3D 모델을 생성하는 TT3(Text To 3D) 기술을 국내 최초로 개발하며 3D 생성형 AI 솔루션에 대한 기술력을 입증했다.
한국딥러닝 김지현 대표는 "이번 사업을 통해 구축되는 방대한 양의 고품질 3D 데이터는 메타버스, 실감형 콘텐츠, 생성형 AI를 활용한 애니메이션 등 다양한 분야에서 활용될 수 있다"며, "한국딥러닝은 B2G 및 B2B 맞춤형 비전 AI 솔루션을 제공하며, 특히 독자적인 생성형 비전 AI 기술력을 통해 디지털 콘텐츠와 3D 모델링 분야에서 새로운 가능성을 제시하고 있다. 이번 사업으로 한국 AI 기술의 글로벌 경쟁력을 강화하는 데 기여할 것”이라고 밝혔다.
헬로티 서재창 기자 |