컨소시엄에는 KT 비롯해 총 18곳 참여...전문성과 기술력 결합
크라우드웍스가 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 개발 사업’에 KT 컨소시엄의 핵심 파트너로 참여한다.
이번 사업은 국내 AI 기술의 자립 기반을 강화하기 위한 대형 프로젝트로, 크라우드웍스는 그 중심에서 고품질 학습 데이터 구축을 전담하게 된다. KT 컨소시엄은 KT를 중심으로 솔트룩스, 경찰청, 고려대학교 의료원, 서울대학교, 매스프레소 등 국내 유수의 AI 기술 기업 및 기관 총 18곳이 참여했으며, 다양한 산업 분야의 전문성과 기술력이 결합돼 시너지 효과가 기대된다.
크라우드웍스는 국내에서 개발된 주요 파운데이션 모델에 AI 학습 데이터를 공급해 온 경험과 검증된 역량을 보유하고 있다. 특히 이번 프로젝트는 텍스트, 음성, 비전 등 대규모 멀티모달 데이터를 단기간 내 정밀하게 구축해야 하는 만큼, 크라우드웍스의 지능형 전처리 기술과 숙련된 데이터 작업자 인프라가 사업 성공의 열쇠로 꼽힌다.
이번 사업에서 중요한 차별화 요소는 크라우드웍스가 이미 보유한 고품질 도메인 데이터 경쟁력이다. 수학과 과학처럼 AI 추론 성능 향상에 필수적인 전문 데이터셋을 비롯해 저작권이 확보된 국내 도서 데이터, 30만 건 이상의 의료 데이터 등, 고난도 AI 학습에 적합한 콘텐츠를 안정적으로 공급할 수 있는 구조를 갖췄다.
아울러 크라우드웍스는 자체 플랫폼 ‘A1 데이터 마켓플레이스’를 통해 의료, 금융, 통신, 리테일, 수학 등 산업 특화형 멀티모달 데이터셋을 제공하며, 국내 데이터 생태계 활성화에도 기여하고 있다. 텍스트, 오디오, 비디오를 아우르는 다양한 포맷의 데이터를 제공함으로써 활용성과 산업 적합도를 동시에 높이고 있다.
김우승 크라우드웍스 대표는 “AI 경쟁력은 결국 전문가가 구축한 정교한 데이터에서 비롯된다”며 “국가 차원의 파운데이션 모델 개발에 참여하게 된 만큼, 국내 AI 기술 자립과 데이터 주권 강화에 기여하겠다”고 밝혔다.
이번 협업은 단순한 데이터 공급을 넘어, 고도화된 AI 모델을 구현하기 위한 핵심 인프라로서의 데이터 중요성을 재조명하는 계기가 될 것으로 보인다. 특히 크라우드웍스는 데이터 라벨링 표준 수립 경험을 기반으로 파운데이션 모델 시대에 걸맞은 데이터 중심의 AI 생태계 확장을 견인할 것으로 기대된다.
헬로티 서재창 기자 |