컨소시엄에는 KT 비롯해 총 18곳 참여...전문성과 기술력 결합 크라우드웍스가 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 개발 사업’에 KT 컨소시엄의 핵심 파트너로 참여한다. 이번 사업은 국내 AI 기술의 자립 기반을 강화하기 위한 대형 프로젝트로, 크라우드웍스는 그 중심에서 고품질 학습 데이터 구축을 전담하게 된다. KT 컨소시엄은 KT를 중심으로 솔트룩스, 경찰청, 고려대학교 의료원, 서울대학교, 매스프레소 등 국내 유수의 AI 기술 기업 및 기관 총 18곳이 참여했으며, 다양한 산업 분야의 전문성과 기술력이 결합돼 시너지 효과가 기대된다. 크라우드웍스는 국내에서 개발된 주요 파운데이션 모델에 AI 학습 데이터를 공급해 온 경험과 검증된 역량을 보유하고 있다. 특히 이번 프로젝트는 텍스트, 음성, 비전 등 대규모 멀티모달 데이터를 단기간 내 정밀하게 구축해야 하는 만큼, 크라우드웍스의 지능형 전처리 기술과 숙련된 데이터 작업자 인프라가 사업 성공의 열쇠로 꼽힌다. 이번 사업에서 중요한 차별화 요소는 크라우드웍스가 이미 보유한 고품질 도메인 데이터 경쟁력이다. 수학과 과학처럼 AI 추론 성능 향상에 필수적인 전문 데이터셋을 비롯해 저작권이
저작권 등 법적 문제가 없는 안전한 데이터로 구성 크라우드웍스가 고품질 AI 학습용 데이터를 자유롭게 거래할 수 있는 플랫폼 ‘A1(에이원) 데이터 마켓플레이스’를 공식 오픈했다. AI 성능을 좌우하는 핵심 자산인 데이터의 품질과 접근성을 높이고자 구축된 이 플랫폼은 멀티모달 시대에 부합하는 국내 최대 규모의 AI 학습 데이터 거래소로 자리매김할 전망이다. A1 데이터 마켓플레이스는 의료, 금융, 통신, 리테일, 수학 등 다양한 산업군에 특화한 도메인 데이터는 물론, 텍스트, 음성, 이미지, 영상 등 멀티모달 데이터까지 포괄적으로 제공한다. 특히 크라우드웍스가 직접 구축하거나 검수한 고품질 데이터만을 엄선해 제공해 신뢰성과 활용도를 높였다. 구매자는 대형언어모델(LLM) 학습에 적합한 대규모 텍스트 데이터, 57만 트랙 규모의 다국어 오디오 데이터, 자율주행 및 영상 분석에 최적화된 이미지 데이터 등 다양한 용도의 데이터셋을 선택할 수 있다. 추론형 AI 모델 학습에 필요한 멀티모달 수학 문항 데이터셋도 7000건 규모로 마련됐다. 이 외에도 고객 맞춤형 어노테이션, 데이터 증강 및 합성 등 주문형 데이터 구축 서비스도 함께 제공된다. 플랫폼 내 거래되는 모