
저작권 등 법적 문제가 없는 안전한 데이터로 구성
크라우드웍스가 고품질 AI 학습용 데이터를 자유롭게 거래할 수 있는 플랫폼 ‘A1(에이원) 데이터 마켓플레이스’를 공식 오픈했다. AI 성능을 좌우하는 핵심 자산인 데이터의 품질과 접근성을 높이고자 구축된 이 플랫폼은 멀티모달 시대에 부합하는 국내 최대 규모의 AI 학습 데이터 거래소로 자리매김할 전망이다.
A1 데이터 마켓플레이스는 의료, 금융, 통신, 리테일, 수학 등 다양한 산업군에 특화한 도메인 데이터는 물론, 텍스트, 음성, 이미지, 영상 등 멀티모달 데이터까지 포괄적으로 제공한다. 특히 크라우드웍스가 직접 구축하거나 검수한 고품질 데이터만을 엄선해 제공해 신뢰성과 활용도를 높였다.
구매자는 대형언어모델(LLM) 학습에 적합한 대규모 텍스트 데이터, 57만 트랙 규모의 다국어 오디오 데이터, 자율주행 및 영상 분석에 최적화된 이미지 데이터 등 다양한 용도의 데이터셋을 선택할 수 있다. 추론형 AI 모델 학습에 필요한 멀티모달 수학 문항 데이터셋도 7000건 규모로 마련됐다. 이 외에도 고객 맞춤형 어노테이션, 데이터 증강 및 합성 등 주문형 데이터 구축 서비스도 함께 제공된다.
플랫폼 내 거래되는 모든 데이터는 저작권 등 법적 문제가 없는 안전한 데이터로 구성돼, 구매 기업은 리스크 없이 활용이 가능하다. 블록체인 기반의 데이터 거래 인증서 발급 기능도 지원해 투명성과 거래 신뢰도를 높였다. 크라우드웍스는 현재 국내외 데이터 보유 기업 및 기관들과의 제휴를 활발히 진행 중이며, 데이터 판매를 희망하는 기업이나 기관도 A1 마켓플레이스를 통해 손쉽게 거래에 참여할 수 있다.
김우승 대표는 “AI가 스스로 판단하고 복합적인 작업을 수행하는 에이전틱 AI 시대에는 인간처럼 다양한 정보를 통합하는 멀티모달 학습이 필수”라며 “A1 데이터 마켓플레이스를 통해 AI 기업들이 필요한 데이터를 안정적으로 확보하고 더 빠른 혁신을 이뤄낼 수 있도록 지원할 것”이라고 밝혔다.
헬로티 서재창 기자 |