저작권 등 법적 문제가 없는 안전한 데이터로 구성 크라우드웍스가 고품질 AI 학습용 데이터를 자유롭게 거래할 수 있는 플랫폼 ‘A1(에이원) 데이터 마켓플레이스’를 공식 오픈했다. AI 성능을 좌우하는 핵심 자산인 데이터의 품질과 접근성을 높이고자 구축된 이 플랫폼은 멀티모달 시대에 부합하는 국내 최대 규모의 AI 학습 데이터 거래소로 자리매김할 전망이다. A1 데이터 마켓플레이스는 의료, 금융, 통신, 리테일, 수학 등 다양한 산업군에 특화한 도메인 데이터는 물론, 텍스트, 음성, 이미지, 영상 등 멀티모달 데이터까지 포괄적으로 제공한다. 특히 크라우드웍스가 직접 구축하거나 검수한 고품질 데이터만을 엄선해 제공해 신뢰성과 활용도를 높였다. 구매자는 대형언어모델(LLM) 학습에 적합한 대규모 텍스트 데이터, 57만 트랙 규모의 다국어 오디오 데이터, 자율주행 및 영상 분석에 최적화된 이미지 데이터 등 다양한 용도의 데이터셋을 선택할 수 있다. 추론형 AI 모델 학습에 필요한 멀티모달 수학 문항 데이터셋도 7000건 규모로 마련됐다. 이 외에도 고객 맞춤형 어노테이션, 데이터 증강 및 합성 등 주문형 데이터 구축 서비스도 함께 제공된다. 플랫폼 내 거래되는 모
데이터개방 플랫폼 '키프리스플러스'서 13일부터 이용 가능 특허청은 13일부터 의약품 실험데이터와 실험데이터 추출을 위한 인공지능(AI) 학습데이터 등 총 45만건을 데이터 개방플랫폼인 키프리스플러스(KIPRIS Plus)에서 무료로 개방한다고 12일 밝혔다. 키프리스플러스에서는 국내외 13개국의 주요 산업재산권(특허·상표·디자인) 공보와 특허행정 정보 등 데이터 상품을 제공하고 있다. 최근에는 다국어 번역, 이미지 검색 등을 위한 AI 학습데이터까지 총 115종의 데이터 상품을 개방하고 있다. 지식재산 서비스 업체들은 출원된 발명을 일반인들이 활용할 수 있도록 공개하는 특허공보의 실험데이터를 추출·활용해 서비스를 개발하고, 관련 기업· 연구기관들은 특허공보에 포함된 실험·비교예 등을 자유롭게 분석·활용해 백신·신약 등 연구개발에 활용할 수 있을 것으로 특허 당국은 기대하고 있다. 김기범 정보고객지원국장은 "기술 정보의 보고인 특허데이터에는 실험데이터와 같이 유용한 정보가 많다"며 "공공·민간에서 적극적으로 활용한다면 첨단 기술 분야에서 우리나라의 기술개발 역량을 높일 수 있을 것"이라고 말했다. 헬로티 김진희 기자 |