크라우드웍스가 과학기술정보통신부의 ‘독자 AI 파운데이션 모델 개발 사업’에 선정된 모티프테크놀로지스 컨소시엄에 데이터 공급 핵심 파트너로 합류했다. 이에 따라 크라우드웍스는 LG AI연구원 SK텔레콤 업스테이지 컨소시엄과 함께 국내 AI 생태계를 이끌 4대 정예팀의 일원으로 활동하게 됐다. 이번 사업에서 크라우드웍스는 3000억 파라미터급 300B 추론형 거대언어모델 개발을 위한 고품질 데이터 공급을 전담한다. 단순 데이터 가공을 넘어 단계별 추론 Chain-of-Thought에 특화된 학습 데이터셋 구축에 역량을 집중한다는 계획이다. 이는 모델의 논리적 사고와 문제 해결 능력을 좌우하는 핵심 요소로 평가된다. 특히 자체 개발한 비정형 문서 데이터 전처리 솔루션 ‘알피 날리지 컴파일러’를 투입한다. 표 차트 등 복잡한 구조를 가진 문서를 정교하게 파싱해 AI가 이해 가능한 AI-Ready 데이터로 변환함으로써 고복잡도 전문 지식 학습을 지원한다. 이를 통해 추론형 모델의 단계별 사고 구현을 뒷받침한다는 전략이다. 크라우드웍스는 그간 ‘국가대표 AI’ 정예팀에 고품질 학습 데이터를 지속 공급해 왔다. 저작권 문제를 해결한 도서 데이터 제공과 한국 사회의 언어
셀렉트스타가 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델(독파모)’ 사업 1차 평가를 통과한 SK텔레콤 컨소시엄에 참여하며 ‘K-AI’ 국가대표 모델 개발을 위한 다음 단계에 착수했다. 독파모 프로젝트는 대한민국을 대표할 독자적인 AI 파운데이션 모델 확보를 목표로 추진되는 국가 사업으로 지난 6개월간 5개 컨소시엄의 개발 성과를 기반으로 1차 평가가 진행됐다. 셀렉트스타는 이번 프로젝트에서 SKT 컨소시엄의 데이터 파트를 담당했다. 대규모 데이터 구축 및 검증 기술을 바탕으로 AI 모델 학습용 데이터를 공급하며 모델 안전성과 신뢰성 강화를 지원했다. 특히 자체 개발한 AI 신뢰성 검증 솔루션 ‘다투모 이밸(Datumo Eval)’과 레드티밍 운영 경험을 활용해 실제 서비스 환경에서 발생할 수 있는 안전성 및 편향 리스크 완화에 기여했다. 이어지는 2단계 평가에서는 SKT 컨소시엄의 A.X K1 모델 성능 고도화를 위한 사후 학습 데이터 품질 강화에 집중한다. 셀렉트스타는 STEM 분야의 복합 추론 능력 강화를 위한 데이터셋을 비롯해 이미지·비디오 이해를 위한 멀티모달 데이터셋, 모델 취약점 점검을 위한 레드티밍 데이터셋의 구축 설계와 검증 전반