플리토가 글로벌 AI 모델의 다국어 인식률 향상을 위해 ‘아랍어 음성 데이터 수집 프로젝트’를 시작했다. 이번 프로젝트는 음성인식 모델의 취약 언어로 꼽히는 아랍어의 낮은 인식률을 개선하고 실제 사용 환경을 반영한 고품질 학습 데이터를 구축하는 데 목적이 있다. 아랍어는 표준어인 Modern Standard Arabic 외에도 30개 이상의 방언이 존재하며 구어체에서는 표준어와 방언을 혼용하는 코드 스위칭 현상이 빈번하다. 이러한 언어적 특성으로 인해 AI 학습 데이터 구축 난이도가 높은 언어로 분류된다. 플리토는 방언 차이를 체계적으로 반영한 음성 데이터를 수집해 언어 자원 편차로 인한 AI 학습 한계를 개선한다는 방침이다. 플리토는 자사 모바일 애플리케이션의 음성 데이터 수집 기능 ‘아케이드(Arcade)’를 통해 아랍어 음성 데이터 수집 이벤트를 운영한다. 참여자가 제시된 문장을 읽고 발음을 녹음하면 AI 시스템이 이를 분석해 방언 유형을 자동 판별한다. 방언 유형이 불확실한 경우에는 추가 문장을 제시해 재참여를 유도하는 방식으로 데이터 정확도를 높인다. 업체는 글로벌 빅테크 기업의 다국어 음성 데이터 수요가 증가함에 따라 실제 프로젝트 요청이 확대되고
부산외대의 언어·지역학 전문성과 크라우드웍스 AI 데이터 기술력 결합해 언어 데이터 구축 크라우드웍스가 부산외국어대학교와 손잡고 고품질 다국어 AI 데이터 구축 및 전문 인재 양성에 나선다. 양측은 7일 포괄적 업무협약(MOU)을 체결하고, 언어 기반 AI 기술력 고도화와 저자원 언어 지원 확대를 위한 실질적 협력을 본격화한다고 밝혔다. 이번 협약은 부산외대가 보유한 언어·지역학 전문성과 크라우드웍스의 AI 데이터 기술력을 결합해 다양한 언어 데이터를 공동 구축하고 이를 활용할 수 있는 AI 솔루션을 함께 개발하는 것이 핵심이다. 특히 저자원 언어 데이터를 포함한 고품질 AI 학습용 데이터셋 확보와 이를 기반으로 한 언어 AI 서비스 고도화를 추진한다는 점에서 의미가 크다. 양측은 다국어 데이터 수집 및 가공, AI 학습용 데이터셋 구축, 언어 기반 AI 솔루션 공동 개발 등의 분야에서 협력할 예정이다. 부산외대의 글로벌 언어 교수진과 해외 네트워크, 그리고 크라우드웍스의 ‘워크스테이지(Workstage)’, ‘알피 날리지 컴파일러(Alpy Knowledge Compiler)’와 같은 데이터 구축 솔루션을 접목해 효율성과 정확성을 높일 계획이다. 이뿐 아니라
301억 원 규모의 사업으로 향후 3년간 진행...바이브컴퍼니는 28% 지분 확보 바이브컴퍼니가 외교부의 ‘지능형 외교안보 데이터 플랫폼 구축’ 사업을 LG CNS 컨소시엄과 공동 수주하며 외교 특화 인공지능(AI) 시장 진출을 본격화했다. 이번 사업은 301억 원 규모로, 향후 3년간 진행된다. 바이브컴퍼니는 28%의 지분율을 확보하며 주요 기술 파트너로 참여한다. 사업의 핵심은 외교부 본부와 전 세계 재외공관 간 정보 시스템을 클라우드 기반으로 통합하고, 생성형 AI를 본격적으로 도입해 외교 현안 대응 속도와 정책 수립의 정합성을 높이는 데 있다. 바이브컴퍼니는 자사의 초거대 생성형 AI 모델 ‘VAIV GeM3’를 기반으로 외교문서 자동화, 다국어 이슈 요약 및 번역, RAG 기반 지능형 검색 및 질의응답, 외교부 특화 데이터셋의 온톨로지 및 벡터 기반 구조화, KMS 기반 보안 강화 기술을 제공할 계획이다. 이번 수주는 바이브컴퍼니가 지난 3년간 외교부의 ‘재외공관 클라우드 기반 해외정보 범정부 활용체계 구축’ 사업을 수행하며 축적한 공공 특화 AI 경험과 기술력을 인정받은 결과다. 특히, LG CNS와의 협업을 통해 플랫폼 아키텍처 설계와 멀티 LL
자체 개발한 하이브리드 추론 기능으로 처리 효율 극대화해 알리바바 클라우드가 오픈소스 대규모 언어모델(LLM) 신제품군 ‘큐원3(Qwen3)’를 공개하며 생성형 AI 경쟁에서 다시 한 번 존재감을 드러냈다. 이번 시리즈는 모바일부터 자율주행까지 다양한 AI 활용 환경을 겨냥해 설계됐으며, 사고 기반 하이브리드 추론 등 새로운 구조로 성능과 효율성 모두를 잡았다는 평가다. 큐원3는 총 6종의 밀집 모델(0.6B, 1.7B, 4B, 8B, 14B, 32B)과 2종의 전문가 혼합(MoE) 모델(30B 중 3B 활성, 235B 중 22B 활성)로 구성된다. 모든 모델은 깃허브, 허깅페이스, 모델스코프를 통해 누구나 자유롭게 활용 가능하며, 곧 API 형태로도 서비스될 예정이다. 큐원3의 가장 큰 특징은 알리바바가 자체 개발한 하이브리드 추론 기능이다. 복잡한 논리 추론이나 수학, 코딩과 같은 다단계 작업에는 사고 기반 추론 모드를, 빠른 응답이 필요한 일반 대화에는 비사고 기반 추론 모드를 자동 전환해 처리 효율을 극대화한다. 개발자는 API 상에서 최대 3만8000개의 토큰까지 사고 지속 길이를 조절할 수 있어, 성능과 리소스의 균형을 자유롭게 맞출 수 있다. 큐