닫기
배너

플리토, 코드 스위치 특성 반영한 아랍어 STT 데이터 확보

URL복사

 

플리토가 글로벌 AI 모델의 다국어 인식률 향상을 위해 ‘아랍어 음성 데이터 수집 프로젝트’를 시작했다. 이번 프로젝트는 음성인식 모델의 취약 언어로 꼽히는 아랍어의 낮은 인식률을 개선하고 실제 사용 환경을 반영한 고품질 학습 데이터를 구축하는 데 목적이 있다.

 

아랍어는 표준어인 Modern Standard Arabic 외에도 30개 이상의 방언이 존재하며 구어체에서는 표준어와 방언을 혼용하는 코드 스위칭 현상이 빈번하다. 이러한 언어적 특성으로 인해 AI 학습 데이터 구축 난이도가 높은 언어로 분류된다. 플리토는 방언 차이를 체계적으로 반영한 음성 데이터를 수집해 언어 자원 편차로 인한 AI 학습 한계를 개선한다는 방침이다.

 

플리토는 자사 모바일 애플리케이션의 음성 데이터 수집 기능 ‘아케이드(Arcade)’를 통해 아랍어 음성 데이터 수집 이벤트를 운영한다. 참여자가 제시된 문장을 읽고 발음을 녹음하면 AI 시스템이 이를 분석해 방언 유형을 자동 판별한다. 방언 유형이 불확실한 경우에는 추가 문장을 제시해 재참여를 유도하는 방식으로 데이터 정확도를 높인다.

 

업체는 글로벌 빅테크 기업의 다국어 음성 데이터 수요가 증가함에 따라 실제 프로젝트 요청이 확대되고 있다고 설명한다. 이에 선제적으로 대응하기 위해 이번 아랍어 데이터 구축 프로젝트를 추진한다.

 

플리토는 단순 음성 수집을 넘어 발화자의 억양과 어휘 선택, 발화 패턴 등 언어적 다양성을 반영한 정교한 데이터셋을 구축한다. 이를 통해 AI 학습 편향을 완화하고 실사용 환경에서도 높은 인식률을 구현할 수 있는 기반을 마련한다는 계획이다.

 

이정수 플리토 대표는 “아랍어는 전 세계 4억 명 이상이 사용하는 주요 언어지만 사용 인구에 비해 AI 학습용 데이터가 적은 저자원 언어에 속한다”며 “이번 프로젝트를 통해 아랍어 고유의 특성과 실제 사용 맥락을 체계적으로 반영한 데이터 구축으로 글로벌 AI 모델의 아랍어 인식 품질을 끌어올리겠다”고 전했다.
 

헬로티 구서경 기자 |









배너





배너


배너


주요파트너/추천기업