
Qwen 2.5에 방대한 한국어 데이터를 추가 학습시킴으로써 국내 환경에 최적화
SK텔레콤(이하 SKT)이 세계 최고 수준의 한국어 특화 대규모 언어모델(LLM) ‘A.X(에이닷 엑스) 4.0’을 오픈소스로 공개했다. 7월 3일 SK텔레콤은 글로벌 오픈소스 플랫폼 허깅페이스를 통해 720억 개(72B)의 파라미터를 가진 표준 모델과 70억 개(7B)의 경량 모델 등 두 가지 버전을 동시에 공개했다.
A.X 4.0은 오픈소스 기반 모델인 Qwen 2.5에 방대한 한국어 데이터를 추가 학습시켜 국내 환경에 최적화한 성능을 구현한 것이 특징이다. 특히 SK텔레콤이 자체 설계한 토크나이저를 탑재해 동일한 한국어 문장 입력 시 GPT-4o보다 약 33% 높은 토큰 효율을 기록했다. 이는 정보 처리량 증가와 함께 운영 비용 절감이라는 두 마리 토끼를 잡을 수 있는 기술적 진보로 평가된다.
벤치마크 테스트에서도 성과가 두드러졌다. 한국어 능력 평가 지표인 KMMLU에서는 78.3점을 기록하며 GPT-4o(72.5점)를 웃돌았고, 한국 문화 이해도 평가인 CLIcK에서도 83.5점으로 GPT-4o(80.2점)를 앞질렀다. 이를 통해 A.X 4.0은 한국어와 한국 문화에 최적화된 LLM으로 입지를 다지는 데 성공했다.
특히 기업 활용도를 고려한 온프레미스 설치 환경을 지원해 자체 서버에서 직접 운영할 수 있다는 점도 장점이다. SKT는 외부와의 연동 없이 자체 보유한 데이터로 대규모 사전학습을 진행했으며, 이를 통해 데이터 주권과 보안을 확보했다고 강조했다.
A.X 4.0은 이미 자사 AI 서비스 에이닷(A.)의 통화 요약 기능에 적용돼 성능을 검증받았으며, 향후 SK텔레콤과 SK그룹 전반의 서비스에 점진적으로 확대 적용될 예정이다. 기업들은 해당 모델을 기반으로 파생형 AI 모델을 개발하거나, 자체 서비스에 맞춘 응용 연구를 수행할 수 있다.
SKT는 이달 중 수학 문제 해결 및 코드 생성 능력이 강화된 추론형 모델도 새롭게 선보일 계획이다. 여기에 텍스트와 이미지를 동시에 처리할 수 있는 멀티모달 기능까지 더해 향후 LLM 기술을 고도화한다는 전략이다. 또한, 소버린 AI 전략의 일환으로 A.X 3.0부터 적용한 ‘프롬 스크래치(From Scratch)’ 방식도 병행 개발하고 있으며, 완전 자체 개발형 모델도 차례로 공개할 예정이다.
김지원 SKT AI Model Lab장은 “A.X 4.0은 한국어에 특화한 기술력과 데이터 효율성으로 국내 기업의 AI 활용 장벽을 크게 낮출 수 있는 모델”이라며 “앞으로도 지속적인 고도화를 통해 한국형 LLM의 경쟁력을 세계적으로 끌어올릴 것”이라고 밝혔다.
헬로티 서재창 기자 |