SK텔레콤 정예팀이 개발한 국내 최초 500B 급 초거대 AI 모델 'A.X K1(에이닷엑스 케이원)'이 공개 직후 국내외에서 좋은 평가를 받고 있다. A.X K1은 약 4개월의 한정된 기간 동안 519B 규모의 초거대 모델로 개발됐음에도 주요 벤치마크에서 딥시크 V3.1 등 글로벌 AI 모델과 유사하거나 앞선 성능을 선보였다. 특히, 지난 7일 A.X K1 모델의 기술 보고서(Technical Report)를 공개한 이후, 나흘만에 모델 다운로드 수가 8800여 건으로 급증하는 등 높은 관심이 이어지고 있다. 이처럼 A.X K1에 대한 관심이 큰 이유는 높은 '확장성' 때문으로 풀이된다. 링크드인과 페이스북 등 SNS에서는 A.X K1이 자유로운 사용과 배포가 가능한 ‘아파치 2.0(Apache 2.0)’ 라이선스로 공개된 점을 장점으로 꼽고 있다. 글로벌 AI 모델 플랫폼 허깅페이스의 창립자이자 CEO인 클렘 들랑그(Clem Delangue)도 A.X K1 등을 직접 언급하며 대한민국 AI의 약진 사례로 지목했다. 클렘 들랑그 CEO는 8일 자신의 링크드인 계정을 통해 허깅페이스 인기 모델에 A.X K1을 포함한 한국의 3개 모델이 선정된 것을 알렸다.
SK텔레콤이 국내 최초 매개변수 500B(5000억 개) 규모의 초거대 AI 모델 'A.X K1'을 30일 과학기술정보통신부 주최 '독자 AI 파운데이션 모델 프로젝트 1차 발표회'에서 공개한다고 밝혔다. 공개 예정인 'A.X K1'은 국내 최초의 초거대 모델로, 미국과 중국에 이어 AI 3강 경쟁이 치열한 글로벌 무대에서 대한민국 AI 모델이 경쟁력을 갖추기 위한 체급으로 한 단계 도약했다는 점에서 중요한 의미를 갖는다는 평가다. A.X K1은 총 5190억 개의 매개변수로 구성되며, 사용자 요청에 의해 추론 작업을 할 때에는 약 330억 개의 매개변수가 활성화되는 구조다. 초거대 규모로 학습을 하되, 필요한 경우에는 최대한 가벼운 사양으로 동작할 수 있도록 했다. 앞선 글로벌 사례들에 따르면 500B급 이상의 초거대 모델은 복잡한 수학적 추론과 다국어 이해 같은 능력이 소형·중형 모델보다 안정되고, 이를 바탕으로 고난이도 코딩과 에이전트 작업 수행 등 확장성이 큰 기능도 보다 강력해진다. 에이전트 작업이란 인공지능 모델이 마치 똑똑한 비서처럼 스스로 판단하고 처리하는 기능이다. 사용자가 일일이 지시하지 않아도 AI가 알아서 이메일을 보내거나 문서를 만들고
반복 단위 스케줄링, 선택적 배치 처리 등 핵심 기술 적용...작업 효율↑ 비용↓ 프렌들리에이아이(FriendliAI)가 GPT-3와 같은 생성 모델의 효율을 획기적으로 끌어올리는 ‘오르카(Orca)’ 시스템을 발표했다. 오르카는 초거대 AI 모델의 효율적인 추론을 가능하게 하는 서빙 시스템이다. 기존 서빙 시스템에서 일어나던 비효율적인 지연을 없애기 위해 ‘반복 단위 스케줄링’과 ‘선택적 배치 처리’라는 핵심 기술을 적용했다. 가령 기존 시스템이 가장 목마를 오래 타고 싶은 사람이 만족할 때까지 아무도 회전목마에서 내리거나 올라탈 수 없도록 하는 방식이었다면, 오르카는 매번 회전목마가 돌 때마다 사람들이 내리거나 올라탈 수 있게 해 더 효율적이고 만족도 높은 운행이 가능하도록 한다는 것이다. 이를 통해 기존에 사용되던 시스템보다 수십 배 이상 빠른 속도로 초거대 언어 모델의 생성 작업을 수행할 수 있다. 특히 초거대 언어 모델을 사용하기 위한 비용이 수십 배나 줄어들어 이용자들의 접근성도 향상시킬 수 있을 것으로 기대된다. 프렌들리에이아이는 오르카를 사용하는 초거대 AI 서비스를 제공하고 있다. 전병곤 프렌들리에이아이 대표는 “OpenAI GPT-3 등의