Qwen 2.5에 방대한 한국어 데이터를 추가 학습시킴으로써 국내 환경에 최적화 SK텔레콤(이하 SKT)이 세계 최고 수준의 한국어 특화 대규모 언어모델(LLM) ‘A.X(에이닷 엑스) 4.0’을 오픈소스로 공개했다. 7월 3일 SK텔레콤은 글로벌 오픈소스 플랫폼 허깅페이스를 통해 720억 개(72B)의 파라미터를 가진 표준 모델과 70억 개(7B)의 경량 모델 등 두 가지 버전을 동시에 공개했다. A.X 4.0은 오픈소스 기반 모델인 Qwen 2.5에 방대한 한국어 데이터를 추가 학습시켜 국내 환경에 최적화한 성능을 구현한 것이 특징이다. 특히 SK텔레콤이 자체 설계한 토크나이저를 탑재해 동일한 한국어 문장 입력 시 GPT-4o보다 약 33% 높은 토큰 효율을 기록했다. 이는 정보 처리량 증가와 함께 운영 비용 절감이라는 두 마리 토끼를 잡을 수 있는 기술적 진보로 평가된다. 벤치마크 테스트에서도 성과가 두드러졌다. 한국어 능력 평가 지표인 KMMLU에서는 78.3점을 기록하며 GPT-4o(72.5점)를 웃돌았고, 한국 문화 이해도 평가인 CLIcK에서도 83.5점으로 GPT-4o(80.2점)를 앞질렀다. 이를 통해 A.X 4.0은 한국어와 한국 문화에 최
금융 디지털 전환 가속화 목표로 협력 체계 본격화할 예정 코난테크놀로지가 겟스마트와 생성형 AI 기반 사업 공동 추진을 위한 업무협약을 체결했다. 협약식은 지난 6월 27일 서울 서초동에 위치한 코난테크놀로지 본사에서 진행됐으며, 양사 대표를 비롯한 주요 경영진이 참석해 향후 협력 방안을 논의했다. 이번 협약은 생성형 AI 기술을 활용한 투자심사보고서 자동화 서비스를 공동으로 사업화하기 위한 전략적 파트너십의 일환으로, 양사는 금융 산업 내 디지털 전환 가속화를 목표로 협력 체계를 본격화할 계획이다. 특히 금융권 특화형 생성형 AI 서비스 공동 개발, 보안 요건을 충족하는 온프레미스 기반 솔루션 제공, 공동 영업을 통한 시장 확대 등이 핵심 협력 분야로 꼽힌다. 겟스마트는 GS ITM의 HRD 사업 부문에서 분사한 기업교육 플랫폼 전문 기업으로, 현재 금융, 의료, 항공 등 40여 개 기관에 맞춤형 인재관리 솔루션을 제공하고 있다. 특히 자체 개발한 AI Analyst 솔루션은 내부 문서와 ERP 데이터, 외부 정보 등 다양한 데이터를 종합해 투자심사보고서를 자동으로 생성하는 기능을 갖췄다. 이 솔루션은 이미 IMM인베스트먼트 등에서 활용 중이며, 향후 월
업스테이지 '솔라'를 퓨리오사AI의 레니게이드에 최적화할 계획 밝혀 업스테이지와 퓨리오사AI가 국내 AI 인프라의 자립화를 위해 손을 잡았다. 양사는 6월 26일 서울 강남구 퓨리오사AI 본사에서 ‘NPU 기반 생성형 AI 사업 협력’을 위한 양해각서(MOU)를 체결했다고 밝혔다. 이번 협력의 핵심은 국산 NPU와 거대언어모델(LLM)의 결합이다. 업스테이지는 자체 개발한 LLM ‘솔라(SOLAR)’를 퓨리오사AI의 차세대 신경망처리장치(NPU) ‘레니게이드(Renegade)’에 최적화해 탑재할 계획이다. 양사는 이 기술을 기반으로 온프레미스 AI 솔루션 구축 사업을 공동 추진하고, 국내뿐 아니라 글로벌 시장 공략에도 본격 나설 예정이다. 최근 생성형 AI 확산과 함께 글로벌 AI 반도체 시장은 엔비디아 중심의 공급 불균형, 가격 급등, 기술 종속 등 다양한 과제를 안고 있다. 특히 국내 기업들이 AI 모델을 구현하기 위한 고성능 연산 자원 확보에 어려움을 겪는 가운데, 이번 협력은 AI 하드웨어-소프트웨어의 국산화 가능성을 높인다는 점에서 업계의 주목을 받고 있다. 업스테이지와 퓨리오사AI의 협력은 이번이 처음이 아니다. 지난 2022년 업스테이지는 퓨리오
공공 및 민간 시장에 특화한 보안 솔루션을 공동으로 전개할 계획 디노티시아가 윈스테크넷과 ‘MCP (Model Context Protocol) 기반 AI 보안 인프라 공동 개발 및 사업 협력’을 위한 업무협약(MOU)을 체결했다고 23일 밝혔다. 이번 협약은 생성형 AI가 외부 시스템과 실시간으로 연결되는 MCP 환경에서 발생 가능한 보안 위협에 선제적으로 대응하고, 이를 기반으로 공공 및 민간 시장에 특화한 보안 솔루션을 공동으로 전개하기 위한 목적이다. MCP는 앤트로픽이 제안한 개방형 인터페이스 프로토콜로, LLM(Large Language Model)이 외부 시스템과 연결되어 정보를 실시간으로 조회하거나 기능을 실행할 수 있도록 한다. 디노티시아는 이번 협력으로 자사 MCP 기반 AI 인프라에 보안을 내재화하고, 윈스테크넷은 AI 서비스에서의 보안 솔루션을 개발해 시장 확대를 추진할 계획이다. 디노티시아는 MCP 기반 AI 에이전트를 탑재한 AI 워크스테이션을 올해 7월에 출시할 예정이다. 이 AI 워크스테이션은 온프레미스 환경에서 수십 명의 사용자가 공유해 사용할 수 있는 오피스 환경 특화 AI 에이전트 어플라이언스로, LLM 모델 'DNA 2.0'
양사, 소버린 AI 기술 자립도 끌어올리는 데 기여할 계획 국산 인공지능(AI) 기술 자립과 경쟁력 확보를 위한 코난테크놀로지와 리벨리온의 협력이 구체화하고 있다. 양사는 지난해 8월 생성형 AI 기술과 AI 반도체 기술 융합을 목표로 전략적 업무협약(MOU)을 체결하고 공동 연구개발에 착수한 바 있다. 협력의 핵심은 코난테크놀로지의 생성형 AI 기술과 리벨리온의 고성능 뉴럴 프로세싱 유닛(NPU)을 결합해 국산 기반의 독자적인 AI 생태계를 구축하는 것이다. 이를 통해 장기적으로는 소버린 AI(국가 주권형 AI) 기술 자립도를 끌어올리는 데 기여한다는 계획이다. 이러한 협력은 제품화 단계로 진입했다. 코난테크놀로지는 최근 기업형 온프레미스 AI 서버 ‘Konan AIStation Server’를 출시했다. 이 서버에는 자체 개발한 대규모 언어 모델(LLM) 'Konan LLM'이 기본 탑재돼 있으며, 리벨리온의 최신 NPU 'ATOM Server'에서도 원활히 작동한다. 현재 양사는 AIStation Server를 활용한 최적화 작업과 성능 검증을 진행하고 있다. 리벨리온은 시범 적용 결과를 바탕으로 코난 LLM이 탑재된 AIStation Server를 자
AI 솔루션 도입 위한 온프레미스 및 하이브리드 인프라 공동 구축 등 협력 추진 바이브컴퍼니와 에이에스티글로벌이 생성형 AI 솔루션의 안정적 도입과 온프레미스 기반의 AI 인프라 확산을 위해 손을 맞잡았다. 양사는 5월 22일 양해각서(MOU)를 체결하고, AI 솔루션과 인프라 통합을 위한 전략적 협력에 나선다고 밝혔다. 이번 협약의 핵심은 고도화된 AI 솔루션과 GPU 기반 인프라의 결합이다. 양사는 AI 솔루션 도입을 위한 온프레미스 및 하이브리드 인프라 공동 구축, 바이브컴퍼니의 주요 AI 솔루션 기반 공동 사업 전개, AI 환경 최적화를 위한 기술 협력을 주요 골자로 협력을 이어갈 방침이다. 바이브컴퍼니는 자체 개발한 생성형 LLM 모델 ‘VAIV GeM’을 중심으로 AI 검색(VAIV Search), 챗봇(VAIV Chatbot), 지식관리(KMS), 리서치(AIR) 등 다양한 업무 혁신 솔루션을 제공하고 있다. 특히 RAG 기반의 VAIV Search는 단순 생성형 응답이 아닌, 문서 기반의 신뢰 가능한 정답을 제시하는 구조로 설계돼 금융기관과 공공기관에서 빠르게 채택되고 있다. 한편, 에이에스티글로벌은 고성능 GPU 서버를 중심으로 AI 구현 컨
LLM 확장성과 실시간성 유지 및 보안 통제력 확보한 AI 에이전트 구축해 최근 기업이 생성형 AI의 잠재력을 현실로 전환하기 위해 ‘에이전트’를 속속 도입하고 있다. 하지만 막상 이를 도입하려는 현장에서는 보안, 인프라, 운용 부담 등으로 인해 '진짜 쓸 수 있는가'라는 회의감도 만만치 않다. 이러한 가운데, 올거나이즈가 ‘MCP(Model Context Protocol)’ 기술을 기반으로 한 ‘에이전트 빌더’를 자사 플랫폼 ‘알리(Alli)’에 탑재하며, AI 에이전트 실전 적용의 새 방향을 제시했다. 올거나이즈가 공개한 에이전트 빌더는 생성형 AI를 실무에 접목하려는 기업에게 직접적인 해답을 제시하는 솔루션이다. 핵심은 LLM의 확장성과 실시간성은 유지하면서도, 보안 통제력을 확보한 AI 에이전트를 구축하도록 설계됐다는 점이다. 이 기능은 최신 기술인 MCP 구조를 기반으로 한다. MCP는 LLM이 다양한 기능과 툴을 조합해 복잡한 업무를 처리할 수 있도록 지원하는 기술로, 요즘 급부상하고 있는 ‘에이전틱 RAG’ 구현에 필수 요소로 꼽힌다. 특히 MCP의 구조적 특성상 AI가 외부 기능을 실행하는 데 높은 권한을 필요로 하고, 그만큼 기업 시스템 침투