모레(MOREH)가 미국 산타클라라에서 열린 ‘AI 인프라 서밋 2025’에 참가해 AMD 기반 분산 추론 시스템과 글로벌 협업 성과를 공개했다. 이번 행사는 반도체, 시스템, 데이터센터, 엣지 AI 등 AI 인프라 전 분야를 아우르는 글로벌 전문 행사로, 3500명 이상이 참석하고 100여 개 파트너사가 함께했다. 조강원 대표는 엔터프라이즈 AI 세션에서 주제 발표를 통해 모레의 분산 추론 시스템을 소개하며, 최신 딥러닝 모델인 딥시크 최적화 벤치마크에서 엔비디아 대비 효율성을 높였다고 밝혔다. 또한 텐스토렌트 하드웨어와 자사 소프트웨어를 결합한 차세대 AI 반도체 시스템을 처음 선보이며, 가격 경쟁력을 갖춘 다양한 대안을 제시했다. 모레는 딥러닝 추론 소프트웨어 생태계를 주도하는 SGLang과 공동 발표를 진행하고, 부스 운영과 네트워킹 이벤트를 통해 북미 시장에서의 입지를 강화했다. 양사는 향후 AMD 기반 분산 추론 시스템을 공동 개발해 빠르게 성장하는 글로벌 딥러닝 추론 시장을 공략할 계획이다. 조 대표는 “모레는 AMD의 글로벌 소프트웨어 파트너 중에서도 기술 역량이 가장 탄탄하다”며, 현재 주요 LLM 기업들과 PoC를 진행 중임을 강조했다. 이
AI반도체 조합으로 효율적인 분산 추론과 모델 최적화 기술 확보에 초점 맞춰 코난테크놀로지가 과학기술정보통신부가 추진하는 K-클라우드 기술개발 사업의 일환으로 진행되는 ‘이종 AI반도체 기반 분산 추론 및 모델 최적화 기술 개발’ 과제에 참여하게 됐다. 본 과제는 과기정통부의 중장기 전략 하에 국내 AI 인프라의 기술 자립과 경쟁력 확보를 목표로 기획된 프로젝트다. 해당 과제는 총 104억 원 규모로, 2025년 4월부터 2029년 12월까지 약 4년 9개월간 진행된다. 한국전자통신연구원(ETRI)이 주관하며, 공동 연구 컨소시엄에는 AI 반도체 스타트업 리벨리온, 서울대학교, 한국과학기술원(KAIST), 그리고 코난테크놀로지가 참여한다. 이번 과제의 핵심은 NPU, PIM 등 다양한 구조의 AI반도체를 조합해 효율적인 분산 추론과 모델 최적화를 구현하는 기술을 확보하는 것이다. 특히, 고비용·고연산을 요구하는 대규모 언어모델(LLM) 기반 서비스가 늘어나는 상황에서, 다양한 AI 하드웨어 환경에 맞춘 분산형 AI 소프트웨어 프레임워크 개발이 산업적 관건으로 부상하고 있다. 코난테크놀로지는 이 중 ‘LLM-RAG 기반 분산 추론 통합 실증 서비스’ 부문을 담