모레는 AMD와 함께 최신 기술 트렌드를 공유하고 AMD 생태계 협업을 촉진하기 위한 ‘AI 개발자 밋업’을 개최했다고 11일 밝혔다. 이번 행사는 10일 알로프트 서울 강남에서 진행됐으며, 국내외 AI 개발자와 오픈소스 커뮤니티, 업계 관계자 등 약 100여 명이 참석했다. 참석자들은 AMD 생태계에서 오픈소스 LLM, 비전 모델, 추론 프레임워크를 가속화하는 최신 기술과 현황을 공유했다. AMD에서는 정승록 수석 AI/ML 소프트웨어 엔지니어가 ‘AMD GPU 최적화를 통한 오픈소스 LLM 가속화’를 주제로 발표를 진행했으며, 모레에서는 정우근 CTO가 자체 개발한 차세대 AI 추론 플랫폼인 ‘MoAI 추론 프레임워크’를 소개했다. 정우근 CTO는 ‘MoAI 추론 프레임워크’를 활용해 AMD GPU 클러스터 환경에서 딥시크 등 거대 AI 모델의 고처리량 추론을 성공적으로 실증한 사례를 공유했다. 또한 모레의 독자적인 분산 추론 솔루션을 적용해 모델 추론 성능을 높이고 TCO를 절감한 성과, AMD 생태계 확대 측면에서의 기술적 이점을 설명했다. 이어 추론 비용 절감을 위한 차세대 대형 추론 클러스터 운영 기술 및 이기종 GPU 통합 기술 등 모레의 최신
모레(MOREH)가 미국 산타클라라에서 열린 ‘AI 인프라 서밋 2025’에 참가해 AMD 기반 분산 추론 시스템과 글로벌 협업 성과를 공개했다. 이번 행사는 반도체, 시스템, 데이터센터, 엣지 AI 등 AI 인프라 전 분야를 아우르는 글로벌 전문 행사로, 3500명 이상이 참석하고 100여 개 파트너사가 함께했다. 조강원 대표는 엔터프라이즈 AI 세션에서 주제 발표를 통해 모레의 분산 추론 시스템을 소개하며, 최신 딥러닝 모델인 딥시크 최적화 벤치마크에서 엔비디아 대비 효율성을 높였다고 밝혔다. 또한 텐스토렌트 하드웨어와 자사 소프트웨어를 결합한 차세대 AI 반도체 시스템을 처음 선보이며, 가격 경쟁력을 갖춘 다양한 대안을 제시했다. 모레는 딥러닝 추론 소프트웨어 생태계를 주도하는 SGLang과 공동 발표를 진행하고, 부스 운영과 네트워킹 이벤트를 통해 북미 시장에서의 입지를 강화했다. 양사는 향후 AMD 기반 분산 추론 시스템을 공동 개발해 빠르게 성장하는 글로벌 딥러닝 추론 시장을 공략할 계획이다. 조 대표는 “모레는 AMD의 글로벌 소프트웨어 파트너 중에서도 기술 역량이 가장 탄탄하다”며, 현재 주요 LLM 기업들과 PoC를 진행 중임을 강조했다. 이
AI반도체 조합으로 효율적인 분산 추론과 모델 최적화 기술 확보에 초점 맞춰 코난테크놀로지가 과학기술정보통신부가 추진하는 K-클라우드 기술개발 사업의 일환으로 진행되는 ‘이종 AI반도체 기반 분산 추론 및 모델 최적화 기술 개발’ 과제에 참여하게 됐다. 본 과제는 과기정통부의 중장기 전략 하에 국내 AI 인프라의 기술 자립과 경쟁력 확보를 목표로 기획된 프로젝트다. 해당 과제는 총 104억 원 규모로, 2025년 4월부터 2029년 12월까지 약 4년 9개월간 진행된다. 한국전자통신연구원(ETRI)이 주관하며, 공동 연구 컨소시엄에는 AI 반도체 스타트업 리벨리온, 서울대학교, 한국과학기술원(KAIST), 그리고 코난테크놀로지가 참여한다. 이번 과제의 핵심은 NPU, PIM 등 다양한 구조의 AI반도체를 조합해 효율적인 분산 추론과 모델 최적화를 구현하는 기술을 확보하는 것이다. 특히, 고비용·고연산을 요구하는 대규모 언어모델(LLM) 기반 서비스가 늘어나는 상황에서, 다양한 AI 하드웨어 환경에 맞춘 분산형 AI 소프트웨어 프레임워크 개발이 산업적 관건으로 부상하고 있다. 코난테크놀로지는 이 중 ‘LLM-RAG 기반 분산 추론 통합 실증 서비스’ 부문을 담