모레는 AMD와 함께 최신 기술 트렌드를 공유하고 AMD 생태계 협업을 촉진하기 위한 ‘AI 개발자 밋업’을 개최했다고 11일 밝혔다. 이번 행사는 10일 알로프트 서울 강남에서 진행됐으며, 국내외 AI 개발자와 오픈소스 커뮤니티, 업계 관계자 등 약 100여 명이 참석했다. 참석자들은 AMD 생태계에서 오픈소스 LLM, 비전 모델, 추론 프레임워크를 가속화하는 최신 기술과 현황을 공유했다. AMD에서는 정승록 수석 AI/ML 소프트웨어 엔지니어가 ‘AMD GPU 최적화를 통한 오픈소스 LLM 가속화’를 주제로 발표를 진행했으며, 모레에서는 정우근 CTO가 자체 개발한 차세대 AI 추론 플랫폼인 ‘MoAI 추론 프레임워크’를 소개했다. 정우근 CTO는 ‘MoAI 추론 프레임워크’를 활용해 AMD GPU 클러스터 환경에서 딥시크 등 거대 AI 모델의 고처리량 추론을 성공적으로 실증한 사례를 공유했다. 또한 모레의 독자적인 분산 추론 솔루션을 적용해 모델 추론 성능을 높이고 TCO를 절감한 성과, AMD 생태계 확대 측면에서의 기술적 이점을 설명했다. 이어 추론 비용 절감을 위한 차세대 대형 추론 클러스터 운영 기술 및 이기종 GPU 통합 기술 등 모레의 최신
퓨리오사AI가 자사의 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 LG의 대규모 언어모델(LLM) ‘엑사원(EXAONE)’에 전면 도입했다고 22일 밝혔다. 이번 협업은 양사가 약 8개월에 걸쳐 진행한 성능 검증을 바탕으로 추진됐으며, 이를 통해 레니게이드는 GPU를 대체할 수 있는 현실적인 대안으로 주목받고 있다. LG AI연구원은 엑사원 3.5 모델의 파일럿 환경에 레니게이드를 적용해 테스트한 결과, 전력 대비 성능에서 기존 GPU보다 약 2.25배 높은 효율을 확인했다. 특히 대규모 AI 모델 구동 시 GPU가 갖는 고질적인 전력 소모 문제를 해결하면서도 고성능 요건을 충족시켰다는 점에서 의미가 크다. 이번 사례는 대형 엔터프라이즈 AI 추론 환경에서 GPU 이외의 가속기가 실질적으로 도입된 첫 사례 중 하나로, 산업 전반에서 AI 인프라 다변화 가능성을 제시했다. 퓨리오사AI는 이를 통해 글로벌 기업을 대상으로 한 엔터프라이즈 레퍼런스를 확보하게 되었으며, 향후 대형 AI 프로젝트에 활용도를 확대할 수 있는 기반을 마련하게 됐다. LG 측도 레니게이드의 실용성을 높이 평가했다. 전기정 LG AI연구원 프로덕트 유닛장은 “다양한 GPU 및 NPU
RNGD 기반 인프라 접근 개방 및 Llama 3.1 사전 컴파일 모델 기반 API도 추가 제공 예정 퓨리오사AI가 자체 개발한 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 마이크로소프트 애저 마켓플레이스에 공식 등록하며, 글로벌 시장 확대에 본격 시동을 걸었다. 이번 조치는 LLM과 멀티모달 AI 추론 환경에 최적화된 고성능 인프라를 세계 수백만 애저 고객이 즉시 활용할 수 있는 길을 열었다는 점에서 주목된다. 레니게이드는 클라우드 중심 환경은 물론 온프레미스와 하이브리드 인프라에도 유연하게 적용 가능한 데이터센터용 AI 가속기로, 2023년 핫칩스(Hot Chips) 컨퍼런스에서 첫 공개된 이후 글로벌 반도체·AI 업계의 큰 관심을 받아왔다. 특히 수 분 내로 추론용 인프라를 배포할 수 있고, 수요에 따라 유연하게 확장 가능하며, 기존 애저 데이터 및 소프트웨어 스택과의 통합도 원활해 클라우드 기반 AI 모델 운영의 접근성과 효율성을 크게 높인 것이 특징이다. 이번 입점을 통해 퓨리오사AI는 애저 사용자에게 RNGD 기반 인프라 접근을 개방하고, 추후 Llama 3.1 사전 컴파일 모델 기반 API도 추가 제공할 계획이다. 기업 고객들은 이를 통해