국내 팹리스가 핫 칩스 행사서 신제품 발표자로 선정된 첫 사례로 알려져 퓨리오사AI가 지난 26일(현지시간) 미국에서 열린 '핫 칩스(Hot Chips) 2024' 컨퍼런스에서 2세대 AI 반도체 '레니게이드'를 처음으로 공개했다. 퓨리오사AI의 2세대 AI 반도체인 레니게이드는 거대언어모델(LLM) 및 멀티모달 모델의 효율적인 추론을 위해 설계된 데이터 센터용 가속기다. 특히 이번 발표는 국내 팹리스가 핫 칩스 행사에서 신제품 발표자로 선정된 첫 사례로 알려져 화제가 됐다. HBM3가 탑재된 혁신적 추론용 AI 반도체에 대한 행사 현장의 관심과 반응도 높아, 레니게이드가 시장에 새로운 바람을 일으킬 것으로 기대된다. 퓨리오사AI는 2017년 삼성전자, AMD, 퀄컴 출신의 세 명의 공동 창업자에 의해 설립된 이후, 지속적인 기술 혁신과 제품 양산에 집중해 왔다. 그 결과 TSMC로부터 첫 레니게이드 샘플을 올 5월에 받은 후 빠른 속도로 브링업을 완료함으로써 퓨리오사AI는 1세대 제품 개발부터 양산까지 과정에서 입증했던 역량을 강화했다. 이뿐 아니라 2021년 당시 출시된 1세대 칩 첫 샘플을 받은 지 3주 만에 브링업을 완료하고 MLPerf 벤치마크 결과
헬로티 조상록 기자 | IBM은 첨단 반도체 기술이 공개되는 핫 칩(Hot Chips) 연례 회의에서 기업 워크로드에 딥 러닝 추론 기술을 적용하여 금융 사기에 실시간으로 대응하는 데 도움이 되도록 설계된 새로운 IBM '텔럼(Telum) 프로세서'의 세부 정보를 공개했다. 7nm EUV 기술 노드에서 개발된 텔럼 프로세서는 거래 처리 중에 AI 추론 기술을 적용할 수 있도록 온칩 가속 기술을 포함한 IBM의 첫 번째 프로세서이자, 삼성이 기술 개발 파트너로 참여한 제품이기도 하다. 3 년의 연구 개발 기간을 거쳐 공개된 혁신적인 온칩 하드웨어 가속 기술은 은행, 금융, 주식 매매, 보험 애플리케이션 및 고객 대응 전반에 걸쳐 대규모 비즈니스 통찰력을 얻는데 도움을 줄 수 있도록 설계되었다. 텔럼 기반의 시스템은 2022년 상반기에 출시될 계획이다. IBM 텔럼은 데이터가 있는 곳에서 애플리케이션을 효율적으로 실행할 수 있도록 설계되어, 추론을 처리하기 위해 상당한 메모리와 데이터 이동 기능을 요구하는 기존의 엔터프라이즈 AI 접근 방식을 극복하는 데 도움이 된다. 텔럼을 사용하면 성능에 영향을 미칠 수 있는 별도의 플랫폼 AI 솔루션을 호출하는 방식 대신,