배너
닫기

산업동향

배너

생성형 AI 시대, AI 반도체 자체 생산으로 이어지다

URL복사
[선착순 무료] 자동차와 전자산업을 위한 AI 자율제조혁신 세미나를 개최합니다 (4/24, 코엑스1층 전시장B홀 세미나장)

AI 반도체에 대한 관심이 뜨겁다. 기존 반도체 기업을 비롯해 빅테크까지 자체 AI 반도체 생산을 위한 작업에 나서고 있다. AI 반도체는 현대 기술의 핵심이며, AI 및 머신러닝 작업을 가속화하고 효율적으로 처리하는 데 중요한 역할을 한다. 고도의 병렬 처리 능력과 특화한 딥러닝 작업을 위한 최적화로, AI 응용 분야에서 뛰어난 성능을 제공한다. 빠르게 진화하는 디지털 환경에서, AI 반도체는 혁신과 산업의 디지털 변혁을 이끄는 핵심 기술 중 하나로 부상하고 있다.



‘X330’ 발표한 사피온 “데이터 센터 적극 공략”

 

사피온은 지난 10월 전작 대비 속도가 4배 향상된 데이터 센터용 AI반도체 ‘X330’을 출시한다고 밝혔다. X330은 TSMC의 7 나노공정을 통해 생산된 제품이다. 사피온은 주요 고객사를 대상으로 X330 시제품 테스트와 고객사와 신뢰성 검증 작업을 진행하고 내년 상반기부터 양산을 시작할 예정이다.

 

사피온은 향상된 성능 및 전력효율을 제공하는 X330을 통해 LLM(Large Language Model) 지원을 추가해 전반적인 TCO를 개선함으로써 AI 서비스 모델 개발 기업 및 데이터 센터 시장 공략에 적극 나설 계획이다. 사피온은 X330 반도체 하드웨어와 함께 서버 장착 시 성능을 최적화하는 개방형 신경망 교환(ONNX) 기반의 SW 스택을 지원하며, AI 추론 플랫폼 소프트웨어 및 소프트웨어 개발 도구(SDK)도 함께 제공한다.

 

X330은 추론용 NPU로서 전작인 X220에 비해 응용범위가 표준 기술 기반 하에 대폭 확대됐다. 따라서 보다 다양한 분야와 산업군에서 손쉽게 활용하는 NPU라고 말할 수 있다. X330은 기존 X220 대비 4배 이상의 연산 성능, 2배 이상의 전력효율을 확보했다. 이는 23년 출시된 경쟁사의 5nm 제품 대비 연산 성능은 약 2배, 전력 효율은 1.3배 이상 우수한 수준이다. 

 

X330은 동영상 관련 프로그램의 처리속도 향상을 위해 비디오 코덱 및 비디오 후처리 IP를 내장하고 있다. X330은 내장된 하드웨어 IP를 통해 4채널 4K 60fps 동영상 입력 처리가 가능하다. 기존 사피온 X220은 국내 최초로 고성능 AI 언어 모델인 ‘BERT’ 추론에서 우수한 성능을 증명했으며, 새로운 X330은 대화형 AI '챗GPT'의 원천기술인 트랜스포머 기반 LLM(Large Language Model) 실행을 달성했다. 

 

사피온은 이러한 뛰어난 성능과 혁신적인 AI 반도체 기술력을 기반으로, SK텔레콤과 협력을 강화해 신규 서비스 시장 공략에 적극 나서고 있다. 특히 사피온은 지난해 12월에 SK브로드밴드 가산 IDC 내에 사피온 AI반도체 X220 장착 서버를 사용해 7.6Peta OPS 처리량에 달하는 대규모 NPU 팜을 구축했고, 이를 통해 실제 데이터 센터 환경에서 서비스를 상용화하고, 운영하는 프로젝트를 본격적으로 추진한 바 있다. 사피온은 X330과 함께, 향후 자율주행 자동차용 IP, CCTV 등 고성능 엣지 디바이스용 AI NPU도 선보일 계획이다. 

 

 

마이크로소프트

 

마이크로소프트가 지난 10월 ‘마이크로소프트 이그나이트 2023’를 개최하고, AI 혁신과 변화를 예고한 100여개의 기술과 업데이트를 공개했다. 마이크로소프트는 오픈 AI와의 파트너십을 통해 검색, 공동 작업, 업무, 학습에 사용되는 챗GPT 기능을 통합하는 등 AI 기술의 발전을 주도해왔다. 특히 AI 기술 개발에 박차를 가하면서 하드웨어와 소프트웨어 모두의 최적화를 위해 클라우드 인프라를 고도화하고 있다. 

 

먼저 마이크로소프트는 데이터 센터 제품 전반의 새로운 혁신을 공개했다. 해당 제품군에는 업계 파트너사의 최신 AI 최적화 실리콘 기술과 마이크로소프트가 설계한 두 개의 새로운 칩이 포함된다. 마이크로소프트 애저 마이아는 AI 기술 가속화를 위해 설계된 칩으로, 오픈AI 모델, 빙, 깃허브 코파일럿, 챗GPT와 같은 AI워크로드에 대한 클라우드 기반 학습 및 추론을 수행하도록 설계됐다. 

 

마이크로소프트 애저 코발트는 Arm 아키텍처를 기반으로 한 클라우드 네이티브 칩이다. 다양한 종류의 작업을 수행하는 워크로드의 성능, 전력 효율성을 최적화한다. 애저 부스트도 공식 출시했다. 해당 시스템은 호스트 서버의 프로세스를 전용 하드웨어 및 소프트웨어로 이동시켜 스토리지 및 네트워크의 성능을 향상시킨다. 

 

나아가 실리콘 공급업체와의 파트너십 확장 계획도 발표했다. 이를 통해 맞춤형 실리콘을 보완하고 고객에게 더 나은 인프라 옵션을 제공할 수 있을 것으로 기대하고 있다. 이 일환으로 마이크로소프트는 애저에 AMD MI300X 가속 가상머신을 추가한다. ND MI300 가상머신은 고성능 AI 모델 학습 및 생성 추론 처리 가속화를 위해 설계됐으며, 여기에 AMD의 최신 GPU인 AMD 인스팅트 MI300X도 탑재할 예정이다. 

 

프리뷰로 제공되는 NC H100 v5 가상 머신 시리즈는 엔비디아 H100 텐서 코어 GPU용으로 제작된다. 이를 통해 미드레인지 AI 학습 및 생성 AI 추론에 대해 더 뛰어난 성능, 안정성과 효율성을 제공한다. 아울러 엔비디아 H200 텐서 코어 GPU가 탑재된 AI 최적화 가상머신 ND H200 v5 시리즈 출시 계획도 발표했다. 

 

헬로티 서재창 기자 |










배너









주요파트너/추천기업