자체 개발 AI 칩 열풍 그리고 보법이 다른 엔비디아 속셈

2025.02.18 23:16:19

서재창 기자 eled@hellot.net


AI 반도체 시장의 판도가 빠르게 변화하고 있다. AI 반도체 수요가 급속도로 확대됨에 따라, 기업들은 엔비디아 GPU 의존도를 줄이기 위한 움직임에 나섰다. AI 개발에 필수가 된 엔비디아 GPU는 높은 몸값을 자랑하기 때문이다. 메타, 마이크로소프트, 아마존과 같은 글로벌 IT 기업뿐 아니라, 국내 AI 반도체 스타트업도 독자적인 기술력 확보를 위해 연구·개발에 적극 투자하고 있다. 


 

업계에 부는 자체 AI 칩 생산 바람

 

AI 기술의 급격한 발전과 함께, 고성능 연산을 처리하는 AI 반도체 수요는 가히 폭발적이다. 이 과정에서 가장 큰 수혜를 본 기업은 단연 엔비디아다. 이 기업은 독보적인 GPU 성능으로 AI 시장의 선두주자로 떠올랐다. 그랬던 AI 반도체 시장에서 변화의 조짐이 보인다. 다수의 기업이 엔비디아의 GPU에 대한 의존도를 줄이고, 자체적인 AI 반도체 개발에 박차를 가하고 있다. 비단 이러한 움직임은 엔비디아 GPU에 소요되는 ‘비용 줄이기’에만 국한된 건 아니다. 

 

 

기업들은 자체 AI 칩 개발을 통해 성능 최적화, 데이터 보안 강화 등 다양한 전략적 이점을 추구하는 데 집중하고 있다. 특히 맞춤형 AI 칩은 특정 워크로드에 최적화한 성능을 구현하고 에너지 효율성을 높여, 데이터 센터의 운영 비용을 절감하는 데 초점이 맞춰진다. 또한, 반도체 디자인 툴과 관련 서비스의 이용료 감소와 접근성 향상으로 중소형 업체의 맞춤형 반도체 개발 기회가 확대된다. PwC컨설팅이 공개한 보고서에 따르면, 오는 2028년까지 데이터 센터용 맞춤형 반도체 시장은 연간 240억 달러에 이를 것으로 예상된다.

 

최근 Arm은 올해 자체 AI 칩을 선보이겠다고 발표해 화제가 됐다. 파이낸셜타임스(FT)의 보도에 따르면, Arm 르네 하스 CEO는 이미 이 칩의 첫 번째 고객으로 메타플랫폼이 낙점됐음을 언급하기도 했다. 업계에서는 Arm의 자체 칩 발표 선언이 새로운 변화를 가져올 것으로 예상했다. 또한, 소프트뱅크 손정의 회장이 AI 인프라 구축을 목표로 삼은 이상, 향후 행보에 관심이 쏠릴 수밖에 없는 상황이다. FT는 Arm의 첫 칩이 대규모 데이터 센터 서버에 들어가는 CPU가 될 것이라고 예상했다.

 

국내에서는 메타와 퓨리오사AI 간 인수 논의가 업계의 이목을 집중시켰다. 인수에 대한 구체적인 사항이 수면 위로 오르진 않았으나 두 기업의 빅딜이 성사된다면, AI 반도체 기술이 가진 영향력을 방증하는 사례가 될 것으로 보인다. 퓨리오사AI는 데이터 센터 서버에 들어가는 AI 추론 연산에 특화한 반도체를 개발하는 국내 주요 팹리스다. 가장 최근 공개된 제품은 지난해 8월 공개된 AI 반도체 ‘레니게이드(RNGD)’다.

 

메타는 퓨리오사AI의 AI 반도체 기술력을 확보해 자체 칩 생산에 나설 것으로 보인다. 주요 빅테크들이 데이터 센터 구축을 위해 막대한 자금을 쏟아부을 것으로 예상되는 가운데, 메타 역시 올해 데이터 센터 구축을 위해 650억 달러(93조 원)를 투자할 것으로 밝히기도 했다.

 

오픈AI는 이미 AI 칩 설계를 마치고 TSMC와의 생산 계약을 앞둔 것으로 알려졌다. 로이터 통신에 따르면, 오픈AI는 브로드컴과 AI 칩 개발에 나섰으며, 내년 양산을 목표로 움직이고 있다고 밝혔다. 앞서 오픈AI는 칩 설계팀을 40여 명으로 늘리는 등 짧은 기간에 두 배로 증가시켰다. 또한, 이 프로젝트를 성사시키기 위해 구글에서 TPU 제작을 주도했던 리처드 호(Richard Ho)를 하드웨어 담당자로 영입하기도 했다. 로이터 통신은 오픈AI가 설계하는 칩이 AI 모델을 훈련하기보다 실행하는 제한적 역할을 할 것이라고 예상했다.

 

마이크로소프트(MS) 역시 올해 AI 데이터 센터 구축을 위해 800억 달러를 투자할 계획이라고 밝혔다. 이러한 대규모 투자는 AI 기술 경쟁력 강화에 초점을 맞춘 행보로, 자체 AI 반도체 개발 및 인프라 구축에 사용될 것으로 예상된다. MS는 지난 회계연도에 AI 투자를 포함한 전체 지출액을 557억 달러로 밝혔으며, 그보다 약 250억 달러를 초과하는 자본을 투자하게 됐다.

 

 

자체 칩 생산은 엔비디아 그늘 벗어나기?

 

이처럼, 반도체 기업을 비롯해 빅테크까지 엔비디아 GPU를 대체할 자체 AI 칩 개발에 속도를 높이고 있다. 엔비디아 의존도를 낮추려는 주된 이유는 비용 절감 및 생산 효율성 확보다. 엔비디아의 H100 GPU 가격은 개당 3만~4만 달러에 이르며, 대량 도입 시 큰 비용 부담으로 다가온다. 일반적으로, AI 데이터 센터 운영비용의 50% 이상이 엔비디아 GPU 구매 및 유지 비용으로 소모되는 것으로 알려져 있다. 이에 장기적인 관점에서 수요 기업들은 자체 AI 칩 개발을 통해 운영비 절감을 도모하는 것이다.

 

대표적으로, 구글은 지난 2015년부터 엔비디아 GPU를 대신하는 TPU(Tensor Processing Unit) 개발을 추진했으며, 현재 이 칩은 구글 내부 AI 연산 및 클라우드 서비스에 활용되고 있다. AWS는 자체 AI 칩인 트레이니움(Trainium)과 인퍼런시아(Inferentia)를 활용해 클라우드 인프라의 AI 가속기 비용을 줄였다. 메타 역시 MTIA(Meta Training and Inference Accelerator) 개발을 통해 챗봇 및 AI 추천 시스템 최적화를 추진한 바 있다.

 

두 번째 이유로, 기업들은 각사의 AI 워크로드에 최적화한 칩을 원한다. 엔비디아의 GPU는 범용 AI 연산에 강점이 있지만, 각 기업별 AI 모델에 최적화하지 않은 불필요한 연산을 포함한다. 자체 AI 칩은 자사 서비스에 적합한 연산 구조를 설계함으로써 성능을 극대화한다. 테슬라의 경우 자체 AI 칩을 탑재한 슈퍼컴퓨터 ‘도조(Dojo)’를 제작함으로써 자율주행 AI 트레이닝에 최적화한 연산 설계가 가능했다, 이 칩은 GPU 대비 4배의 성능 향상을 이룬 것으로 알려졌다. 애플은 자체 제작한 AI 칩 ‘M4’에 뉴럴 엔진(Neural Engine)을 접목시켜 아이폰, 맥북 등 장비의 처리 속도와 배터리 효율을 극대화했다.

 

세 번째 요인은 공급망 리스크에 따른 독립성 확보다. TSMC에서만 생산되는 엔비디아 GPU는 수급 불안으로 인해 공급이 지연되거나 가격이 폭등하는 문제가 발생한다. 기업들은 자체 AI 칩 개발로 공급망을 다변화함으로써 안정적인 반도체 수급을 원하고 있다. 한 예로, 중국은 미국의 반도체 수출 규제로 인해 GPU 수급이 어려워지자 화웨이, 알리바바, 바이두, 텐센트 등의 주요 기업은 자체 AI 칩 개발에 집중할 수밖에 없었다. 특히 화웨이는 자사의 AI 칩인 ‘어센드(Ascend)’를 개발해 엔비디아 GPU 없이 AI 모델을 훈련 중인 것으로 알려졌다.

 

데이터 보안에 있어서도 자체 칩이 선호된다. 기업은 자체 칩 사용으로 데이터 주권을 확보하고 보안을 강화할 수 있어 내부 AI 데이터 보호에 유리하다. 데이터 전송 없이 로컬 연산이 가능해짐으로써 AI 서비스 속도를 향상한다. 마이크로소프트는 자사가 만든 AI 칩인 ‘마이아(Maia)’를 활용해 클라우드 서비스인 마이크로소프트 애저를 최적화하는 데 성공했다.

 

‘1위’ 엔비디아, 어떻게 미래 지킬까?

 

엔비디아는 GPU라는 대체불가한 아이템으로 AI 시대를 지배하고 있다. 다만 앞서 언급했듯이, 엔비디아가 구축한 생태계에서 벗어나려는 기업들의 움직임 또한 활발해지는 시점이다. 기업들이 엔비디아 GPU 의존도를 줄이기 위해 자체 AI 칩을 개발하는 것은 엔비디아에 분명한 위협 요소다. 이를 엔비디아 역시 모를 리 없다. 엔비디아는 이미 이러한 변화에 대응하기 위한 전략을 마련하고 있다. 막강한 GPU 지배력을 유지하는 데 그치지 않고 소프트웨어와 AI 인프라 나아가 AI 생태계를 주도하기 위한 전략을 구상 중이다.

 

엔비디아의 위기 요인은 주요 기업들의 자체 칩 생산, AI 반도체 시장의 다변화, 반도체 수출 규제 리스크 정도로 정리된다. 이에 엔비디아는 소프트웨어와 AI 플랫폼 강화에 전력을 기울이고 있다. 사실 엔비디아의 위력은 GPU 못지 않게 소프트웨어 플랫폼인 ‘쿠다(CUDA)’에 있다고 해도 과언이 아니다. 엔비디아는 쿠다를 앞세워 소프트웨어 생태계를 주도하고 있다.

 

쿠다 기반의 AI 소프트웨어를 독점 제공함으로써 고객이 쉽게 이탈하지 못하도록 만드는 전략이다. 이는 자체 칩을 개발하는 기업도 쿠다 생태계를 활용해야 하는 구조다. 한 예로, 엔비디아는 AI 모델 최적화 및 GPU 가속 솔루션을 제공하는 ‘텐서RT’와 ‘cuDNN 라이브러리’, 산업용 AI 및 시뮬레이션 소프트웨어 ‘옴니버스’ 등을 앞세워 소프트웨어 확장을 이끌고 있다.

 

엔비디아는 GPU 판매뿐 아니라 AI 클라우드 인프라를 직접 제공하는 방향으로도 전환하고 있다. AI 연구 및 모델 훈련을 위한 DGX 슈퍼컴퓨터, 엔비디아 클라우드 AI 인프라를 고객에게 제공하는 것이다. 자체 칩을 개발한 기업도 AI 모델 학습을 위해 엔비디아의 클라우드 서비스를 활용할 가능성을 높였다. 여기에는 대규모 AI 트레이닝을 위한 슈퍼컴퓨터 시스템 ‘DGX SuperPOD’, 엔터프라이즈 AI 서비스를 제공하는 ‘엔비디아 AI 엔터프라이즈’, 대규모 언어 모델 훈련 플랫폼 ‘네모 메가트론’ 등이 해당된다.

 

이와 함께 엔비디아는 고객이 필요로 하는 맞춤형 AI 반도체를 공동 개발하는 방식을 도입할 가능성도 존재한다. 이미 맞춤형 AI 반도체 시장에 진출한 엔비디아는 자체 칩을 개발하려는 빅테크 자사의 기술을 활용한 AI 칩 공동 설계 옵션을 제공할 수 있다.

 

한 예로, 엔비디아 ‘GH200 그레이스 호퍼 슈퍼칩’은 AI 및 고성능 컴퓨팅(HPC) 애플리케이션을 위한 CPU와 GPU의 코히어런트 메모리 모델을 제공하며, 이는 엔비디아 NVLink-C2C를 통해 구현된다. 데이터 센터 및 AI 인프라 최적화 칩 ‘블루필드 DPU’도 네트워킹, 스토리지, 보안 등의 기능을 가속화하는 주요 옵션이다.

 

 

당분간은 엔비디아 독주, 5년 뒤에는?

 

엔비디아가 여전히 강력한 시장 지배력을 가지고 있지만, 향후 5년 내 AI 반도체 시장이 다변화할 가능성이 높다는 해석이 지배적이다. 특히 AI와 데이터 센터 분야에서의 주도적 위치를 기반으로 2025년까지 강력한 성장을 이어갈 것으로 보인다. 2025년까지 엔비디아의 매출은 1290억 달러에 이를 것으로 예상되며, 이는 전년 대비 112% 증가한 수치다. AI 데이터 센터 인프라에 대한 수요 증가로 인해, 엔비디아의 데이터 센터 부문 매출은 지속적인 성장이 예상된다.

 

파이낸셜 타임스(FT)도 AI 기술의 발전과 함께, 엔비디아의 GPU는 자율주행차, 로보틱스 등 다양한 분야에서 핵심적인 역할을 수행할 것으로 예상했다. 특히, 2050년까지 수백만 대의 AI 기반 로봇이 도입될 것으로 전망되며, 이는 엔비디아의 시장 확대에 긍정적인 영향을 미칠 것이라고 내다봤다.

 

일부 분석가들은 2026년까지 엔비디아의 연평균 성장률(CAGR)이 약 33%로 다소 둔화될 수 있다고 전망했다. 이는 AI 투자 수익성에 대한 우려와 시장 경쟁 심화 등이 원인으로 지목됐다. 결론적으로, 엔비디아의 시장 영향력은 2025년까지 강력한 성장을 보일 것으로 예상되며, 이후에도 AI 기술의 발전과 다양한 산업 분야로의 확장을 통해 지속적인 영향력을 유지할 것으로 보인다.

 

다만, 향후 AI 반도체 시장은 몇 가지 변수가 존재한다. 먼저 엔비디아의 시장 지배력이 지속되는 가운데, 브로드컴과 마벨과 같은 경쟁사들이 맞춤형 ASIC(주문형 반도체) 칩을 통해 시장 점유율 확대를 노리는 추세다. 이러한 경쟁은 시장의 역학 관계를 변화시킬 수 있다. 지정학적 긴장과 규제 변화도 시장에 변화를 가져올 수 있는 요인이다. 도널드 트럼프 2기 행정부가 출범함에 따라, 미국 정부의 반도체 수출 규제 강화는 글로벌 공급망에 불확실성을 초래하며, 이는 주요 반도체 기업의 투자 결정에 영향을 줄 수 있다.

 

기술 발전의 속도와 함께, AI 반도체의 에너지 효율성과 성능 향상에 대한 요구도 높아지고 있다. 특히 전력난에 대한 우려가 높아지는 추세다. 이는 지속적인 연구 개발과 혁신을 필요로 하며, 반도체 기업은 이에 대응하기 위해 막대한 자원을 투입하고 있다.

 

국제에너지기구(IEA)에 따르면, 지난 2022년 전 세계 데이터 센터의 전력 소비량은 전체 전력 수요의 약 2%인 460테라와트시(TWh)에 달했다. 이 수치는 2026년까지 1000TWh를 넘어설 것으로 예상된다. 데이터 센터의 전력 부족은 AI 반도체 수요 감소로 이어질 수 있으며, 이는 반도체 생산 계획에 차질을 빚을 것으로 예상된다.

 

헬로티 서재창 기자 |

Copyright ⓒ 첨단 & Hellot.net





상호명(명칭) : (주)첨단 | 등록번호 : 서울,자00420 | 등록일자 : 2013년05월15일 | 제호 :헬로티(helloT) | 발행인 : 이종춘 | 편집인 : 김진희 | 본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2012년 4월1일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호 copyright(c) HelloT all right reserved.