어센드 910C 생산하는 SMIC 수율이 관건인 것으로 알려져 화웨이가 엔비디아에 대항할 새로운 AI 칩을 내년 1분기부터 양산할 예정이라고 로이터통신이 21일 보도했다. 소식통 두 명은 로이터에 "화웨이가 '어센드(Ascend) 910C' 샘플을 일부 IT 기업에 보내 주문받기 시작했다"면서 이같이 밝혔다. 앞서 화웨이는 잠재 고객사에 "910C 성능이 엔비디아 H100 칩에 비견될 만하다"고 설명했다. 다만 어센드 910C를 생산하는 SMIC 수율이 관건인 것으로 알려졌다. 상업성을 갖추기 위해서는 70% 이상의 수율이 필요하지만, 미국의 제재로 최첨단 리소그래피 장비가 부족해 약 20%에 머물러 있다는 것이다. 중국은 현재 미국 주도의 제재로 인해 ASML의 최첨단 극자외선(EUV) 리소그래피 장비에 대한 수입이 막혀 있다. 910C 이전 버전 910B도 수율이 약 50%에 그쳐 화웨이가 생산 목표를 낮췄고 제품 인도도 지연되고 있다고 소식통들은 전했다. 실제로 바이트댄스는 10만 개 이상의 910B 칩을 주문했지만, 지난 7월 기준 3만 개도 받지 못했다. 화웨이에 주문한 다른 기업들도 비슷한 불만을 제기했다. 한 소식통은 "화웨이는 EUV 리소그래피
인텔 NPU 활용해 AI 추론 영역에서의 효율성 극대화 디자이노블이 인텔과의 협업을 통해 인공지능(AI) 기술의 새로운 도약을 알렸다. 이번 협력에서 디자이노블은 GPU 없이도 높은 성능을 발휘할 수 있는 인텔의 NPU(Neural Processing Unit) 기반 기술을 도입해 AI 성능을 획기적으로 개선하는 데 성공했다. 디자이노블은 인텔 NPU를 활용해 AI 추론 영역에서의 효율성을 극대화하며, 기존 GPU 기반 시스템 대비 비용을 대폭 절감했다. 이를 통해 패션 디자인을 생성하는 이미지 생성 솔루션의 성능을 기존보다 10% 이상 향상시키는 동시에, 고객이 원하는 디자인을 더 빠르고 정확하게 추천받을 수 있도록 최적화했다. 또한 CLIP(Contrastive Language-Image Pre-training) 모델의 임베딩 프로세스를 개선해 초당 40 프레임(FPS) 이상의 실시간 성능을 구현했다. 텍스트나 이미지 기반 검색의 속도와 정확도를 크게 향상시킨 것이다. 디자이노블은 패션 브랜드와 유통기업을 대상으로 ‘마켓 인텔리전스’, ‘트렌드 센싱’, ‘이미지 생성’ 등 AI 기반 핵심 솔루션을 제공하고 있으며, 중소기업까지 포함한 고객들이 비용 부담
양사, 로컬 보안 AI 컴퓨팅 수요 충족하는 AI 마켓플레이스 구축할 것으로 합의 엔비디아가 엔비디아 AI 서밋 재팬에서 소프트뱅크와의 협업을 발표했다. 이를 통해 엔비디아는 일본의 소버린 AI 이니셔티브를 가속화하고 글로벌 기술 리더십을 강화하기 위해 지원할 계획이다. 또한 이 협업은 전 세계 통신 사업자들에게 수십억 달러의 AI 수익 기회를 창출할 것을 목표로 한다. 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 엔비디아 AI 서밋 재팬 기조연설에서 소프트뱅크가 엔비디아 블랙웰 플랫폼을 사용해 일본에서 가장 강력한 AI 슈퍼컴퓨터를 구축하고 있다고 말했다. 아울러 차기 슈퍼컴퓨터에 엔비디아 그레이스 블랙웰 플랫폼을 사용할 계획이라고 발표했다. 아울러 엔비디아는 소프트뱅크가 엔비디아 AI 에리얼 가속 컴퓨팅 플랫폼을 사용해 세계 최초로 AI와 5G 통신 네트워크를 결합한 시범 서비스에 성공했다. 이는 통신 사업자에게 잠재적으로 수십억 달러 상당의 AI 수익원을 열어주는 컴퓨팅 분야의 획기적인 기술이다. 엔비디아는 소프트뱅크가 엔비디아 AI 엔터프라이즈 소프트웨어를 사용해 로컬 보안 AI 컴퓨팅에 대한 수요를 충족할 수 있는 AI 마켓플레이
엔비디아, 경기창조경제혁신센터에서 '경기 테크 데이' 열어 엔비디아가 7일 국내 인공지능(AI) 스타트업 관계자, 개발자 등을 대상으로 자사의 소프트웨어 플랫폼 등의 활용법을 설명했다. 엔비디아는 이날 경기 성남시 판교에 있는 경기창조경제혁신센터에서 '경기 테크 데이'를 열었다. 주제 발표에 나선 김찬란 엔비디아 개발자 관계 부문 시니어 매니저는 "생성형 인공지능(AI)의 다음 단계는 로봇·자동차 등 실물이 실제 움직이는 '피지컬 AI'가 될 것"이라며 자사의 소프트웨어 플랫폼 '옴니버스'가 피지컬 AI 시대를 앞당길 수 있다고 소개했다. 옴니버스는 3차원 개발 도구와 애플리케이션을 연결하고 3D 서비스를 개발할 때 활용되는 엔비디아의 소프트웨어 플랫폼이다. 김 매니저는 "복잡한 실제 세계를 시뮬레이션하는 데 정말 많은 컴퓨팅 파워가 필요한데 엔비디아의 그래픽처리장치(GPU)가 발전하면서 가능해졌기에 피지컬 AI 혁명도 가능해질 것"이라고 전망했다. 엔비디아의 옴니버스 플랫폼이 실제 세계를 구현한 시뮬레이션 환경에서 데이터 셋을 만들고 로봇이 이를 학습해 활동할 수 있고 로봇, 자율주행차, AI 팩토리 등이 구현된다는 설명이다. 김 매니저는 "만약에 로봇 1
시총 순위 최상위 자리에 등극한 것은 지난 6월 역대 처음 엔비디아가 5일(현지시간) 대망의 시총 1위 기업으로 올라섰다. 미 대선일인 이날 뉴욕 증시에서 엔비디아 주가는 전날보다 2.84% 오른 139.91달러(19만3061원)에 거래를 마쳤다. 시가총액은 3조4310억 달러로 불어나며 이날 주가가 0.65% 오르는 데 그친 애플(3조3770억 달러)을 제치고 시총 1위로 마감했다. 종가 기준으로 엔비디아가 시총 순위 최상위 자리에 등극한 것은 지난 6월 역대 처음으로 시총 1위에 오른 이후 4개월여만이다. 지난달 25일과 지난 4일에는 장중 시총 1위 자리에 올랐다가 장 막판 상승 폭이 줄어들면서 장 마감까지는 지키지 못한 바 있다. 이날 주가는 약 1% 상승 출발해 장중 140달러를 돌파하는 등 강세를 지속하다 장을 마감했다. 이에 애플과 시총 1위 자리를 놓고 치열한 경쟁이 예상된다. TSMC와 브로드컴 주가도 각각 2.17%와 3.17% 상승했다. 엔비디아 주가 상승은 엔비디아의 최신 AI 칩에 대한 수요가 여전히 많고, 특히 엔비디아가 오는 8일부터 미국 주요 주가지수인 다우존스30 산업평균지수(다우지수)에 편입되는 데 따른 것으로 풀이된다. S&
AI 데이터 센터, GPU 클라우드 서비스, 에지 AI 등 세 가지 축 앞세워 SKT가 누구나 쉽고 편리하게 접근할 수 있는 세계 최고 수준의 AI 인프라 조성에 나선다. SK텔레콤은 4일부터 5일 양일간 열리는 ‘SK AI 서밋 2024(SK AI Summit 2024)’에서 ‘AI 인프라 슈퍼 하이웨이’ 구축 계획을 전격 공개하고, AI 인프라 기반의 강력한 변화를 이끌어가겠다고 4일 밝혔다. SKT는 AI 데이터 센터, GPU 클라우드 서비스(GPUaaS), 에지 AI 등 세 가지 축을 중심으로 전국의 AI 인프라를 구축하고, 이를 기반으로 국내외 파트너들과 함께 글로벌 시장에도 진출할 계획이다. SK ICT 위원장을 맡고 있는 유영상 CEO는 “대한민국이 세계 최고 수준의 ICT 인프라를 기반으로 ICT 강국 반열에 올랐던 것처럼 인프라에서 출발하는 성공방정식이 AI 시대에도 적용될 수 있다”며, “‘AI 인프라 슈퍼 하이웨이’를 구축해 대한민국이 AI G3로 도약할 수 있도록 앞장설 계획”이라고 밝혔다. 먼저, SKT는 국내 지역 거점에100MW(메가와트) 이상의 전력이 필요한 하이퍼 스케일 AI DC(데이터센터)를 시작으로, 향후 그 규모를 GW(
반도체는 미래 기술과 산업 발전의 핵심이다. 반도체 산업은 막대한 수요를 바탕으로 시장 확대가 이뤄지고 있다. 다만 글로벌 경기 침체와 국가 간 정세 등 다양한 요인으로 인해 반도체 수요와 공급은 언제나 유동적이다. 여기에 주요 반도체 기업들의 기술 경쟁에 따라, 반도체 산업 지형도는 변화무쌍하다. 이 글에서는 반도체 업계 동향을 살펴보며 향후 시장에 대해 전망해보고자 한다. TSMC ‘웃고’ ASML ‘울었다’ TSMC가 올해 3분기에 시장 예상을 뛰어넘는 14조 원에 육박하는 순이익을 기록했다. TSMC는 올해 3분기 순이익이 3252억6000만 대만달러(약 13조8000억 원)로 전년 동기 대비 54.2% 늘었다고 발표했다. 로이터는 이 수치가 시장조사업체 LSEG가 예상치로 제시한 3000억 대만달러를 뛰어넘는 실적이라고 보도했다. TSMC 3분기 매출은 7596억9000만 대만달러로 전년 동기 대비 39% 증가했다. 미국 달러를 기준으로 하면 3분기 매출은 235억 달러로 전년 동기 대비 36%, 직전 2분기 대비 12.9% 늘었다. 이 역시 컨센서스인 233억3000만 달러를 웃도는 결과다. TSMC는 3분기 매출총이익률이 57.8%, 영업이익률이
주요 데이터 센터 기능 가속화하는 DPU 제품군의 대대적 판매 시작해 망고부스트는 현지 시각 지난 15일부터 사흘간 미국 캘리포니아 산호세에서 열린 ‘2024 OCP 글로벌 서밋(OCP Global Summit)’에 참가했다고 밝혔다. 망고부스트는 OCP 글로벌 서밋에서 PCIe 카드, 서버, 시스템 소프트웨어 등 시스템 전 단위에서 스토리지, GPU 통신, AI 추론 및 학습 등 주요 데이터 센터 기능을 가속화하는 DPU(Data Processing Unit) 제품군의 대대적 판매를 개시했다. OCP 글로벌 서밋은 세계 최대 규모의 개방형 데이터 센터 기술 커뮤니티인 OCP(Open Compute Project)가 주최하는 연례 행사로, 업계 전문가들이 모여 다양한 기술력과 비전을 공유하는 장이다. 올해 망고부스트는 AMD, 삼성전자, 슈퍼마이크로 등 반도체 및 서버 분야의 글로벌 유수 파트너사와 함께, PCIe 카드, 서버 및 시스템 소프트웨어로 이뤄진 최신 DPU 제품군을 공개했다. 망고부스트는 스토리지 통신, GPU 간 통신, AI 및 LLM 추론, 학습 및 서비스 제공 등 AI 시대의 데이터 센터가 수행하는 주요 기능에 대한 DPU 제품군을 공개해
유니티는 안정적이고 우수한 성능을 자랑하는 유니티 6(Unity 6)를 전 세계에 출시했다고 18일 밝혔다. 전 세계 개발자들과 협력을 통해 제작, 테스트, 개선된 유니티 6는 게임을 더 빠르고 효율적으로 제작할 수 있도록 지원한다. 유니티 6의 새로운 기능에는 커넥티드 게임 개발 속도를 높여주는 엔드투엔드 멀티플레이어 워크플로, 모바일 웹을 지원할 수 있는 툴, 워크로드를 CPU에서 GPU로 이동해 내부 및 고객 테스트에 따르면 CPU 성능을 최대 4배까지 개선한 새로운 그래픽스 기능 등이 있다. 유니티는 유니티 6 출시 후 제품 및 엔지니어링 리소스를 장기적으로 투입해 기능 세트를 개선하고 새로운 기능을 제공하는 동시에 업그레이드 용이성과 지속적인 안정성을 유지하고자 한다. 매튜 브롬버그 유니티 사장 겸 CEO는 “유니티는 게임 개발자가 게임을 더 빠르고 효율적으로 제작하는 동시에 혁신을 앞당기는 데 유용한 툴을 제공하기 위해 끊임없이 집중하고 있다”며 “앞으로도 유니티 6가 게임 개발의 핵심이 될 수 있도록 최선을 다할 것”이라고 말했다. 조쉬 로버리지 스트라튼 스튜디오스 매니징 디렉터는 “유니티 6는 다양한 작업을 맡는 글로벌 팀에 필요한 안정성과 확
엔비디아가 세계 최초 GPU인 엔비디아 지포스 256(NVIDIA GeForce 256)이 출시 25주년을 맞이했다고 15일 밝혔다. 엔비디아 지포스 256은 오늘날 생성형 AI의 토대를 마련하는 중요한 역할을 했다. 단순한 그래픽 카드가 아니라 세계 최초의 GPU로 출시돼 게임과 컴퓨팅의 미래 발전을 위한 발판을 마련했다. PC 하드웨어 매체인 탐스 하드웨어는 “지포스 256은 CPU의 부담을 덜어주고 3D 파이프라인이 멈추는 것을 방지하며, 게임 개발자가 훨씬 더 많은 폴리곤을 사용할 수 있게 해 자동으로 디테일이 크게 향상된다”고 말했다. 당시 게이머들에게 지포스 256에서 퀘이크 3 아레나(Quake III Arena)를 실행하는 것은 놀라운 일이었다. 아난드테크(AnandTech)의 게이머들은 “플레이 직후 즐겨하던 게임이 이전에는 본 적도 없던 타이틀인 것처럼 새로운 느낌이 들었다”고 말했다. 지포스 256은 출시 첫해에 100만 장 이상 판매된 최초의 사실적인 그래픽 반영 게임 중 하나인 언리얼 토너먼트(Unreal Tournament)와 같은 획기적인 타이틀과 멋진 조화를 이뤘다. 이후 25년 동안 게임 개발자와 엔비디아의 협업은 계속해서 한계
오픈AI에 블랙웰 DGX B200 첫 엔지니어링 샘플 중 하나 제공해 엔비디아가 마이크로소프트와 오픈AI에 '블랙웰(Blackwell) 시스템'을 최초로 공급한다고 밝혔다. 엔비디아는 마이크로소프트 애저가 GB200 기반 AI 서버를 갖춘 엔비디아 블랙웰 시스템을 구동하는 최초의 클라우드 솔루션 제공업체가 됐다고 밝혔다. 마이크로소프트 애저는 인피니밴드 네트워킹과 폐쇄 루프 액체 냉각을 활용해 진보된 AI 모델을 구동하도록 모든 단계에서 최적화하고 있다. 이 같은 소식에 마이크로소프트 CEO인 사티아 나델라(Satya Nadella)는 공식 소셜미디어 X 계정에서 “우리는 엔비디아와의 오랜 파트너십과 심층적인 혁신으로 업계를 선도하며 가장 정교한 AI 워크로드를 지원하고 있다”고 말했다. GB200 그레이스 블랙웰 슈퍼칩은 엔비디아 GB200 NVL72의 핵심 구성 요소다. GB200 NVL72는 72개의 블랙웰 GPU와 36개의 그레이스 CPU를 연결하는 멀티 노드, 수냉식, 랙 스케일 솔루션이다. 이는 거대 언어 모델(Large Language Model, LLM) 워크로드에 최대 30배 빠른 추론을 제공하며 수조 개의 파라미터 모델을 실시간으로 실행할
수많은 GPU 자원을 마치 한 대의 컴퓨터처럼 관리해 GPU 성능 극대화 SK텔레콤(이하 SKT)은 AI 인프라 자원을 최적화하고, AI 개발 환경을 통합 관리할 수 있는 AI 기반 B2B 솔루션 ‘SKT 엔터프라이즈 AI 클라우드 매니저(이하 AI 클라우드 매니저)’를 출시했다고 8일 밝혔다. ‘AI 클라우드 매니저’는 SKT 가 보유한 대규모 GPU 자원에 대한 관리 및 운영 노하우를 상용화한 제품으로, GPU 자원을 효율적으로 활용할 수 있는 AI Job 스케줄러 기반의 GPU 클러스터 특화 솔루션이다. 기업 고객이 보유한 수많은 GPU 자원을 마치 한 대의 컴퓨터처럼 관리해 GPU 성능을 극대화하고, AI 개발을 위한 학습 소요 시간을 단축할 수 있다. 대규모 데이터 학습에 GPU 자원이 많이 소모되기에 이와 같은 AI 자원 최적화는 AI 클라우드 솔루션에 꼭 필요한 기능이다. 예를 들어 프로젝트마다 GPU 사용량 및 성능을 실시간으로 모니터링하고, 사용하지 않는 GPU를 감지해 다른 프로젝트에 재분배한다. 우선 순위가 높은 프로젝트에 클라우드 자원을 먼저 할당하는 등 자원 효율성도 높인다. AI 클라우드 매니저를 활용하면 AI 개발의 모든 과정을 체
인텔 제온 스케이러블 CPU, 엔비디아 L40S GPU 이식해 신속한 디지털 트윈 구축 지원 개인용 가상 아바타 생성부터 건축정보모델링 데이터 기반 3D 모델링까지 시뮬레이션 턴키 기능 제공 어드밴텍이 디지털 트윈 환경 구축을 위한 고성능 서버 ‘SKY-620V3’을 시장에 내놨다. SKT-620V3는 인텔 제온 스케이러블 CPU와 엔비디아 L40S GPU가 탑재됐다. 특히 L40S는 엔비디아 에이다 러브레이스(NVIDIA Ada Lovelace) 아키텍처 기반 기술로, 인공지능(AI) 기능을 가속화하는 DLSS 3과 8비트 부동소수점(FP8) 등 설계를 갖췄다. 아울러 6개의 L40S를 수용하기 위해 2U 사양의 스토리지 아키텍처를 적용했다. 이를 통해 신속한 디지털 트윈 환경 생성이 가능하다. 또 거대언어모델(LLM) 추론 및 교육, 그래픽 및 비디오 애플리케이션 워크로드 기능을 고도화하는 데 특화됐다. 이번 신모델은 앞선 성능을 바탕으로, 3D 시뮬레이션 분야의 급증하는 수요에 대응하고, 성장을 지원하는 데 기여할 것으로 기대받고 있다. 특히 설계, 훈련, 검증 등에 최적화된 설계를 통해 개인용 아바타 생성부터 건축정보모델링(BIM) 데이터 기반 3D
AI 모델 성능 쉽게 비교하도록 도와주는 비교 실험, 모델 관리 기능 탑재 씨이랩은 AI 인프라 부족 문제에 직면한 기업의 어려움을 해결하고자 출시한 GPU 관리 솔루션 ‘AstraGo’에 신규 기능 ‘비교 실험’과 ‘모델 관리’를 추가 탑재했다고 밝혔다. 이번 비교 실험, 모델 관리는 AI 모델 성능을 쉽게 비교하도록 도와주는 기능으로, AstraGo의 사용자 편의성이 크게 향상됐다. 특히 비교실험 기능을 활용하면 워크로드 내 Accuracy와 Loss 값을 간편하게 비교하고 최적의 모델을 찾아내 운영 효율성을 높인다. AstraGo는 AI 인프라 부족 문제를 해결하는 국내 GPU 솔루션으로 주목을 받고 있다. 이 솔루션은 AI 도입의 큰 장벽으로 여겨지는 IT 인프라 부족과 높은 비용 문제를 해소하며, 기업의 AI 활용을 촉진하는 데 중점을 두고 있다는 것이 핵심이다. 대한상공회의소의 ‘국내기업 AI 기술 활용 실태조사’에 따르면 응답 기업의 80%가 AI 기술 도입의 필요성을 느끼지만 실제 활용 비율은 30% 수준에 불과한 것으로 나타났다. 그 이유는 ‘IT 인프라 부족(34.6%)’과 ‘비용 부담(23.1%)’이 가장 큰 장애 요인으로 드러났다. 씨이
전 세계적으로 AI 기술의 발전이 가속화하면서, AI 인프라에 대한 투자가 급증하고 있다. 이러한 투자 증가는 AI가 제공하는 경제적 가치와 효율성 향상 가능성에 대한 기대감 때문이다. 또한, 실제로 운영 효율성을 개선하며, 새로운 비즈니스 기회를 창출하는 잠재력을 증명하고 있다. 오늘날 주요 국가와 기업은 AI 인프라 확충에 초점을 맞추고 천문학적인 규모의 투자를 추진하고 있다. 이들은 AI 경쟁력이 지속적인 인프라 투자에 의해 좌우될 것이라고 판단한다. AI 인프라의 중요성 빠른 속도로 발전하는 AI의 배경에는 인프라가 있다. 이에 국가와 기업의 막강한 AI 인프라 투자가 전 세계적으로 확대되고 있다. 이들은 AI가 장기적으로 막대한 경제적 이익과 국가 경쟁력 강화에 기여할 것이라고 기대한다. 맥킨지의 조사에 따르면, AI는 매년 최대 4.4조 달러의 이익에 기여하는 잠재력이 있으며, 금융, 딥테크 바이오 등의 분야에서 대폭 적용될 것이라고 내다봤다. AI 도입은 투자 수익률을 넘어 시장에서의 경쟁 우위 확보에도 필요하다. 맥킨지는 AI를 조기에 도입한 기업이 2030년까지 현금 흐름을 두 배로 늘릴 것이라고 밝혔다. 주목해야 할 부분은 AI 기술이 점차