엔비디아가 미국 새너제이에서 GTC 2025(GPU Technology Conference 2025)를 열고 AI 추론을 위한 새로운 패러다임을 제시했다. 엔비디아는 GTC 2025에서 차세대 AI 가속화 솔루션 ‘블랙웰 울트라 AI 팩토리 플랫폼’과 오픈소스 AI 추론 소프트웨어 ‘다이나모(Dynamo)’를 공개했다. 이번 발표에는 AI 추론 및 컴퓨팅 성능의 한계를 극복하는 기술적 혁신이 포함됐다. 블랙웰 울트라는 엔비디아 블랙웰 AI 팩토리 플랫폼의 차세대 버전으로, AI 모델의 추론과 훈련을 더욱 정교하게 수행할 수 있도록 설계됐다. 특히 ‘테스트 타임 스케일링(Test-Time Scaling, TTS)’을 적용해 AI 추론의 정확도를 향상시키고, 복잡한 문제 해결 능력을 개선했다. 이 플랫폼은 최신 AI 칩인 ‘GB300 NVL72’를 기반으로 기존 GB200 NVL72 대비 1.5배 높은 AI 성능을 제공하며, 엔비디아 호퍼 아키텍처 대비 AI 팩토리의 수익 기회를 50배 증가시킬 것으로 기대된다. 이를 통해 에이전틱 AI, 물리 AI, 대규모 언어 모델(LLM) 등 다양한 AI 응용 분야에서 활용될 수 있다. 엔비디아 젠슨 황 CEO는 “AI는
퓨어스토리지가 자사의 플래시블레이드(FlashBlade) 플랫폼에 엔비디아 AI 데이터 플랫폼 레퍼런스 디자인을 통합한다고 19일 밝혔다. 퓨어스토리지는 성공적인 AI 구축에 필요한 고성능 데이터 및 가속화된 컴퓨팅 요구사항 관리에 필요한 기업의 역량을 강화함으로써 엔터프라이즈 데이터 스토리지 및 관리를 선도하고 있다. 플래시블레이드는 지능형 AI 데이터 플랫폼 구축을 위한 엔비디아의 신규 레퍼런스 디자인을 지원하며, 고객은 AI 시대에 발맞춰 스토리지를 데이터로부터 비즈니스 인사이트를 신속하게 제공하는 고성능 분산 시스템으로 고도화할 수 있다. 플래시블레이드는 엔비디아 가속 컴퓨팅, 네트워킹 및 엔비디아 AI 엔터프라이즈 소프트웨어를 활용해 AI 추론 애플리케이션이 요하는 속도와 민첩성으로 데이터를 처리할 수 있다. 퓨어스토리지는 엔비디아 B200 또는 H200 GPU를 사용하는 엔비디아 HGX 시스템에 대한 엔비디아 클라우드 파트너 레퍼런스 아키텍처 공식 HPS 인증을 획득해 엔비디아와의 협력을 더욱 강화했다. 이 인증은 퓨어스토리지가 신뢰할 수 있는 스토리지 파트너임을 증명하고, 최첨단 GPU 클라우드 구축을 위한 모든 성능 및 기술 요구사항을 충족하는
고성능 노트북 사용자 위한 코어 Ultra 200H/HX 시리즈 제원 및 성능 공개해 인텔코리아(이하 인텔)가 5일 여의도 콘래드 호텔에서 열린 ‘인텔 테크 데이 미디어 간담회’를 열고 AI PC 시대를 끌어갈 최신 프로세서를 공개했다. 이번 행사에서 인텔은 CES 2025에서 발표한 '인텔 코어 Ultra 200(코드명 : 애로우 레이크)H 및 HX 시리즈'를 정식 소개하고, 해당 프로세서가 탑재된 주요 제조사의 노트북 신제품을 선보였다. 인텔은 2023년 말 업계 최초로 AI PC용 인텔 코어 Ultra 프로세서를 출시하며 본격적으로 AI PC 시장을 열었다. 이후 2024년에는 코어 Ultra 200V 및 데스크톱용 AI PC 프로세서인 코어 Ultra 200S를 선보이며 AI PC 생태계를 확장해왔다. 이번 간담회에서는 고성능 노트북 사용자를 위한 코어 Ultra 200H/HX 시리즈를 발표하며 AI PC 혁신을 가속화하고 있음을 강조했다. 특히, 인텔은 AI PC의 핵심이 단순한 하드웨어 개선이 아니라 AI 가속화 소프트웨어와의 통합, 생태계 협력, 전력 효율 최적화에 있다고 밝혔다. 이를 위해 AI PC 가속화 프로그램 및 AI 어시스턴트 빌더 프
KT가 AI 스타트업 래블업과 함께 GPU 구독 서비스(GPU-as-a-Service이하 GPUaaS) 사업을 추진한다고 27일 밝혔다. KT는 기술력을 가진 스타트업과 지속 협력해 AI 생태계를 확장하는 한편 실질적인 AI 서비스 개발에 나설 계획이다. 양 사는 26일 KT 광화문 빌딩 East에서 업무협약을 체결하고 AI 클라우드 서비스 사업을 동반 추진하기로 했다. 협약식에는 KT 전략·사업컨설팅부문 송승호 SPA본부장과 래블업 신정규 CEO가 자리했다. 이번 협약으로 양 사는 GPUaaS 서비스를 공동 개발하고 사업을 추진한다. 다른 서비스와의 차별화를 위해 KT GPUaaS만의 기능과 기술도 선보인다. 최근 전세계적인 AX(AI Transformation) 수요 증가로 GPUaaS 시장이 빠르게 성장하는 것을 고려해 조속한 시일 내에 서비스를 출시할 계획이다. GPUaaS는 AI 모델 훈련과 같은 고성능 컴퓨팅이 필요한 기업에 GPU 자원을 빌려주는 서비스다. GPU를 직접 보유하지 않고 필요한 만큼만 사용하기 때문에 누구나 합리적인 비용으로 AI 개발 환경을 조성할 수 있다. 래블업은 AI 인프라 운영 관리 플랫폼을 개발하는 기업이다. GPU 자원
씨이랩은 11일 AI 인프라 구축 전문 기업인 에이에스티글로벌을 대상으로 ‘AI 인프라 최적화’를 주제로 한 기술 세미나를 개최했다고 밝혔다. 이번 세미나는 GPU 리소스 운영 효율을 높이는 ‘AstraGo’ 솔루션을 중심으로 AI 인프라 자원을 효율적으로 활용·관리하는 방안을 공유하고 실제 도입 사례와 적용 효과를 소개하기 위해 마련됐다. 씨이랩이 선보인 AstraGo는 AI 모델 학습 및 추론 과정에서 GPU 활용도를 극대화하는 GPU 인프라 관리 솔루션이다. AI 프로젝트 운영에 필수적인 자동 분배, 실시간 모니터링, 잡 스케줄링, 분산 학습 지원 기능을 갖추고 있다. Kubernetes 기반 워크로드와 연동해 다수 사용자가 동시에 최적화된 GPU 리소스를 활용할 수 있도록 돕는다. 이를 통해 AI 개발자들의 생산성을 높이고 GPU 사용 비용을 크게 절감할 수 있다. 특히 GPU 분할(가상화) 기술을 적용해 단일 GPU에서도 여러 워크로드를 동시 수행할 수 있어 기업들은 동일 자원으로도 더욱 높은 처리량을 확보하고 TCO(Total Cost of Ownership)를 절감할 수 있다. 또한 AstraGo는 HPE OneView 등 주요 IT 서버 환경과
앤시스(Ansys)가 디지털 엔지니어링 혁신을 선도할 AI 기반 엔지니어링 시뮬레이션 솔루션인 ‘앤시스 2025 R1(Ansys 2025 R1)’를 출시했다고 10일 밝혔다. 앤시스 2025 R1은 정교한 디지털 엔지니어링 기술을 통해 기존 인프라와 원활하게 연계될 뿐 아니라 업무 중단을 최소화하면서 보다 혁신적인 제품 개발을 위한 협업을 지원한다. AI, 클라우드 컴퓨팅, GPU 및 HPC의 강력한 성능을 기반으로 한 이번 업데이트는 더욱 신속하고 협력적인 의사 결정을 가능케 하며 설계 탐색 범위를 확장하고 제품 설계 기간 단축에 기여할 전망이다. 셰인 엠스윌러 앤시스 제품 총괄 수석 부사장은 “앤시스 2025 R1은 더욱 강력한 통합 기능을 제공해, 제품 전체 수명 주기에 걸쳐 디지털 프로세스를 구축하고 개발 전후 데이터를 효율적으로 관리할 수 있는 다양한 도구와 솔루션을 제공할 것”이라고 설명했다. 그는 또한 “하나의 데이터 기반의 환경에서 서로 단절된 팀들도 원활하게 협업할 수 있도록 지원한다”며 “이를 통해 비용 절감과 제품 출시 기간을 단축시켜 고객의 경쟁력 강화에 기여할 것”이라고 말했다. 앤시스는 고객의 디지털 전환으로의 과정을 원활하게 지원하
가트너(Gartner)가 2024년 전 세계 반도체 매출 예비조사 결과를 발표했다. 해당 조사에 따르면, 2024년 전 세계 반도체 매출은 2023년 대비 18.1% 증가해 총 6260억 달러를 기록했다. 2025년 반도체 매출은 총 7050억 달러에 이를 것으로 전망했다. 조지 브로클허스트 가트너 VP 애널리스트는 “데이터센터 애플리케이션에 사용되는 그래픽처리장치(GPU)와 AI 프로세서가 2024년 칩 부문을 이끌었다”며 “AI 기술, 생성형 AI(GenAI) 워크로드에 대한 수요 증가로 데이터센터가 2024년 스마트폰에 이어 두 번째로 큰 반도체 시장으로 성장했다. 2024년 데이터센터 반도체 매출은 2023년의 648억 달러에서 73% 증가한 1120억 달러에 달했다”고 전했다. 반도체 업황이 회복함에 따라 여러 반도체 공급업체의 순위에 변동이 생겼다. 2024년 상위 25개 반도체 공급업체 중 11개 업체가 두 자릿수 성장을 보였으며, 8개 업체만이 매출이 감소했다. 특히 상위 10개 반도체 공급업체 중 9개 업체가 매출이 증가하면서 순위의 변동이 있었다. 삼성전자는 메모리 반도체 가격의 강력한 반등에 힘입어 2024년 인텔로부터 1위 자리를 되찾고
올해 초 메모리의 공급 과잉과 수요 둔화로 반도체 업황이 다소 주춤할 전망이다. 이에 삼성전자와 SK하이닉스 등 주요 업체들은 낸드 등 일부 제품 감산에 나서는 한편, 고대역폭 메모리(HBM)와 같은 고부가 제품을 중심으로 시장 상황에 대응한다는 전략이다. 31일 삼성전자는 4분기 실적발표 후 콘퍼런스콜에서 "메모리 업황은 단기적으로 약세가 전망된다"며 "모바일과 PC 모두 고객사 재고 조정이 1분기까지 이어지고, 서버도 그래픽처리장치(GPU) 제약으로 메모리 수요가 이연되는 현상이 발생할 것"이라고 말했다. 지난해 4분기 삼성전자 반도체 사업을 담당하는 DS 부문의 매출은 30조1000억 원이었으며 이 중 메모리 매출은 23조 원이었다. 증권가에 따르면 올해 1분기 삼성전자 DS 부문 내 메모리 사업 매출은 20조 원 안팎으로 추정된다. 올 초 메모리 업황의 약세는 메모리의 공급 과잉과 고객사들의 재고 조정이 맞물렸기 때문으로 풀이된다. 이달 초 시장조사업체 트렌드포스는 올해 1분기 D램 가격은 8∼13%, 낸드 가격은 10∼15%가량 떨어질 것으로 예상했다. 특히 주요 업체들은 2023년 3분기부터 이어진 가격 하락으로 수익성이 악화된 낸드의 감산에 돌입
엔비디아 최고경영자(CEO) 젠슨 황이 31일(현지시간) 도널드 트럼프 대통령을 만났다. '트럼프 2기' 행정부 출범 후 황 CEO가 트럼프 대통령을 만나는 것은 이번이 처음이다. 지난 20일 트럼프 대통령 취임식 때에는 마크 저커버그 메타플랫폼 CEO를 비롯해 아마존 창업자 제프 베이조스, 팀 쿡 애플 CEO, 순다르 피차이 구글 CEO 등이 대거 참석했으나 황 CEO는 참석하지 않았다. 황 CEO와 트럼프 대통령의 만남은 중국 AI 스타트업 '딥시크 충격'의 여파가 계속되고, 이에 대해 트럼프 행정부가 대중국 반도체 수출 추가 규제를 검토하는 것으로 알려진 가운데 이뤄져 관심을 끌었다. 딥시크가 최근 내놓은 AI 모델은 미 최고 모델의 10분의 1도 안되는 비용을 들여 개발됐지만, 성능은 버금가는 것으로 알려져 미 테크업계를 충격에 빠뜨렸다. 이에 지난 27일 엔비디아 주가는 17% 폭락했으며, 다음날 주가는 9% 반등했지만, 여파는 계속되고 있다. 로이터 통신에 따르면 황 CEO와 트럼프 대통령의 만남은 딥시크가 미 테크업계를 깜짝 놀라게 하기 이전부터 예정됐다. 트럼프 대통령은 이날 만남의 구체적인 내용은 언급하지 않은 채 황 CEO를 '신사(gent
가산 AIDC, 랙당 전력밀도가 국내 최고 수준인 44kW로 설정 SK텔레콤이 AI의 동맥이자 2025년 핵심 성장동력인 ‘AI 인프라’ 시장 공략에 본격적으로 나섰다. SK텔레콤(이하 SKT)은 지난 12월 30일 가산 AI 데이터 센터(이하 AIDC)를 오픈하고, 시범 운영을 마친 뒤 AI 클라우드 서비스인 ‘SKT GPUaaS(GPU-as-a-Service)’를 출시했다고 13일 밝혔다. SKT는 지난 ‘SK AI 서밋 2024’에서 ‘AI 인프라 슈퍼 하이웨이’ 구축 전략을 발표한 이래 연말 조직 개편에서 ‘AI DC 사업부’를 별도 조직으로 신설하고, GPUaaS를 새롭게 출시하는 등 연이은 행보로 ‘AI 인프라’ 사업 본격화에 속도를 내고 있다. 이번에 오픈한 가산 AIDC는 랙당 전력밀도가 국내 최고 수준인 44kW로 국내 데이터 센터 랙 당 평균 전력밀도인 4.8kW의 약 9배에 달하는 등 고밀도 GPU 서버 운영 환경에 최적화된 데이터 코로케이션 환경을 제공한다. SKT GPUaaS는 美 람다(Lambda)와 지난 1여 년간 함께 준비한 구독형 AI 클라우드다. 이를 위해 가산 AIDC에 람다의 한국 리전을 유치했으며, 이는 아시아태평양 지역
롯데이노베이트가 그래픽처리장치(이하 GPU)의 자원 관리와 AI 모델 개발 환경을 제공하는 통합 AI 개발 플랫폼 ‘인피디아 스튜디오(INFIDEA Studio)’를 선보였다. 인피디아 스튜디오는 클라우드 기반 서비스로 AI 모델 개발에 필요한 고성능 GPU를 유연하게 할당 받아 사용할 수 있다. 또한 개발에 필요한 주피터랩(JupyterLab) 등 다양한 작업 도구를 ‘웹 브라우저(Web UI)’기반으로 제공해 편의를 돕는다. 이 플랫폼은 AI 모델의 개발부터 배포, 그리고 추론까지의 모든 과정을 지원하는 머신러닝운영(MLOps)을 지향한다. 고객사는 인피디아 스튜디오를 이용해 고가의 GPU를 적정 수량만 사용할 수 있게 함으로써 운영 비용을 대폭 절감할 수 있다. 또한 다양한 AI 개발 프레임워크(Framework)와 GPU 가속기 버전을 설정할 수 있어 맞춤형 개발 환경도 구성 가능하다. 인피디아 스튜디오는 엔비디아(NVIDIA)의 MIG(Multi-instance GPU) 기술을 활용해 하나의 GPU를 여러 개의 작은 단위로 나누어 사용할 수 있도록 했다. 이를 통해 관리자는 GPU의 사용률을 극대화하고 CPU와 RAM의 성능도 설정하는 등 다양한 컴
퓨어스토리지가 2025년 전망을 발표했다. AI가 한국의 기술 환경을 지속적으로 변화시키는 가운데, 2025년에는 기업들이 AI에 투자하고 활용하는 방식에서 큰 변화가 있을 것으로 예상된다. 또한, 퓨어스토리지는 사이버 보안 전략이 데이터 보호로 전환되는 한편, 지속가능성이 기업의 3대 우선순위로 재부상할 것으로 내다봤다. 2025년에는 현재의 AI 혁명에서 다음 단계로 나아갈 전망이다. 업계 전문가들은 현재 배포된 GPU의 대다수가 적극적으로 활용되지 않고 있다고 지적하며, 이들 GPU는 주로 하이퍼스케일러와 같은 소수의 기업에 집중되어 있고 민간 기업에는 고르게 배치되어 있지 않다고 지적했다. 그러나 2025년에는 기업들이 데이터에서 더 많은 가치를 창출하고 AI를 ‘산업화’하기 위해 많은 AI 역량을 사내로 도입함에 따라 다른 국면을 맞을 예정이다. 이 과정에서 산업용 AI의 중요성이 더욱 부각될 것이다. 특히, 기밀을 유지해야 하는 독점 데이터로 모델을 학습시키는 방법과 관련된 다양한 과제가 대두될 것이다. 에이전트형 AI(Agentic AI)와 대형 양적 모델(Large Quantitative Models, LQM)은 이러한 변화에서 핵심적인 역할을
젠슨 황 CEO, 팜 민 찐 총리 만나 베트남에 AI 연구개발센터 열기로 합의해 엔비디아가 동남아시아 투자를 확대하고 있다. 6일 AFP통신과 현지 매체 베트남뉴스통신(VNA) 등에 따르면, 젠슨 황 엔비디아 최고경영자(CEO)는 전날 베트남을 방문해 팜 민 찐 총리와 베트남에 AI 연구개발센터를 열기로 합의했다. 황 CEO는 "엔비디아는 AI 인프라 구축과 전문가 양성, 스타트업 지원 등으로 베트남의 AI 산업 발전을 발전시킬 것"이라고 말했다. 그는 "베트남의 데이터는 국가 자원"이라며 "베트남 AI는 베트남 국민과 산업을 위해 베트남에서 만들어지고 운영돼야 한다"고 덧붙였다. 황 CEO는 엔비디아가 이미 베트남에 2억5000만 달러(3550억 원) 이상 투자했으며 베트남 첫 AI 클라우드 구축과 로봇 공학, AI 기반 스마트시티 건설 등을 돕고 있다고 덧붙였다. 그는 베트남 최대 기업인 빈그룹 산하 AI 스타트업인 빈브레인 인수 계획도 밝혔다. 찐 총리는 "이번 합의는 베트남이 아시아의 AI 연구개발 허브가 되기 위한 중요한 이정표"라고 말했다. 황 CEO는 베트남에 앞서 태국을 방문해 AI 관련 협력을 확대하기로 했다. 그는 태국에서 패통탄 친나왓 총
저전력 고성능 GPNPU 프로세서와 AI 모델 및 프레임워크 개발해 하이퍼비주얼에이아이(Hypervisual AI)는 GPGPU와 NPU를 결합한 하이브리드 GPNPU 아키텍처와 비전 트랜스포머 등 AI 모델 최적화를 통해 온디바이스 비전 인텔리전스 토탈 솔루션을 제공할 계획이라고 밝혔다. 하이퍼비주얼에이아이는 반도체 아키텍처 설계 전문가인 윤형민 박사와 인공지능 전문가인 이종호 박사, 정삼윤 전 실리콘아츠 부사장이 주축이 돼 온디바이스 비전 인텔리전스 토탈 솔루션 제공을 목표로 2023년 설립한 스타트업이다. 하이퍼비주얼에이아이는 GPGPU와 NPU를 하나의 코어로 구현한 하이브리드 칩 아키텍처를 기반으로 엣지 디바이스에서 운용 가능한 저전력 고성능 GPNPU 프로세서와 해당 GPNPU에서 구동 가능한 비전 트랜스포머 등 AI 모델 및 프레임워크를 개발해 엣지 디바이스 운영에 최적화된 온디바이스 비전 인텔리전스 토탈 솔루션 제공을 목표로 하고 있다. 영상인식 인공지능 모델은 특정 분야에서 인간의 시각 능력을 능가할 정도의 발전을 이뤄왔지만, 실제 현장에서의 적용은 카메라의 각도, 앵글, 조명 환경등 외부 변수에 따른 인식률 저하로 한계가 있었던 것이 사실이
동급 최고 수준의 성능과 최신 게이밍 기능 제공해 인텔은 인텔 아크 B-시리즈 그래픽카드 신제품(코드명 배틀메이지)를 발표했다. 인텔 아크 B580 및 B570 GPU는 대다수의 게이머가 접근 가능한 가격대에서 동급 최고 수준의 성능과 최신 게이밍 기능을 제공하며, AI 워크로드를 가속화할 수 있도록 설계되었다. 인텔 Xe 매트릭스 익스텐션(XMX) AI 엔진이 포함되어 성능, 시각적 유동성 및 응답성을 향상시키는 3개 기술로 구성된 최신 XeSS 2를 지원한다. 인텔 비비안 리엔(Vivian Lien) 클라이언트 그래픽 부문 총괄 매니저는 “새로운 인텔 아크 B-시리즈 GPU는 게이머를 위한 완벽한 업그레이드 제품이다. 이 제품은 XeSS 2, 2세대 레이 트레이싱 엔진, XMX AI 엔진을 통한 뛰어난 1440p 게이밍 경험과 최고의 가격 대비 성능을 제공한다”라며 “역대 최대 규모의 파트너들과 함께 게이머가 완벽한 디자인을 찾을 수 있도록 더 많은 선택권을 제공하게 되어 기쁘다”고 밝혔다. 인텔 아크-B시리즈 GPU는 인텔의 최신 Xe2 아키텍처를 사용하며, 향상된 효율성과 더 높은 코어당 성능을 제공하고 소프트웨어 오버헤드를 줄이도록 최적화했다. 2세