AI 반도체 시장이 확장하고 있다. AI 반도체는 IoT, 자율주행, 웨어러블 등 첨단 산업에서 빼놓을 수 없는 핵심 요소다. 다만 확장된 기능만큼 처리하는 데이터도 방대하다. 이에 그래프코어가 개발한 IPU는 뛰어난 데이터 처리량과 낮은 전력 소비로 업계로부터 주목받고 있다. 그래프코어 강민우 지사장을 만나 IPU가 가진 잠재력과 시장에서의 역할에 대해 이야기 나눠봤다. 그래프코어는 어떤 회사인가? 2016년 창립한 그래프코어는 AI 반도체 회사면서 AI 관련 소프트웨어 툴킷을 제공하는 기업이다. 특히 지능처리장치(Intelligence Processing Unit, 이하 IPU)를 개발해 주목을 받았다. 그래프코어의 설립자는 통신칩 분야 유니콘 기업이었던 아이세라의 창업주였으며 이후 엔비디아로 인수가 됐고, 엔비디아에서 재직하는 동안 통신칩 개발을 추진했다. 그는 GPU가 갖는 제약사항을 주목했고, 이를 극복할 수 있는 AI 반도체를 만들고자 그래프코어를 설립했다. 우리의 IPU 시스템은 다양한 AI 연산과 추론 태스크에서 월등한 성능을 보인다. 현재 생산은 TSMC와 폭스콘에서 주관하고 있다. 그래프코어는 거액의 투자 유치로도 유명하다. 그래프코어는 현
AI 반도체를 두고 국가·기업 간 기술 경쟁이 심화하고 있다. AI 반도체는 IoT, 자율주행, 웨어러블, 헬스케어 등 첨단 산업에서 빼놓을 수 없는 요소로 손꼽힌다. 미래 산업 경쟁력은 AI 반도체에 달려있다 해도 과언이 아니다. 반면 국내에서는 기술 개발을 수반하는 제조 인프라, 인재 양성 등 미래를 위한 준비가 아직 시작 단계다. 왜 AI 반도체인가? AI 반도체는 AI의 학습, 추론 등의 서비스를 처리하기 위해 대량 연산을 수행하는 반도체를 말한다. 간단히 말해 AI를 위한 반도체다. 반도체는 일반적으로 정보 저장을 위한 메모리 반도체와 정보 처리를 위한 시스템 반도체로 분류되는데, AI 반도체는 후자에 해당한다. AI 반도체는 흔히 인간의 두뇌와 비교된다. 사물에 지능이 부여되기 위해서는 두뇌의 기능을 하는 요소가 필요하다. AI 반도체는 데이터를 저장하고 처리해 결과를 도출해내는 기능을 구현함으로써 사물에 지능을 부여한다. 마치 사람처럼 주어진 상황에서 학습한 내용을 바탕으로 영리하게 대응한다. 이것이 AI 반도체가 지능형 반도체로 불리는 이유기도 하다. 다만 시스템 반도체 범주에서 볼 때 연산하는 반도체가 새로운 것은 아니다. 이 기술은 주변에서
인공지능 반도체 기업 그래프코어(한국 지사장 강민우)가 과학기술정보통신부의 지원을 받아 고효율 AI 컴퓨팅을 위한 새로운 소프트웨어 접근법을 개발 중인 한국전자통신연구원(ETRI)와 다년간의 파트너십을 체결했다. 2025년까지 유효한 양 사의 이번 파트너십은 한국 정부의 자금지원을 받게 된다. 연구개발(R&D) 지출 및 라이선스 수입 기준 국내 최대 공공 연구기관인 ETRI의 역량과 머신 인텔리전스를 위한 고효율·고성능 컴퓨팅 시스템의 개발 및 상용화 분야에서 입증해온 그래프코어의 리더십이 결합돼 상당한 시너지를 낼 수 있을 것으로 기대된다. 자연어 처리(NLP) 등을 위한 최첨단 AI 모델은 지난 10년 동안 그 규모가 기하급수적으로 증가했다. 매개변수가 수억 개에서 수천억 개로 증가했으며 이제는 수조 개에 달한다. 이러한 거대 모델을 비용 및 시간 효율적인 방식으로 훈련하는 것은 점점 더 까다로워지고 있는데, 그 크기가 급격히 증가하고 있는 AI 모델의 요구를 트랜지스터 밀도를 높이고 클럭 속도와 산술 정밀도를 개선하는 것으로 충족시키는 것이 이제는 어렵기 때문이다. 그래프코어와 ETRI의 파트너십은 AI 컴퓨팅 성능, 효율성, 접근성을 개선하는
인공지능 반도체 기업 그래프코어(한국 지사장 강민우)가 최신 MLPerf 2.0 벤치마크 테스트서 IPU(Intelligence Processing Unit) 시스템의 획기적인 성능적 이점을 다시 한 번 입증했다. 그래프코어는 자사의 보우(Bow) Pod16이 상대적으로 비용이 더 높은 엔비디아(NVIDIA)의 플래그십 모델인 DGX-A100 640GB과 비교해 ResNet-50에서 31% 더 빠른 훈련시간을 기록했다고 밝혔다. 또한, BERT에 대해서는 MLPerf 1.1 벤치마크에서 보다 37% 향상된 성능을 달성하며 널리 사용되는 여러 언어 모델에 걸쳐 가격과 성능 모든 측면에서 선두자리를 지켰다고 설명했다. 특히, 최초로 그래프코어 시스템을 활용한 써드파티 결과를 제출한 바이두(Baidu)는 패들패들(PaddlePaddle) 소프트웨어 프레임워크를 사용하여 BERT 훈련에서 동일한 성능을 보였다. 그래프코어의 Bow Pod 시스템의 성능은 전반적으로 크게 개선됐지만, 가격은 이전과 동일해 상당한 비용효율성을 제공한다. 따라서 BERT 훈련시간이 최대 37% 향상됐다는 것은 그래프코어 시스템이 가격 대비 매우 우수한 성능 이점을 제공한다는 것을 의미한다
그래프코어가 컴퓨팅 분야의 선구자들과 최첨단 하드웨어를 이어주는 ‘가속 컴퓨팅 아카데미’를 론칭했다. 해당 프로그램은 전 세계 학계, 연구기관, 정부 기관, 슈퍼컴퓨팅(HPC) 센터, 그리고 주요 기업의 컴퓨터 과학자들이 고급 컴퓨팅 시스템을 활용해 연산 집약적인 연구를 효과적으로 수행하도록 돕는 것을 목적으로 한다. 현재 많은 조직들이 그래프코어의 고도로 병렬화된 IPU로 패스 트레이싱, 분산 데이터 보간, 입자물리학의 칼만 필터와 같은 여러 과학연구 분야에서 새로운 애플리케이션을 구현해낸다. 특히 IPU와 애초부터 함께 설계된 그래프코어의 포플러 소프트웨어 스택은 높은 성숙도를 자랑하는데, 타일 병렬 처리를 활용하고 하드웨어의 전체 성능을 극대화함으로써 세분화된 로우 레벨 프로그래밍을 가능하게 한다. 그래프코어의 IPU와 포플러 SDK의 이점을 최대한 활용한 로우 레벨 프로그래밍에 초점을 두는 가속 컴퓨팅 아카데미는 영국의 옥스퍼드대학교, 브리스톨대학교, 임페리얼칼리지 런던, 노르웨이의 시뮬라 리서치 연구소 등을 비롯한 학계 및 HPC 분야 최고 전문가들과 그래프코어가 결성한 새로운 유럽 컴퓨팅 연구회의 지원을 받는다. 프로그램 지원 범위에는 클라우드에서
인공지능(AI) 반도체 기업 그래프코어(Graphcore)가 국내 딥러닝 기반 자연어처리(NLP) 스타트업 트위그팜이 서비스 혁신과 효율성 개선을 위해 IPU를 도입했다고 밝혔다. 이를 통해, 트위그팜은 기존 GPU 대비 10배 가까이 향상된 성능을 구현해 연구 속도를 높이고 서비스 개발을 가속화하는 동시에, 총소유비용(TCO)은 대폭 낮추는데 성공했다. 트위그팜은 기업용 AI 기반 맞춤형 번역기, 데이터 비식별화 처리기, 데이터 검수기 등을 제공하는 AI 스타트업이다. 특히, 맞춤형 번역기 개발에 집중하고 있는데, 고객의 요구를 반영하고 시장 수요에 민첩하게 대응하기 위해 데이터 수집, 데이터 전처리, 모델링 개선 등 일련의 과정을 지속적으로 반복하는 연구를 수행하고 있다. 여기에는 상당한 시간과 비용이 따르기 때문에 AI 모델 학습속도를 가속화할 수 있는 뛰어난 성능의 최첨단 프로세서가 요구된다. 트위그팜은 그래프코어의 IPU를 도입함으로써, 기존에 사용하던 GPU 대비 학습속도는 10배 가까이 높이고 비용 또한 상당히 절감하는 성과를 달성했다. 많은 스타트업들이 직면해 있는 최대 과제는 비교적 한정된 자원을 충분히 효과적으로 활용해 서비스 품질은 향상시
헬로티 서재창 기자 | 그래프코어가 최신 MLPerf 1.1 벤치마크 테스트에서 자사의 IPU(Intelligence Processing Unit) 시스템이 기록적인 성능을 달성했다고 밝혔다. 이를 통해 그 규모가 점차 확대되면서 효율성과 성능, 소프트웨어 성숙도는 물론 사용 편의성이 꾸준히 향상되는 그래프코어 IPU 시스템의 경쟁력을 다시 한 번 입증했다. 9일인 오늘 온라인 기자간담회를 연 그래프코어는 최신 IPU-POD 시스템과 MLPerf 벤치마크 테스트 결과를 발표하고, 국내 AI 혁신 가속화를 위한 그래프코어의 계획과 국내 사업 성과 및 방향성 등에 대해 소개했다. 그래프코어 IPU 시스템은 지속적인 소프트웨어 최적화를 통해 향상된 성능을 제공하고 있다. 특히, 이번 MLPerf 벤치마크에서 그래프코어 IPU-POD16은 컴퓨터 비전 모델 ResNet-50 훈련에 있어 엔비디아의 DGX A100을 능가하는 성능을 보였다. ResNet-50을 훈련하는데 엔비디아 DGX A100은 29.1분이 걸린데 반해, 그래프코어의 IPU-POD16은 28.3분을 기록했다. 이는 소프트웨어만으로 첫 MLPerf 테스트 결과 대비 24%의 성능 향상을 이룬 것으로,
헬로티 서재창 기자 | 그래프코어가 최신 AI 연산 시스템 IPU-POD128과 IPU-POD256을 출시했다고 밝혔다. 각각 32페타플롭스(PFlops, 초당 3만2000조 번 연산), 64페타플롭스의 AI 연산속도를 지원하는 IPU-POD128과 IPU-POD256은 그래프코어가 지금까지 선보인 IPU-POD 시리즈 중 가장 높은 성능을 제공한다. 머신 인텔리전스 확장을 위해 특별 설계된 아키텍처로서 혁신적인 기능을 제공하는 해당 제품을 통해 그래프코어는 AI 슈퍼컴퓨팅에 대한 기술 역량을 한층 확대하게 됐다. 새로운 IPU-POD 시리즈는 시스템 전반에 걸쳐 대형 트랜스포머 기반 언어 모델을 빠르게 훈련시키고, 프로덕션 환경에서 대규모 상용 AI 추론 애플리케이션을 구동하는 것이 특징이다. 이뿐 아니라, 시스템을 더 작고 유연한 vPOD로 분할해 개발자의 IPU 활용도를 높이고, GPT 및 그래프신경망(GNN) 같은 새로운 모델을 활용해 과학적 발견을 가속화하도록 지원한다. IPU-POD128과 IPU-POD256은 BERT, ResNet-50과 같이 광범위하게 사용되는 언어 및 비전 모델을 활용한 벤치마크 테스트 결과에서 인상적인 훈련 성능과 효율적인
[헬로티] 인공지능 반도체 기업 그래프코어가 IT 기업 NHN과 기술적 협력을 위한 업무협약(MOU)을 7일 체결했다. 이번 협약은 차세대 AI 시스템에 특화된 그래프코어의 IPU-POD 시스템을 NHN의 AI 전략에 도입, 빠르게 성장하고 있는 국내 AI 생태계에 기여할 것으로 기대된다. 양사는 이번 업무협약을 통해 ▲오픈스택 등 주요 개발 기술 요소에 대한 공동 개발 협력 ▲NHN Cloud(클라우드)의 공공(Public) 시스템 공동 개발 협력 ▲공인된 AI 및 머신러닝 기관에 개발된 AI 클라우드의 연산 능력을 등재하기 위한 상호 협력 ▲다양한 AI 및 머신러닝 개발 생태계를 지원할 수 있는 마케팅 활동 상호 추진 등, 기술적 협력에 초점을 맞추며 시너지 효과를 극대화한다는 계획이다. 강민우 그래프코어 한국지사장은 “이번 협약은 국내 클라우드 업계를 선도하고 있는 NHN이 그래프코어 IPU의 장래성을 높이 평가했다는 점에서 유의미하다”며 “그래프코어는 앞으로도 AI 반도체 업계에서 독보적인 성능을 자랑하는 IPU를 앞세워 유수의 국내 공공 및 민간 기업들의 사업 수요를 충족하는 기술력을 선보일 예정”이라고 소감을 밝혔다. NHN 클라우드사업그룹 김동훈
[헬로티] AI 반도체 전문 기업인 그래프코어(Graphcore)는 그래프코어의 2세대 IPU(지능 처리 장치: Intelligence Processing Unit) 플랫폼인 ‘IPU-머신 M2000(IPU-Machine M2000)’을 출시했다. 해당 솔루션은 보다 큰 처리 능력과 메모리, 내장된 확장성을 바탕으로 극도의 머신 인텔리전스 워크로드를 처리 가능하며, 데이터센터급 연산 성능을 구현할 수 있다. IPU-머신 M2000은 플러그 앤 플레이 방식의 머신 인텔리전스 컴퓨팅 블레이드로, 간편한 구축을 위해 설계되었으며 대규모 확장이 가능한 시스템을 지원한다. 슬림한 블레이드 유닛 하나로 1 페타플롭(PetaFlop)에 달하는 머신 인텔리전스 컴퓨팅 성능을 구현하며, 인공지능(AI)의 스케일아웃(scale-out)에 최적화된 통합 네트워킹 기술을 탑재했다. ▲ IPU-머신 M2000 각각의 IPU-머신 M2000은 그래프코어의 새로운7나노미터(nm) 콜로서스 Mk2 GC200 IPU(Colossus Mk2 GC200 IPU) 프로세서 4개에 의해 구동되며, 그래프코어의 포플러(Poplar) 소프트웨어 스택의 완벽한 지원을 받는다. 기
[첨단 헬로티] AI 반도체 전문 기업인 그래프코어(Graphcore)가 본격적으로 한국 시장에 진출한다. 그래프코어의 AI 반도체 ‘콜로서스(Colossus) IPU(지능 처리 장치:Intelligence Processing Unit)’는 프로세서에 직접 메모리를 배치해 연산 속도를 빠르게 개선시킨 점을 내세우고 있다. 그래프코어는 한국 시장에서 금융, 헬스케어, 검색엔진 등의 시장을 공략한다는 계획이다. 그래프코어는 지난 2016년 영국 브리스톨에서 나이젤 툰(Nigel Toon) 최고경영자(CEO)와 사이먼 놀스(Simon Knowles) 최고기술책임자(CTO)가 AI 시대와 머신러닝에 특화한 반도체의 필요성에 주목해 공동으로 창업한 기업이다. 그래프코어는 올해 1월 한국에 지사를 설립했고, 한국 지사장으로 강민우 루브릭 전 한국 지사장을 그래프코어 한국 지사장으로 선임했다. 강민우 지사장은 일본과 중국을 제외한 아시아 지역을 총괄할 계획이다. 참고로 그래프코어는 일본에도 지사를 지난 1월에 설립했다. 이와 관련해 그래프코어는 2월 4일 그랜드 인터컨티넨탈 서울 파르나스에서 기자 간담회를 개최하고, 콜러서스 IPU 소개와 함께 한국
[첨단 헬로티] 하드웨어를 통해 소프트웨어 성능의 한계를 보완하고 극복하며 소프트웨어와 하드웨어의 영역을 구분하는 것이 모호해졌다. 하드웨어로 시장의 성능 문제를 해결하며, 혁신을 주도해 나가는 스타트업들도 등장했다. 머신러닝, 딥러닝, 인공지능(AI)에 필요한 고속의 컴퓨팅 연산 ‘병렬처리’에 최적화된 GPU가 각광받고 있다. 이에 구글은 이 고속 컴퓨팅에 최적화된 칩을 만들어 공개했다. TPU(Tensor Processing Unit)이다. 이 알고리즘 성능을 올리기 위해서는 당연히 소스코드를 개선해야하지만, 구글의 TPU는 이를 하드웨어적으로 구현해 냈다. 성능을 올리기 위해선 간단히 칩 성능만 올리면 된다. 소프트웨어 알고리즘의 업그레이드와 하드웨어 칩 업그레이드가 맞붙게 된 것이다. 영국의 인공지능 반도체 스타트업 ‘그래프코어’은 마이크로소프트(이하 MS)에 AI 전용 반도체를 납품하기로 했다고 발표했다. MS는 이를 자사 클라우드 컴퓨팅 플랫폼 ‘애저(Azure)’에 탑재해 고객에 좀 더 편리한 AI 개발 환경을 제공할 계획이라 밝혔다. 그래프코어의 AI 반도체는 머신러닝에 특화된 I