배너
닫기
배너

[인터뷰] ‘핫한’ 데이터 센터...열 관리에 해답을 제시하다

URL복사
[선착순 마감임박] 우리 기업에 꼭 필요한 AI를 활용해 비즈니스를 확장할 수 있는 방법은? AI융합 비즈니스 개발 컨퍼런스에서 확인하세요 (5/3, 코엑스3층 E홀1~4)

4차 산업혁명은 초지능화, 초연결성, 초융합성을 근간으로 폭발적인 정보처리량을 도출했다. 즉 산술적으로 형용하기 여려운 양의 ‘빅데이터’가 현대인의 삶에 침투했고, 이 양은 매일 약 25억기가바이트(GB)에 해당한다.

 

쉽게 말해 인류가 지난 5000년 동안 생성한 데이터가 현대에는 하루만에 만들어지는 것이다. 전문가 사이에서는 2025년이 되면 전 세계에서 생성되는 하루 데이터가 463엑사바이트(EB), 약 5000억기가바이트에 이를 것이라고 전망된다.

 

이처럼 방대한 정보를 처리하기 위해 탄생한 방안이 데이터 센터다. ‘서버 호텔’이라고도 불리는 이 시설은 데이터를 한 데 모아 관리하는 데 목적을 둔다. 현재 전 세계에 구축된 크고 작은 데이터 센터는 약 2000개 이상인 것으로 알려졌다.

 

이 중 5000대 이상의 서버 구성, 초당 40기가바이트를 처리하는 하이퍼 스케일 데이터 센터는 2021년 말 기준 전 세계 700개를 웃돈다고 시장조사기관 시너지 리서치 그룹(Synergy Research Group)이 발표했다. 이런 데이터 센터는 현재 전 세계 각지에서 우후죽순 설치되는 중이다.

 

데이터 센터는 각종 최신 고성능 컴퓨팅 기술이 집약된 시설로, 열 관리가 필연적으로 요구된다. 여기에 인공지능(AI), IoT, 차세대 통신 기술 등 기술의 활용도가 급증함에 따라 데이터 관련 설비 온도는 지속 상승 중이다. 최근 활용되는 개인용 고성능 PC 한 대에도 각종 공조 시스템이 탑재되는 것을 감안하면 냉각 기술의 발전은 당연한 현상이다.

 

최근 서버는 CPU·GPU·메모리 등 핵심 부품을 단일 섀시에 장착하는 설계를 띈다. 해당 부품에 공급되는 전력은 통상 1kW 이상으로, 이를 데이터 센터로 확장해 환산하면 냉각 기술의 도입은 필수다.

 

장치 냉각 기술은 공기로 열을 식히는 공랭 방식부터 액체를 통해 냉각하는 수랭 방식 등 간접 열 관리 시스템이 대중적이다. 최근에는 비전도성 특수 냉각유를 통해 열을 잡아내는 액침냉각(Immersion Cooling)이 차세대 열 관리 방식으로 급부상하고 있다. 장치를 액체에 담궈 직접적으로 열을 잡아내는 설계라고 생각하면 이해가 쉽다.

 

 

데이터 센터 이전 세대의 단일 서버는 공랭 방식으로도 충분한 냉각 성능이 발휘됐다. 다시 말해 팬 성능만으로 열 관리가 가능했다는 것인데, 데이터 센터로 넘어오면서 수랭 방식이 조명받기 시작했다. 수랭 방식은 공기 분자보다 촘촘한 액체 분야의 성질을 이용해 열 전달 효율을 최적화해 냉각이 한층 용이하다.

 

수랭 방식은 데이터 센터 운영 측면에서 공랭식 대비 운영 비용 절감, 에너지 전력 절약, 투자수익률(ROI) 및 장비 전력사용효율(PUE) 제고, 환경 영향 감소 등 효과를 도출한다. 특히 최근 컴퓨팅 하드웨어 성능이 극대화되는 양상에서 초고성능 하드웨어에 특화된 냉각 기술이라는 점에서 기존 공랭식에서 전환되는 추세다.

 

공랭·수랭·액침냉각...열 식히는 기술 집약한 슈퍼마이크로 “다방면의 열 관리 솔루션 통해 데이터 스토리지 효율·보호↑”

 

미국 서버 솔루션 업체 슈퍼마이크로는 캘리포니아주 산호세에 거점을 두고 데이터 설비 열 관리 기술을 글로벌 산업에 제시하고 있다. 특히 자체 설계 및 생산을 핵심 기조로 경쟁력을 발휘하는 중이다.

 

슈퍼마이크로는 장치 냉각 과정을 거친 고온의 액체를 배관(튜브)을 통해 외부 냉각 시스템으로 이동시킨 후 공랭 방식으로 액체의 열을 식히는 하이브리드 냉각 시스템을 채택했다. 공랭에서 수랭으로의 완전한 전환이 아닌, 공랭과 수랭의 강점을 융합한 방식이라는 점이 채택 배경이다. 이 시스템은 CPU 및 GPU의 집적도를 극대화해 소형화 설계가 가능하다는 특징도 보유했다.

 

슈퍼마이크로는 다이렉트 투 칩(Direct-To-Chip) 기술이 적용된 제품도 보유했다. 해당 기술은 부품 칩 위에 열전도 액체를 유동시키는 설계로, 액체를 통해 칩 상단의 열을 냉각판으로 옮긴 후 냉각판 위로 액체를 흐르게 하는 방식이다.

 

액체는 열을 흡수하고, 열을 냉각시키기 위한 위치로 이동한다. 냉각된 액체는 연쇄 작용을 담당하는 폐쇄 루프 시스템을 통해 다시 칩으로 이동하는 식이다. 이 시스템의 핵심은 액체를 순환시키고 액체의 유동성을 지속 확보하기 위한 냉각 분배 장치(CDU) 펌프다.

 

CDU는 길이, 위치 등을 유연하게 설정 가능해 서버 일부를 냉각하거나, 서버 전체를 냉각하는 등 활용 목적에 따른 설계를 적용할 수 있다. 최근 출시된 CDU는 현재 도입되는 각종 랙 규모에 탑재 가능하며, 최대 80kW급 열 제거 임무를 수행한다.

 

CDU는 해당 강점에 반해 한계도 존재한다. 랙 유닛을 CDU 전용으로 설계해야 하는데, 이 때문에 컴퓨팅 밀도가 감소한다. 슈퍼마이크로 실험에 따르면 팬 속도 측면에서 CDU 수랭 시스템은 완전 공랭식에 비해 전력 효율이 10% 상승하고, 이에 따른 비용 절감 효과를 나타낸다.

 

슈퍼마이크로는 전력 효율성 개선에 최적화된 액침냉각 기술 도입을 위한 활동도 전개 중이다. 이를 위해 액침냉각 솔루션, 제조, 전자, 반도체 등 업체와 파트너십을 체결하고, 불호화합물 액체를 냉매로 채운 액침 냉각 탱크를 통해 CPU, 메모리 등 제품의 냉각 효율을 실험했다. 이 실험에 따르면 코어 수가 적은 고주파 CPU 칩은 높은 연산 속도를 나타냈고, 메모리 및 드라이브는 손상 없는 전기적 특성을 발휘했다.

 

 

데이터 센터당 하루 냉각수 소비량 100~500만 갤런...슈퍼마이크로 포트폴리오는 친환경 트렌트 속 냉각수 재활용이 가능할까?

 

빅 말얄라(Vik Malyala) 슈퍼마이크로 EMEA 상무이사 겸 사장 및 테크놀로지 & AI 부문 수석 부사장은 “AI 서버의 활용 사례가 증가하면서 기존의 공랭식 냉각 비용이 급증하고 있다”며 “이제는 수랭식 냉각을 고려해야 할 때”라고 조언했다. 강압식 공기 시스템을 통한 데이터 센터 냉각 방안은 공조 인프라에 대한 투자가 상당량 요구되며, 이는 데이터 센터에 대한 총소유비용(TCO)가 증가한다는 우려다.

 

여기에 수랭식 시스템이 활용하는 냉각수에 대한 의문이 발생한다. 슈퍼마이크로는 에너지 및 전력 절감 로드맵 ‘그린 컴퓨팅 솔루션 전략’ 일환인 수랭식 쿨링타워 솔루션을 산업에 제시한다. 이 솔루션은 에너지 효율성 확보가 핵심 철학으로, 열교환기가 통합된 폐쇄형 설계가 특징이다. 폐쇄형 냉각탑에서는 냉각 액체가 전열관을 통해 흐르면서 열을 외부로 방출한다.

 

액체가 고온의 전열관 표면에 분사되고, 쿨링타워 팬에 의해 이동하는 공기 속에서 증발한다. 이후 전열관 내부에 흐르는 냉각 액체가 식는 과정이 반복되는 원리다. 냉각 액체와 분사되는 액체는 독립적으로 이동하는데, 이는 공기 중 오염 물질과 접촉하지 않아 냉각수가 위생적으로 유지된다. 결국 잦은 냉각수 교체가 요구되지 않아 물 소비량이 6.2분당 갤런(GPU)에 그치는 물 소비 효율을 나타낸다.

 

슈퍼마이크로 그린 컴퓨팅 솔루션 전략은?

 

이 전략은 에너지 절약과 친환경화가 골자다. 전 세계 전력 수요의 1~1.5%에 달하는 데이터 센터에 대한 맞춤형 전략인데, 슈퍼마이크로는 랙 스케일 수랭식 솔루션을 이 전략의 핵심으로 배치했다. 이 솔루션은 CPU 및 GPU에 최적화된 설계를 이식해 기존 설계 대비 효율적인 열 관리가 가능하다.

 

말얄라 수석 부사장에 따르면 이 같은 슈퍼마이크로 기술을 통해 데이터 센터 PUE를 1.0에 가깝게 낮추면, 30개의 화석 연료 발전소를 대체한다. 이는 최대 100억 달러의 에너지 비용 절감이 가능한 수치로 분석된다.

 

 

그린 컴퓨팅 솔루션은 최첨단 CPU·GPU 기술을 이식한 서버 및 스토리지 시스템을 설계할 수 있다는 것이 또 다른 핵심이다. 랙 스케일 수랭식 냉각 옵션을 통해 전력 소비가 큰 최첨단 CPU·GPU 기술을 활용할 때 전력 비용을 최대 40%까지 절감할 수 있다는 게 말얄라 수석 부사장의 설명이다.

 

특히 슈퍼마이크로는 전력 소비가 극대화되는 AI 활용성의 배경에서 그린 컴퓨팅 솔루션 전략을 활용해 반사이익을 적립 중이다. 이와 관련해 현재 화두로 급부상한 온디바이스(On-Device) AI 기술을 다루는 엣지 서버 설계도 도맡았다. 말얄라 수석 부사장은 “그린 컴퓨팅 솔루션 전략을 통해 전 세계적으로 매월 약 4000개의 랙을 출하하고 있고, 올 연말까지 매월 5000개 이상의 랙을 공급하는 것이 목표”라고 말했다. 이는 200억 달러 규모로 점쳐진다.

 

‘그린 컴퓨팅’ 슈퍼마이크로 “주목할 스타 제품은 자율주행·AI·의료 등에 최적화됐다”

 

빅 말얄라 수석 부사장은 각 영역에서 활약하는 주력 제품을 소개했다. 8U 엔비디아 H100 HGX 8 시스템, 5U 10GPU 옴니버스, 슈퍼블레이드 시스템, 하이퍼 시리즈, 슈퍼엣지 시스템, 올플래시 E1.S 및 E3.S 스토리지 등이 여기에 해당된다. 이 모든 기술은 그린 컴퓨팅 솔루션 전략을 근간으로 한다.

 

먼저 8U 엔비디아 H100 HGX 8 시스템은 최신 GPU 기술과 결합돼 성능, 전력 효율성, 구축 효율 등을 지원한다. 특히 AI 대규모 언어 모델(LLM) 서비스에 활용된다. 이 시스템은 수랭식 방열판, 매니폴드, CDU 등으로 구성됐고, 설치와 동시에 활용 가능한 ‘플러그 앤 플레이(Plug and Play)’ 방식을 적용해 활용 직관성을 극대화했다.

 

 

이어 슈퍼마이크로의 하이엔드 냉각 설계를 이식한 5U 10GPU 옴니버스는 각종 가속기를 최대 10개까지 탑재 가능해 고집적도에서도 성능이 확보됐다. 여기에 하드웨어 구성을 다양하게 가져갈 수 있고, 대규모 언어 모델 추론, 고성능 그래픽 연산 등 각종 고성능 워크로드에 활용 가능하다.

 

슈퍼마이크로의 베스트셀러 제품으로 평가받는 슈퍼블레이드 시스템은 고성능·고집적·에너지 효율 극대화를 테마로 설계됐다. 아울러 전력·냉각·네트워킹 등 부품은 이중화 및 공유가 가능하다. 이를 통해 95%까지 배선을 줄일 수 있고, 리소스 절약 최적화, 유지보수 비용 절감 등 강점을 발현한다.

 

범용 서버 라인업인 하이퍼 시리즈는 인텔 제온 및 AMD EPYC 프로세서를 지원한다. HPC 슈퍼 컴퓨팅 등 첨단 기술이 요구되는 워크로드를 처리하는 것이 핵심 임무다. 여기에 스토리지 및 I/O 유연성을 갖췄다고 평가받는다.

 

슈퍼엣지 시스템은 2U 컴팩트 폼팩터에 핫스왑이 가능한 3개의 단일 프로세서 노드와 전면 I/O를 갖춘 설계가 특징이다. 전원은 AC 및 DC를 지원하고, 멀티 액세스 엣지 컴퓨팅, 오픈 RAN 및 아웃도어 엣지 구축에 최적화됐다.

 

 

말얄라 수석 부사장에 따르면 올플래시 E1.S 및 E3.S 스토리지는 최신 CPU 및 GPU 컴퓨팅의 필수 요소로 존재감을 확장하는 중이다. 표준 1U·2U 랙 마운트 시스템에서 최대 1페타바이트(PB)의 데이터에 대한 직관적이고 빠른 접근이 가능하다. 특히 AI 영역에서 병목현상 없는 향상된 스토리지 성능을 제공한다. 말얄라는 “올플래시 E1.S 및 E3.S 스토리지는 스토리지 요구사항을 충족하는 데 필요한 시스템 수를 줄여 총소유비용 및 탄소발자국 절감에 도움을 준다”고 평가했다.

 

그는 “슈퍼마이크로의 서버 및 스토리지 시스템은 폭넓은 범용성이 확보돼 기업 규모와 상관 없이 도입이 가능하다”며 “엣지부터 클라우드까지 광범위한 워크로드를 지원하는 슈퍼마이크로 솔루션은 섀시나 팬 교체 없이 여러 세대의 컴퓨팅에 활용 가능하다”고 강조했다.

 

끝으로 “각종 파트너사와 긴밀한 기술 협력을 통해 다양한 애플리케이션을 위한 광범위한 서버를 개발하고, AI·클라우드·5G 등 분야 엣지 및 대규모 데이터 센터에 최적의 랙 스케일 시스템을 제공하는 데 역량을 집중할 계획”이라고 덧붙였다.

 

헬로티 최재규 기자 |










배너









주요파트너/추천기업