닫기
배너

최적화로 데이터 센터 효율성 문제를 해결하는 방법

URL복사

개요

 

클라우드 도입과 인공지능(AI)의 시대로 접어들면서 데이터 센터 대역폭에 대한 수요가 급격히 증가해 전 세계적으로 데이터 센터도 기하급수적으로 늘어나는 추세다. 그러나 새로운 데이터 센터는 지속가능성과 공간 확보, 그리고 예산이라는 장벽을 마주하고 있다.

 

여러 정부 당국은 데이터 센터가 생산성, 경제 성장, 연구 발전에 기여한다는 점은 인정하고 있지만, 동시에 지역 사회의 민원, 수자원, 전력 사용에 미치는 영향 등 어려움이 동시에 존재한다. 이에 대한 가장 효과적인 해결책은 우리가 가진 자원의 한계를 고려하면서 기존 데이터 센터의 인프라를 최적화하여 성능을 극대화하는 것이다.

 

도시와 소비재, 그리고 우리가 살아가는 세계는 앞으로 점점 더 디지털화될 것이며 이에 더 많은 컴퓨팅 파워를 필요로 하게 된다. 현재 보유하고 있는 데이터 센터 인프라를 최적화해 더 높은 성능을 끌어내는 것은 데이터 센터에 닥친 현실적인 제약을 경쟁력으로 바꿔내는 효과적인 방법이다.

 

데이터 센터 최적화가 중요한 이유

 

기업의 CIO와 IT 리더는 비즈니스 전반에 활용할 수 있는 높은 성능의 기반 컴퓨팅 인프라를 구축해 새롭고 더 까다로워지는 워크로드들을 처리해야 하는 동시에 지속가능성, 상면 공간, 예산이라는 걸림돌을 균형 있게 관리해야 하는 숙제를 안고 있다. 많은 기업은 수요를 만족하는 새로운 데이터센터를 세우면서도 에너지 효율적인 기술을 통해 환경 영향을 최소화할 방법을 찾고 있다.

 

예를 들어, 유럽에서 가장 강력한 슈퍼컴퓨터 중 하나인 LUMI(Large Unified Modern Infrastructure)는 탄소 배출 없는 수력 에너지로 운영되고, 냉각 후 생긴 폐열은 가까이에 있는 핀란드 카야니(Kajaani) 지역의 주택 난방에 재활용된다. LUMI를 비롯해 여러 사례들이 데이터 센터 업계가 에너지 효율 문제에 대해 상당한 진전을 이루고 있다는 것을 보여준다. 하지만 여전히 단순한 에너지 효율 개선만으로 막대한 데이터를 다루는 인공지능의 폭발적 전력 수요를 감당하기는 버겁다.

 

늘어나는 AI의 전력 요구를 감당하려면 상면 공간과 전력망이 포화 상태에 가까운 현 상황 안에서 에너지 효율을 끌어올릴 수 있는 설계가 필요하다. 그리고 그 방법 중 한 가지는 낡은 서버를 최신 장비로 업그레이드하는 것이다. 데이터 센터는 막대한 자본이 투자되는 시설이기에, 많은 CIO와 IT 리더들은 기존 장비를 가능한 한 오래 사용하면서 비용을 절감하려고 한다. 실제 대부분의 데이터 센터는 10년 된 장비를 여전히 운영하며, 반드시 필요하다고 판단될 때에만 컴퓨팅 자원을 확장하고 있다. (자료 출처 : 델)

 

물론 새로운 데이터 센터의 구축이 불가피한 경우도 있지만, 기존 인프라를 업그레이드하는 것만으로도 큰 효과를 볼 수 있다. 최신 시스템으로 업그레이드한 데이터 센터는 동일한 일들을 훨씬 더 효율적으로 처리할 수 있기 때문이다. 세계적으로 IT 데이터 센터의 전력 부하는 2024년 180기가와트(GW)에서 2028년 296기가와트로 연평균 12.3% 증가할 전망이지만 같은 기간 쓰게 될 전력 소비량은 397테라와트시(TWh)에서 23.3% 높은 915테라와트시로, 전력 부하보다 더 빠르게 늘어날 것으로 전망된다. 이를 다르게 해석하면 해당 기간동안 데이터 센터들은 더 적은 서버랙과 시스템으로 같은 대역폭을 유지할 수 있다.

 

이를 통해 앞으로 이어질 IT 수요를 충족시킬 수 있는 공간적 여유를 확보하는 동시에, 현재 AI 워크로드에 필요한 한 실험 공간도 마련할 수 있다. 기업들은 대규모 설비 구축 전에 이 공간에서 적은 비용이 드는 소규모 랙을 통해 개념 증명(POC, Proof of Concept)을 거치고, 이후 최신 고효율 칩을 도입해 에너지 소비와 냉각에 대한 부담을 줄여 투자 회수 속도를 더 높일 수 있다.

 

업그레이드 시 고려해야 할 사항

 

서버 업그레이드는 다양한 요소를 고려해야 하며, 모든 데이터 센터에 맞는 한 가지 정답은 없다. 그렇다고 단순히 가장 강력한 칩을 구매한다고 해서 모든 문제가 해결되는 것도 아니다. 물론 고성능 칩이 에너지 효율에 미치는 영향은 상당하지만, 각 데이터 센터는 가장 효율적으로 운영하는 데 필요한 하드웨어 및 소프트웨어 스택을 결정하기 위해 서로 다른 요구 조건들을 갖고 있다.

 

실제 사례로, 한국의 대표적인 클라우드 기업 카카오엔터프라이즈는 광범위한 서비스를 위해 다양한 워크로드에 대응할 수 있는 고성능 서버가 필요했다. 이 회사는 3세대 및 4세대 AMD 에픽(EPYC) 프로세서를 함께 도입해 전체 워크로드를 처리하는 데 필요한 서버 수를 기존 대비 40% 수준으로 줄일 수 있었고, 성능은 30% 높아졌다. 또한 총 소유 비용(TCO)을 절반으로 줄이는 성과를 거두었다.

 

카카오엔터프라이즈의 사례처럼, IT 의사결정자들은 고성능 칩, 네트워킹, 소프트웨어, 시스템 설계 역량을 바탕으로 엔드-투-엔드 데이터 센터 인프라를 대규모로 제공할 수 있는 공급 업체를 찾아야 한다. 예를 들어, 적절한 랙 설계를 적용하면 필요에 따라 하드웨어를 쉽게 교체할 수 있게 되고, 개방형 소프트웨어 환경을 갖추면 여러 공급업체의 소프트웨어 스택을 매끄럽게 연동할 수 있다.

 

더불어, 세계적 수준의 시스템 설계와 AI 시스템 역량에 지속적으로 투자하는 공급업체는 기업의 AI 하드웨어 및 소프트웨어 로드맵을 가속화할 수 있는 최적의 위치에 있다. AMD는 최근 5년 동안 AI 훈련 및 HPC를 위한 노드 수준 에너지 효율성을 38배 향상시켰다. 이는 동시에 동일한 성능을 내는 데 필요한 에너지를 97% 절감했다는 의미이며, 이를 통해 공급자와 최종 사용자 모두가 지속가능하고 대규모 혁신을 이룰 수 있었다.


데이터 센터의 진화

 

디지털 기술에 대한 의존도가 계속해서 높아지면서 컴퓨팅 파워에 대한 수요 또한 증가하고 있다. 더 많은 컴퓨팅을 위한 상면 공간 수요와 지속가능성 목표 사이의 균형을 잡는 것은 중요하다. 그리고 그 해답은 현재 우리가 보유한 상면 공간을 최대한 활용하는 데 있다.

 

지금은 공간과 지속가능성에 대해 현명하게 고민하고, 눈에 보이는 문제들을 큰 기회로 바꿀 수 있는 기회다. 적절한 컴퓨팅 아키텍처는 데이터 센터가 더 적은 에너지와 자원으로 동일한 작업을 처리하게 하고, 더 나아가 비즈니스와 삶을 바꿀 미래 기술을 위한 공간까지 제공한다.

 

헬로티 서재창 기자 |









배너




배너



배너


주요파트너/추천기업