IT 인터넷/SNS

"네이버 데이터센터는 재난 상황에서도 빠른 복구와 안정적인 서비스"

주원규 기자

파이낸셜뉴스

입력 2025.10.28 09:00

수정 2025.10.28 09:00

이상준 네이버클라우드 최고운영책임자(CIO). 네이버클라우드 제공
이상준 네이버클라우드 최고운영책임자(CIO). 네이버클라우드 제공

[파이낸셜뉴스] 네이버클라우드가 국내 최초의 인공지능(AI) 데이터센터인 '각 세종'에서 고성능그래픽카드(GPU) 운영 효율을 극대화하고 AI 인프라를 스스로 설계·운영할 수 있는 기술을 공개했다. 특히 데이터센터의 이중화 구조를 통해 각종 장애 상황이나 재난에 대비하는 안정적인 서비스 제공 역량을 갖췄다. 네이버클라우드는 글로벌 수준의 GPU 운영 내재화 역량을 기반으로 국내 산업 전반의 AI 활용을 높이겠다는 계획이다.

지난 27일 이상준 네이버클라우드 최고운영책임자(CIO)는 세종시 데이터센터 '각 세종'에서 기자들과 만나 “이제 AI 인프라의 경쟁력은 'GPU를 얼마나 많이 확보하는가'를 넘어 '확보한 자원을 얼마나 안정적이고 효율적으로 운영하는지'에 달려 있다”며 “네이버클라우드는 GPU 확보와 운영 기술 내재화의 균형을 통해 AI 인프라 경쟁력을 완성하고 있다”며 이같이 밝혔다.

특히 각 세종 데이터센터는 최근 발생한 국정자원관리원 화재와 같은 장애 상황에서도 서비스가 멈추지 않도록 전력과 냉각, 서버 운용 체계를 완전히 분리하면서도 유기적으로 통합한 이중화 구조로 설계됐다.

이 CIO는 "네이버는 기본적으로 서비스를 만들어내는 과정에서 한쪽에 문제를 대비해 백업할 수 있는 곳을 만드는 '이중화'에 투자했기 때문에 비교적 빠른 복구와 안정적인 서비스가 가능하다"고 강조했다.

네이버는 ‘각 세종’에서 대규모 GPU 클러스터를 직접 설계·운영하며 냉각·전력·네트워크 등 데이터센터 핵심 인프라를 자체적으로 설계하고 AI 워크로드에 최적화하는 기술을 내재화하고 있다. 정보기술(IT) 트렌드에 유연하게 대응하며 각 데이터센터들의 일원화해 상향 평준화된 프로세스를 일관적으로 적용하는 것이 강점이라는 설명이다.

AI 연산이 집중되는 데이터센터에서 중요한 요소인 발열 관리를 위해선 직접외기·간접외기·냉수를 병행하는 하이브리드 냉각 시스템을 적용했다. 이는 계절별로 냉각 방식을 자동 전환해, 겨울에는 외부의 찬 공기로 직접 냉각하고 간절기와 여름에는 간접외기와 냉수를 병행한다.

이러한 인프라 위에서 네이버의 AI 플랫폼은 모델 개발부터 학습, 추론, 서빙까지 AI의 전 과정을 하나로 연결하는 통합 운영 체계로 작동한다. 내부적으로는 하이퍼클로바의 학습과 운영이 모두 이 플랫폼 위에서 이루어지며 GPU 자원 배분, 모델 관리, 스케줄링까지 효율적으로 통제된다.

네이버는 이러한 운영 기술을 데이터센터 전반의 인프라 관리 영역으로 확장하며 향후 AI 기술을 활용해 운영 효율을 지속적으로 고도화해 나간다는 계획이다. 네이버클라우드는 GPUaaS(GPU as a Service) 모델을 통해 국내 주요 기업에 AI 인프라 서비스를 제공하고 있으며 향후 관련 사업 확대도 시사했다.


이 CIO는 “네이버클라우드는 축적한 AI 인프라 운영 역량을 GPUaaS 모델로 발전시켜 국내 기업들이 손쉽게 AI를 활용할 수 있는 생태계를 만들 것” 이라면서 “이를 통해 AI 인프라가 특정 기업의 자산을 넘어, 산업 전반의 성장 기반이 될 수 있도록 하겠다”고 전했다.

wongood@fnnews.com 주원규 기자