'각 춘천' 10주년…무중단·무사고·무재해 기록
하반기 제 2 데이터센터 '각 세종' 가동
네이버의 자체 데이터센터 '각 춘천'이 오는 6월이면 운영 10주년을 맞는다. /네이버클라우드 |
[더팩트|최문정 기자] "네이버의 데이터센터 '각'은 단순히 공간을 제공하거나, IT 서비스와 콘텐츠를 공급하는 것이 아니다. 네이버를 사용하는 사회, 기업, 국가의 소중한 정보와 기록을 안전히 보관해 대한민국 후손들에게 전달하고자 하는 사명감을 갖고 있다."
네이버클라우드는 지난 9일 강원도 춘천에 위치한 네이버 자체 데이터센터(이하 각 춘천)에서 지난 10년간의 데이터센터 운영 경험을 공유하고, 올해 하반기 가동을 목표로 하는 두 번째 자체 데이터센터 '각 세종'을 소개하는 테크포럼을 개최했다.
지난 2013년 6월 설립된 각 춘천은 국내 인터넷 기업 최초의 자체 데이터센터다. 강원도 춘천시 구봉산 자락에 들어선 각 춘천은 축구장 7개 크기인 연면적 4만6850㎡, 약 10만 유닛(서버의 높이 단위)의 서버를 수용할 수 있는 규모다.
이날 발표자로 나선 노상민 네이버클라우드 데이터센터 센터장은 지난 10년간 각 춘천의 운영 키워드로 무중단, 무사고, 무재해의 '3무(無)'를 꼽았다. 이를 위해 네이버클라우드는 7대 원칙을 세워 실천해왔다. 7대 원칙은 △죽지 말아야 하고 △안전해야 하고 △데이터가 유실되지 말아야 하고 △빨라야 하고 △유연해야 하고 △미리 준비해야 하고 △비용은 효율화해야 한다는 것이다.
네이버클라우드는 10년 전 '각 춘천' 가동을 시작하며 데이터센터의 설계·구축·운영 전 단계에 걸쳐 독립적인 운영이 가능하도록 기술과 인력을 내재화해왔다. /네이버클라우드 |
◆ 인력·기술 내재화로 장애·사고 365일, 24시간 대응
네이버클라우드는 데이터센터의 설계·구축·운영 전 단계에 걸쳐 독립적인 운영이 가능하도록 기술과 인력을 내재화했다.
현재 각 춘천에는 전기·기계·제어·통신 등 데이터센터 운영에 필요한 인력 100여 명이 상주하고 있다. 노 센터장은 "선임자와 후임자 간의 지속적인 업무 교류, 다양한 시장 상황에 대한 숙지와 현장 실습을 통해 데이터센터 구성원의 역량도 지속해 키워내고 있다"고 강조했다.
기술개발(R&D)을 통해 데이터센터 설비와 서비스 운영이 필요한 기술도 확보했다. 특히 장애 감지와 분석 도구를 내재화해 장애 발생 시 신속·정확한 대응이 가능하다는 게 네이버 측의 설명이다. 대표적인 감지도구인 '웹 모니터링 시스템(WMS)'은 기존 상용 도구에서는 감지하지 못했던 장애 전조증상 등을 예고한다. 종합 장애 분석 도구는 데이터베이스(DB), 네트워크, 서버 정보가 연동돼 있어 서비스 장애 시 종합적인 상황 분석과 효과적인 복구 지원이 가능하다.
아울러 재해 발생 시 컨트롤타워 역할을 하는 BCP 전담조직을 구성해 직무별 개인 행동 요령과 대응 단계를 마련했다. 네이버클라우드뿐만 아니라 필요하다면 팀네이버 전체가 동원된다.
각 춘천은 △연 2회 BCP 모의 훈련 △연 1회 춘천소방서와의 민관합동소방훈련 △월 1~2회 운영안정성 점검훈련을 한다. 지난 10년간 약 200회 이상의 대응 훈련을 해왔다.
또한 네이버웍스의 업무툴인 '웍스봇'을 통해 △임직원 커뮤니케이션 △가용 자원 파악 △신속한 복구에 활용한다. 웍스봇은 인프라 설비운영 직원을 대상으로 데이터센터 내 온도와 습도, 열 감지, 서비스 장애 여부 등의 정보를 실시간으로 전달한다.
각 춘천은 지진, 정전, 화재, 산사태, 홍수 등과 같은 극단적인 상황이 발생하더라도 서비스 지속성이 유지될 수 있도록 대비시설을 구축했다. 각 춘천의 모든 건물은 규모 6.5 이상을 견딜 수 있도록 내진 설계가 돼 있다. 이는 국내 원자력 발전소의 내진설계와 동일한 수준이다. 산불 등이 발생해 CCTV에 발열이 감지되면 서버관 건물 옥상의 방수총에서 물을 분사해 화재확산을 막는다.
'각 춘천'은 인근의 두 전력 발전소에서 전기를 공급받는다. 또한 정전이 발생하더라도 대응할 수 있도록 '다이나믹 UPS' 설비를 갖췄다. /네이버클라우드 |
데이터센터 운영의 핵심인 전력과 네트워크 이중화도 돼 있다. 각 춘천은 춘천 변전소와 북춘천 변전소 등 두 곳에서 전력을 공급받는다. 어느 한쪽에서 문제가 발생해도 전력 차단 사태로 이어지지 않게 하기 위한 구조다.
다이나믹 전원공급장치(UPS)도 갖췄다. 외부 전력이 차단되면 즉시 UPS에 붙은 디젤 발전기가 돌아간다. 각 춘천 지하에는 60만 리터 규모의 경유 탱크가 있다. 이는 약 70시간 이상 데이터센터의 모든 서비스를 자체적으로 돌릴 수 있는 수준이다. 각 춘천에 설치된 UPS는 발전기 일체형 모델로 약 5~7초간 자체 전력을 생산할 수 있어 디젤 엔진이 켜지는 시간을 벌 수 있다.
다이나믹 UPS는 지난해 10월 카카오와 네이버 등 국내 주요 기업들의 IT서비스를 마비시킨 SK C&C 판교데이터 센터 화재가 UPS실의 배터리 장비에서 시작됐다는 조사 결과가 나오며 리튬이온 배터리의 대체재로 주목받고 있다.
네이버클라우드 관계자는 "다이나믹 UPS는 에어컨 등 발열 제어 기기가 추가돼야 하는 배터리형 UPS와 달리 상대적으로 작은 공간에도 설치할 수 있는 장점이 있다"며 "배터리형 UPS는 소모품이라는 배터리의 특성상 7년에 한 번은 교체를 해야 하지만, 다이나믹 UPS는 소모품 관리를 잘 하면 20년 이상은 거뜬히 사용할 수 있다"고 말했다.
이어 "배터리 타입이 다이나믹 UPS보다 열세하다는 것은 절대 아니다. 기업의 환경적인 조건에서 선택하는 것"이라며 "다이나믹 UPS의 단점은 소음이 심하고, 작동 시 진동이 발생해 건물에 영향을 줄 수 있는 것"이라고 덧붙였다.
통신 역시 다수의 통신사업자의 서비스를 이용하고 있어 한 통신사에 문제가 생겨도 장애로 이어지지 않는다.
이날 노 센터장은 네이버가 매년 데이터센터 운영에 수천억 원 이상을 투자하고 있다고 밝혔다. 그는 "취약성 등을 개선하기 위해서는 투자가 기반이 돼야 한다. 투자하지 않으면 절대 문제점이 개선될 수 없다"며 "많은 IT 회사가 데이터센터를 일종의 지원조직처럼 생각하지만, 네이버는 이를 서비스의 관점에서 중요한 하나의 부서로 보고 있다"고 강조했다.
네이버클라우드는 서비스의 특성과 상황을 고려해 데이터 분산 배치한다. /네이버클라우드 |
◆ 서비스 맞춤형 데이터 관리·분산
데이터센터의 핵심인 데이터 자체도 체계적으로 관리한다. 애초 수도권에서 떨어진 강원도 춘천에 데이터센터를 지은 것도 데이터 관리를 위해서다. 시설이 밀집해 있을 경우 재난 시 위기관리에 취약할 수 있기 때문이다. 현재 네이버클라우드는 수도권뿐만 아니라 강원, 충북, 경남 등 다양한 지역에 데이터센터를 구축했다. 세종특별시 첨단산업단지에 들어설 제2 데이터센터인 각 세종 또한 각 춘천과의 물리적 거리를 고려해 선정한 입지다.
네이버는 '스케일 아웃' 구조로 거미줄처럼 촘촘하게 구성된 네트워크 아키텍처 상에 서비스를 분산 배치했다. 이에 따라 어느 한 곳에 이슈가 발생하더라도 다른 곳에서 서비스가 가능하며, 데이터가 유실되는 사고를 방지하고 있다.
정수환 네이버클라우드 IT 서비스본부장은 "메인 데이터센터를 하나 산정하고, 이 센터의 백업센터를 마련하는 획일화된 기준을 적용하는 것이 아니라 다수의 데이터센터를 확보하고, 그 어떤 시설에 문제가 생기더라도 다른 센터에서 서비스가 재개되도록 하는 시스템을 목표로 한다"고 말했다.
정 본부장은 또 "중요한 정보나 서비스를 자체 데이터센터에 두는 것이 아니고, 모든 서비스가 똑같이 중요하기 때문에 최대한 분산해 배치한다"며 "기본 원칙은 모든 서비스들이 상황에 맞게 데이터센터에 분산돼 비치되고 있다는 것"이라고 강조했다.
아울러 '데이터센터 상면용량 협의기구'를 구성해 서비스 안정성과 효율성을 높이고 있다. 데이터센터 기술을 개발하고 서비스를 제공하는 데이터센터 기획·기술 조직과 서비스 인프라 매니저 조직, IT 인프라 엔지니어 조직과 같은 유관부서와 협의기구를 통해 상면 수요를 정확하게 예측하고 운용할 수 있도록 한다.
아울러 각 춘천은 개인정보보호법, 클라우드컴퓨팅서비스 정보보호에 관한 기준, 전자금융감독규정 등 다양한 규정을 준수하며, 서비스 운영 현황을 정기적으로 검증받고 있다. 네이버클라우드는 13개의 정보보호인증을 획득했다.
네이버클라우드는 기술력과 노하우를 네이버의 두 번째 자체 데이터센터인 '각 세종'에 입힌다. 각 세종은 올해 3분기 가동을 목표로 한다. /네이버클라우드 |
◆ 하반기 '각 세종' 가동…'미래형 로봇 데이터센터'로 육성
노 센터장은 이날 "네이버클라우드의 데이터센터 기술력은 국내에서는 가장 높다고 생각한다"며 "지난 10년 동안 운영했던 노하우가 축적돼 있기 때문에 글로벌 시장에서도 크게 차이가 나지 않는다"고 자부심을 드러냈다.
네이버클라우드는 이와 같은 기술력과 노하우를 네이버의 두 번째 자체 데이터센터인 '각 세종'에 입힌다는 구상이다. 각 세종은 올해 2분기 내 준공하고, 3분기 실가동을 목표로 제시했다.
각 세종은 각 춘천의 6배 규모인 29만3697㎡의 하이퍼스케일 데이터센터다. 각 세종은 약 60만 유닛 이상의 서버를 수용할 예정으로 빅데이터, 인공지능(AI), 로봇 등 클라우드 산업의 핵심 인프라로 기능할 예정이다. 아울러 네이버클라우드는 각 세종에 로봇과 자율주행 등의 첨단 기술을 대거 적용해 데이터센터 현장 업무의 생산성을 높일 예정이다.
네이버클라우드는 각 세종의 가동을 앞두고 네이버가 지난 2021년 공개한 초거대 AI '하이퍼클로바'를 가동하기 위한 인프라 구축에 집중하고 있다. 하이퍼클로바는 2040억 개 파라미터(매개변수) 규모의 한국어 기반 초거대 AI다. 초거대 AI의 특성상 막대한 데이터 저장공간과 전력이 필요하다.
정 본부장은 "하이퍼클로바와 같은 초거대 AI 가동에서 전력이 제일 중요하다"며 "랙(서버가 비치된 선반)에 얼마나 많은 전력을 제공할 수 있는지에 따라서 장착할 수 있는 서버의 개수가 달라지고, 하나의 랙에 서버를 많이 장착할수록 데이터센터 운영을 효율화할 수 있다"고 설명했다.
이어 "그렇다고 랙에 서버를 지나치게 많이 넣으면 더 많은 열이 발생하고, 이를 식히기 위해 부수적으로 따라와야 하는 기술과 설비가 생긴다"며 "각 세종은 그러한 것들을 전체적으로 고려해 준비하고 있다"고 밝혔다.
한편, 네이버는 데이터센터 설계와 운영에 있어서 ESG 경영을 실천하고 있다고 밝혔다. 각 춘천의 경우 △서버 쿨링에 자연바람 활용 △서버실 폐열로 '스노우멜팅' 시스템 운영 △빗물 재활용 △태양광 발전시설 등의 요소를 갖췄다.
munn09@tf.co.kr