글
그날 IDC에선 무슨 일이 있었나 |
강은성기자 esther@inews24.com 2006년 09월 29일 |
#1. 암전 지난 26일 오후 경기도 분당에 있는 호스트웨이의 인터넷데이터센터(IDC). 이 곳은 여느 때처럼 '웅' 하는 굉음이 기본 소음으로 깔려 있다. 수많은 서버들이 돌아가면서 나오는 소리가 합쳐져서 웬만한 공장 소음 못지 않게 시끄러운 곳이다. 오후 4시26분. 갑작스런 암흑이 찾아왔다. 수천대가 넘는 서버들이 내던 '웅' 소리는 암흑이 찾아옴과 동시에 한숨이 꺼지듯 '슈웅~'하는 소리로 바뀌었다. 일순 정적이 감돌았다. 때마침 이 곳에 입주된 자사 서버를 관리하기 위해 바닥에 앉아서 모니터를 들여다보던 몇몇 관리자들은 모니터의 화면은 물론, 전체 전원과 소리마저 사라진 암전에 순간 아연실색했다. #2. 다시 빛은 밝혀졌는데... 암흑과 고요도 잠시. 수초 후 빛은 다시 센터 안을 밝혔다. '삐, 삐릿'하는 소리들과 함께 여기저기서 서버 재가동 소리가 들려온다. 하지만 서버는 TV나 에어컨과는 다르다. 비정상적으로 전원이 꺼졌다가 켜지는 순간 서버의 데이터 손실은 물론, 다른 여러 가지 장애가 뒤따르게 된다. 센터 밖에서 암전을 지켜본 관리자들은 비상사태임를 감지한다. 관리자들이 일제히 센터 안으로 뛰어 들어오기 시작했다. "뭐야, 우리 서버는 하드디스크가 다 나갔잖아." "우리 서버는 데이터까지 손실된 것 같아." 엔지니어들의 손길이 미치자 하나 둘 피해상황이 파악돼 간다. 시간이 흐르자 서버 장애 때문에 서비스에 차질을 겪은 입주사의 엔지니어들이 속속 IDC로 모여들었다. 다들 사색이 된 표정이다. 랙 사이의 좁은 공간은 서버 복구자들로 발 디딜틈이 없어졌다. 서버의 전원 장치가 아예 파손돼 통째로 갈아끼워야 하는 엔지니어들은 내부에 자리가 비좁자 아예 서버를 들고 밖으로 나가 복도나 길에서 고치기도 했다. 답답한 마음에 엔지니어들은 삼삼오오 복도에 모여들어 담배를 꺼내문다. 끼니를 해결하지 못해 근처 편의점에서 사온 컵라면, 빵과 우유 등을 허겁지겁 먹는 엔지니어도 있다. 오후 4시26분 정전 발생 이후 시계 바늘은 어느덧 밤 12시를 가리키고 있다. 복구를 완료한 엔지니어들이 하나 둘 일어선다. 하지만 복구작업이 미처 끝나지 않은 엔지니어들은 피곤에 눈을 부빈다. 이들은 아무래도 IDC의 차가운 바닥에서 밤을 하얗게 새워야 할 판이다. 정전 후 전기는 불과 수 초만에 되살아났다. 그러나 순간의 정전이 IDC에는 그렇게 크고 긴 상처를 남겼다. #3. 호스트웨이, "복구를 위해 전면전!" 정전 발생 이후 몰려드는 입주사 엔지니어들의 불만과 항의를 감당하는 것은 어차피 호스트웨이의 몫. 호스트웨이 IDC의 엔지니어들은 총동원됐다. 양손에 전화기와 무전기를 들고 빗발치는 문의 전화들에 일일이 응대하면서 드넓은 센터 안을 100m 달리기 하듯 뛰어다녔다. '휴대폰 들고 달리기'를 연상케 한다. 대부분의 서버들은 정전 이후 자동으로 재가동됐다. 하지만 일부 그렇지 않은 서버들도 있다. 이를 해결해 주기 위해 IDC측 엔지니어들은 허들을 넘듯 여기저기 널려 있는 케이블과 랙을 훌쩍훌쩍 뛰어넘으며 달리고 또 달렸다. 또한 서버 그룹별로 할당된 관리 콘솔과 모니터를 재빨리 점검하고 이를 선점하지 못한 입주사 엔지니어에게 자사 장비를 대여하는 등 1인 3역, 4역을 감당해냈다. 한 입주사는 서버의 전원 장애로 인해 하드디스크에 치명적인 손상을 입었다. 데이터는 손실됐다. 호스트웨이는 복구를 위한 모든 인프라를 제공하는 한편, 직접 복구 소프트웨어 회사와 연결, 입주사의 데이터 복구가 성공할 수 있도록 지원했다. 물론 비용도 호스트웨이가 부담했다. '복구와의 전쟁'은 이틀만에 종결됐다. IDC는 다시 정상으로 돌아가고 있다. #4. 왜 이런 일이... 정전 사태가 난 원인에 대해 호스트웨이측은 한국전력에서 공급된 이상 전압 전류 때문이라고 밝히고 있다. 한국전력은 본래 기준치인 60Hz에서 오차범위 ±0.4Hz 이내의 일정한 전압으로 전력을 공급한다. 하지만 이날은 과천-의왕의 송전탑 화재로 인해 전압이 고르지 못해오차범위 ±0.4Hz가 넘는 이상 전압이 반복해 공급됐다. 이 같은 현상이 반복되면 IDC에서는 정전이 아니더라도 IDC내의 시스템 보호를 위해 무정전시스템(UPS)으로 전원 시스템이 자동 전환된다. 그 절체 순간이 0.2초 정도 걸린다. 문제는 무정전시스템(UPS)으로 전원 시스템이 자동 전환되는 0.2초의 짧은 순간에 다시 한번 이상 전압이 흘렀다는 것. 그에 따라 순간 전압 강하가 발생했고, 이로 인해 UPS가 장애를 일으켰다고 호스트웨이측은 분석하고 있다. 현재 호스트웨이는 한국전력측에 전력공급상 이상 전압 유입에 대한 원인 파악과 자료를 요청한 상태다. 또 입주사들이 겪은 피해를 최대한 줄여주겠다는 방침이다. 이와 함께 이상 전압 오차범위를 더욱 줄여 앞으로 이상 전압이 발생하더라도 또 다시 장애를 입지 않도록 PCB 옵션을 교환하기로 했다. '인터넷 천국'이 돼 버린 한국. 인터넷으로 서비스를 제공하는 기업들은 대부분 자사의 서버를 인터넷데이터센터(IDC)에 맡긴다. 인터넷 회선 및 네트워크 관리 서비스도 받는다. 이런 IDC가 단 한 순간이라도 장애를 입는다면 이는 IDC서비스 업체의 손해나 이미지 타격으로 끝나지 않는다. IDC에 서버를 맡긴 수백, 수천 곳의 사이트가 일시에 마비되거나 장애를 겪는다. 그로 인해 서비스 수준이 떨어지는 등 인터넷 관련 업계 전체에 미치는 파장이 적지 않다. 때문에 IDC 서비스의 안정성은 아무리 강조해도 지나치지 않다. 하지만 천재지변이나 불가항력에 의해 IDC가 장애를 겪을 가능성은 항상 존재한다. 이번 처럼 과천-의왕에서 발생한 송전탑 화재가 엉뚱하게 멀리 떨어져 있는 분당의 IDC에 정전을 불러오는 사고가 일어날 수 있는 것. 지금 우리나라는 인터넷이 마비되면 나라 전체가 마비될 정도로 공공, 민간 부문의 인터넷 의존도가 매우 높다. 인터넷이 이젠 국가사회 운영 측면에서도 매우 중요한 인프라가 된 것. IDC는 통신망과 함께 인터넷의 가장 중요한 기반시설이다. 통신망이 살아 있어도 IDC에 장애가 발생하면 대란이 빚어지게 마련이다. 이번 사고를 계기로 IDC라는 시설을 운영업체의 일로만 치부할 게 아니라, 정부 차원에서도 관심을 갖고 관리해야 하는 기간계 시설이라는 인식을 가져야 한다는 지적이다. |
RECENT COMMENT