[테마기획]인텔리전스 백업의 진화

기업이 성장·발전함에 따라 기업이 보유해야 할 데이터의 양도 폭발적으로 늘어나고 데이터를 저장·보관하는 데이터 백업에 대한 중요성도 날로 그 의미를 더하고 있다.

 지난 50년간 테이프의 고유영역으로 자리잡았던 백업은 최근 디스크 및 가상테이프라이브러리(VTL)이 백업에 활용되고 물리적인 디스크의 용량을 최적으로 활용하는 데이터 디듀플리케이션 기술의 등장, 그리고 점차 지능화되고 속도 및 용량을 높여가고 있는 테이프 라이브러리 부문의 발전 등으로 빠르게 변화하고 있다.

 중요한 데이터의 사본을 만들어 원본 데이터의 손상을 대비하는 백업은 IT 관리의 가장 중요한 작업 중 하나가 되었다. 데이터 백업에 대한 관심의 증가만큼이나 이들 데이터 백업 기술의 향상도 눈부시다. 더욱 지능적이고, 비용 효율적이며, 손쉬운 관리가 가능한 백업 기술로의 진화는 오늘도 계속되고 있다.

 ◇‘백업’에서 ‘아카이빙’ 장비로 변모하는 테이프 라이브러리=가장 널리 알려진 전통적인 백업 방식은 테이프 백업이다.

테이프는 휴대가 가능하고 저장 용량 대비 유지 비용이 디스크에 비해 현저히 낮기 때문에 백업 매체의 주류로 활용되어 왔다.

 처음 등장했던 테이프 장치는 테이프가 지나는 경로를 진공으로 제어하는 오픈릴 테이프였는데 장비의 크기가 지나치게 크고 관리 비용이 높아서 예산이 상대적으로 많은 대기업이나 은행권 위주로 사용됐다. 이후 오픈 릴 미디어를 대체하는 카트리지가 등장하면서 로봇을 통한 자동화를 이룰 수 있게 됐고, 이로 인해 백업 라이브러리를 활용한 테이프 백업 환경이 도래하게 됐다.

 이 시기에 등장한 DLT(Digital Linear Tape)는 획기적으로 작아진 드라이브에 대용량의 백업 가능한 데다가 가격도 저렴해 중소형 백업 환경에서도 각광을 받았다. 중소 규모 시장을 선점한 DLT에 이어 LTO(Linear Tape Open) 드라이브가 선을 보였다. LTO는 현재 LTO 3세대가 사용 중이며 올해 후반에 4세대 LTO가 출시될 예정이다.

 현재 시장에서 카트리지 대비 최고 용량을 지원하는 매체는 비압축으로 800GB의 데이터를 기록할 수 있는 퀀텀의 DLT-S4이고 가장 빠른 드라이브는 썬 스토리지텍의 T10000으로 초당 120MB의 데이터 전송이 가능하다. 초기의 테이프 드라이브와는 달리 현재는 SAN 환경을 지원해서 드라이브 자원의 공유가 가능하고 데이터 전송속도만 놓고 본다면 디스크와 비교해도 경쟁력을 갖춘 단계에 이르렀다. 이제 테이프 기술은 단순히 디스크에 비해 값이 저렴한 저장기술이 아닌, 디스크로는 구현하기 어려운 조건을 만족시킬 수 있는 저장장치로 자리잡고 있다.

 디스크로는 대체할 수 없는 테이프의 가장 뛰어난 강점은 휴대성이다. 휴대성이야말로 현재 테이프 백업을 이처럼 광범위하게 보급한 가장 큰 특징이라 해도 과언이 아닐 것이다. 하지만 매체를 이동하거나 휴대할 경우 주의해야 하는 문제중의 하나가 데이터의 보안이다. 테이프 미디어를 탈취당하거나 분실하는 경우 테이프에 기록된 데이터가 외부에 유출될 수 있기 때문에 이에 대한 대비로 암호화(Encryption) 기술을 개발, 정상적인 절차를 거치지 않으면 불법적으로 확보한 미디어에 기록된 데이터를 판독할 수 없게 하고 있다.

 ◇디스크의 장점을 백업에 활용한 VTL=이제 기업들은 단순한 백업뿐만 아니라 데이터의 복구에도 큰 관심을 쏟고 있다. 그런 면에서 테이프 백업 방식은 휴대와 유지 비용 면에서 유리하지만, 복구 속도가 느리다는 단점이 있다.

 이에 따라 ATA/SATA(Serial Advanced Technology Attachment) 디스크가 백업 매체로 주목을 받기 시작했다. ATA/SATA 디스크는 일반 디스크보다 안정성과 신뢰도는 다소 떨어지지만 가격이 저렴하고 복구 속도를 향상할 수 있다는 장점이 있어서 2차 디스크 스토리지로 각광을 받고 있다.  디스크를 백업에 활용함으로써 신뢰도나 전송 속도, 데이터의 무작위 액세스 등 백업 환경의 성능이 획기적으로 향상되었다. 하지만 디스크 장비만으로는 기존의 테이프 장치가 제공하던 백업의 요구 조건을 완벽하게 만족시킬 수 없었다. 여전히 테이프는 컴퓨터 바이러스로부터의 안전과 재해 복구를 대비한 효율적인 원격지 소산, 장기 보관 등 백업의 핵심 기능을 훨씬 낮은 비용으로 구현할 수 있도록 해주기 때문이다. 이러한 테이프 장비의 장점은 디스크 백업이 쉽게 넘어설 수 없는 것이었다.

 ◇VTL의 장점을 극대화한 ‘데이터 디듀플리케이션’=VTL 기술이 등장함에 따라 백업에 디스크의 장점을 충분히 활용하게 됐지만, 여전히 SATA 디스크의 가격이 백업 전반을 지원할 만큼 충분히 저렴하지 않다는 문제는 남아있었다.

 테이프에 비해 값비싼 디스크에 보관할 수 있는 데이터는 기껏해야 2주를 넘기 힘든 게 현실이다. 이 시간이 지나면 데이터를 백업 장치로 이동하거나 백업 데이터를 아예 삭제해야 했다. 백업 작업에서 디스크의 가치를 제대로 활용하지 못한 것이다.

 이를 보완하는 기술로 최근 주목을 받고 있는 것이 데이터 디듀플리케이션(data de-duplication)이다. 데이터 디듀플리케이션은 중복된 데이터를 반복해서 저장하지 않고 오직 ‘고유한’ 데이터만을 저장으로써 기존의 디스크 용량을 10∼50배 이상으로 활용할 수 있도록 해준다.

 세계적인 IT 연구기관인 ESG(Enterprise Strategy Group)는 데이터 디듀플리케이션을 ‘오직 고유한 데이터만 디스크에 저장될 수 있도록 중복되는 파일, 바이트, 데이터 블록 등을 제거 혹은 이동시키는 과정’이라고 정의하고 있다. 디듀플리케이션 접근 방식의 단위가 높을수록 더 효율적으로 중복 데이터를 걸러낼 수 있다. 즉, 파일 단위보다는 바이트 단위로, 바이트 단위보다는 블록 단위로 디듀플레이션을 실행하는 것이 더욱 효과적이다.

 ◇백업의 종류별 특징=데이터 디듀플리케이션 기술은 전체 백업, 증분 백업, 차등 백업 등 기존의 백업 방식에 매우 긍정적인 이점들을 제공할 수 있다. 각 백업의 특징과 디듀플리케이션 백업의 차이점을 살펴보자.

 먼저, 전체 백업(full backup)은 ‘변경(changed)’ 데이터나 ‘고유(unique)’ 데이터를 전혀 구분하지 않고 백업할 때마다 모든 데이터의 복사본을 만드는 백업 방식이다. 전체 백업은, 복구 시에 일부 다른 백업 방식보다 간편하고 시간이 증분 백업에 비해 상대적으로 덜 걸린다는 장점이 있다.

 증분 백업(Incremental backup)은 전체 백업과는 달리 최종 전체 백업 혹은 최종 증분 백업 이후에 변경된 파일만을 복사한다. 전체 백업과 비교할 때 증분 백업은 매일 백업해야 하는 파일의 양이 적어 빠른 백업 윈도가 가능하다는 점이 장점이다. 그러나 복구 과정에서는 최종 백업된 전체 및 모든 후속 증분 이미지나 복사본까지 복구해야 하기 때문에 복구 작업이 번거로워지고 경우에 따라서는 시간이 훨씬 더 걸릴 수 있다.

 차등 백업(Differential backup)은 마지막 ‘전체 백업’ 이후 변경된 ‘모든’ 데이터를 백업하는 방식이다. 이는 바로 이전의 전체 백업 혹은 증분 백업 이후 ‘변경된’ 데이터만 복사하는 증분 백업과는 다르다. 일단 파일이 변경되면 예정된 다음 전체 백업 시까지 매일 백업한다. 따라서 파일이 변경될 때마다 파일 크기가 증가하게 되며, 다음 전체 백업 때까지 파일 크기가 점점 커지게 된다. 하지만, 전체 백업 이미지와 가장 최근의 차등 이미지만 복구하면 되기 때문에 복구 시점에 따라 다르긴 하지만 대개 증분 백업보다 복구 속도가 빠르다.

 이처럼 전체 백업, 증분 백업, 차등 백업은 데이터의 ‘고유성(uniqueness)’을 고려하지 않는 방식이다. 따라서 이러한 전통적인 백업 방식에 디듀플리케이션 백업(De-duplicated backups) 기술을 적용함으로써 백업 대상 데이터 중 중복되는 데이터의 양을 대폭 줄일 수 있다. 실제 디듀플리케이션 비율은 데이터의 유형, 변경 빈도, 백업 주기 등 여러 변수에 따라 다르지만 일반적으로 10∼20배 정도라고 알려져 있다.

 ◇디스크의 용량을 최적화하는 ‘데이터 디듀플리케이션’=데이터 디듀플리케이션은 ESG가 정의한 용량최적화 (Capacity Optimized Protection) 기술 중의 하나다. 데이터 보호에 관련된 용량 요구를 줄이는 데 목적이 있는 기술이다.

 즉, 데이터 디듀플리케이션의 가장 큰 장점은 데이터가 디스크에 기록되는 시점에서 저장에 필요한 용량을 크게 줄임으로써 ‘용량 팽창’ 문제를 해결할 수 있다는 점이다. 데이터 디듀플리케이션 방식은 블록 단위에서 중복되는 데이터를 다시 저장하지 않기 때문에 디스크 용량을 덜 차지한다. 또한 이는 디스크 장비에 필요한 전력 및 냉각 비용을 절감토록 함으로써 비용 절감의 효과까지 가져온다.

 둘째 중복 데이터를 저장하지 않기 때문에 백업에 필요한 물리적인 디스크의 양을 줄일 수 있다. 이로써 2주에 불과했던 디스크 보관주기를 3개월 혹은 6개월로 늘릴 수 있고 그만큼 복구 속도와 효율이 높아짐은 두말할 필요가 없다.

 셋째, 더 많은 데이터를 디스크에 보관함으로써 목표 복구 시간(Recovery Time Objective, RTO)를 향상할 수 있다. 복구를 위해서 테이프에 덜 의존하게 됨으로써 신뢰도 또한 더욱 높아진다. 백업뿐 아니라 복구 시에도 더 많은 복구 포인트, 더 빠른 복구 시간과 더 향상된 복구 성능을 제공하는 것이 데이터 디듀플리케이션의 장점이다.

 마지막으로, 복제에 필요한 대역폭의 양이 크게 줄어들어 WAN 기반의 원격 복제를 가능하게 해준다. WAN을 통해서 이동하는 데이터가 감소하기 때문에 손쉽고, 빠르고, 안전하고, 저렴하게 재난복구용 데이터 사본을 저장할 수 있다.

 ◇인텔리전스 백업의 미래=데이터 디듀플리케이션 기술은 백업 시장에 큰 변화를 가져올 것으로 보인다.

 텐자그룹의 발표에 따르면, 데이터 디듀플리케이션 시장은 매년 330%의 연평균성장률(CAGR)을 기록, 2010년이면 10억달러 시장을 형성할 것으로 전망됐다. VTL 도입을 고려하는 기업이라면 용량과 비용 면에서 우수한 데이터 디듀플리케이션의 도입을 고려할 만하기 때문이다. ESG도 데이터 디듀플리케이션이 가장 중요한 데이터 보호 기술 중 하나가 될 것이라고 예상했다.

 백업 시장에서 데이터 디듀플리케이션 기술은 현재 디스크 장비에 우선 적용되고 있지만, 향후 다른 스토리지 애플리케이션으로 확장, 적용될 것으로 보인다. 이와 더불어 시스템 자원의 부하나 처리 속도 등 디듀플리케이션 기술의 개선 속도도 한층 빨라질 것이다.

 데이터 디듀플리케이션의 경우 정규적인 백업을 하는 대부분의 기업에서 고려해 볼 수 있는 인텔리전트 백업 솔루션이다. 저예산으로 백업 솔루션을 구축하려는 기업은 테이프 제품을, 중간 정도의 예산을 갖고 있는 기업은 디스크 백업이나 VTL 제품, 혹은 데이터 디듀플리케이션 제품을 고려해 볼 수 있다. 특히 데이터 디듀플리케이션 제품의 경우, 기존에 디스크와 테이프를 기반으로 데이터 관리 솔루션을 구축해 둔 기업이 새로운 기술로 업그레이드 하거나 기술 통합을 고려할 때 가장 유용한 솔루션이다.

 이제 사용자들은 신뢰성 높은 백업과 빠른 복구, 손쉬운 원격 재해복구 시스템 구축과 비용 절감 등 한 단계 업그레이드된 백업 환경을 경험할 수 있게 된 것이다.

by 100명 2007. 7. 4. 12:49