Global Case Study - 엘카미노병원 재해복구 사이트 구축
상태바
Global Case Study - 엘카미노병원 재해복구 사이트 구축
  • 승인 2006.01.31 00:00
  • 댓글 0
이 기사를 공유합니다

여느 때와는 상이한 신호가 캘리포니아주 마운틴뷰(Mountain View)에 위치한 엘카미노병원의 기술 서비스 이사인 버드 제임스(Bud James)의 사무실에 울리고 있다. 붉은 슬래시와 서클로 ‘POF’ 편지를 전하는 간단한 표시였다.
이러한 메시지 전달은 실패할 이유가 없다. 병원은 3억달러 규모의 건물을 새롭게 지었을 뿐 아니라 분리된 재해복구(DR) 사이트를 구축했기 때문이다.
비영리 목적의 이 병원 규모는 크지 않을지 모르지만(400침상), 첨단 기술(leading-edge) 시설의 하나다. 엘카미노병원은 내과 의사들의 진단 명령을 자동화한 세계 최초의 병원으로 SSL VPN을 이용해 내과의사들이 집에서 기록에 사인하고 테스트 결과를 연구할 수 있는 전자 차트와 방사선을 위한 디지털 이미지, 환자의 증세를 전송하기 위해 블루투스 무선 기술과 태블릿 PC를 이용하고 있다.

99.999% IT 가동 시간 도달이 목표
엘카미노병원의 주된 목표는 99.999%의 IT 가동 시간에 도달하는 것이다. 제임스 이사는 “무언가가 작동되지 않는다는 전화를 받으면 가능한 빨리 모든 것이 회복되고 있다고 확신을 줘야 한다”고 말한다.
지진은 주된 경계 대상이다. 엘카미노병원은 맥아더 단층선(McArthur fault line)에 근접해 있을 뿐 아니라 거대한 샌안드레아(San Andreas) 단층으로부터 불과 3마일 정도 떨어져 있다. 신규 병원 건물은 오는 2008년 완공될 슬레이트 건물로, 500만달러를 추가로 투자해 데이터센터를 포함하고 있다. 이 병원은 캘리포니아주의 활발한 지진 예비선과 만나고 있는데, 지진에 견딜 수 있을 헬스케어 장비를 필요로 한다.
엘카미노병원의 비즈니스 연속성 전략의 핵심 요소는 새로운 DR 사이트로, OC-3급으로 병원과 연결돼 있다. EMC 클라리온 CX 700 SAN 시스템과 EMC 센테라 아카이브 서버, 시스코의 MDS 9509 디렉터 스위치, IBM x시리즈 346 서버, 유니시스 ES7000 405와 510 서버로 구성돼 있다. 병원은 현재 2개의 데이터센터 사이의 페일오버(failover) 과정을 통해 테스트를 전개하고 있다.
제임스는 “우리는 이것이 잘 변화되기를 원한다”고 말한다. 그러나 완전 미러링된 DR 사이트는 비영리 병원임을 감안할 때 비용 효율적이지 않다. 이에 대해 제임스는 1천500만달러의 데이터센터를 미러링으로 복제할 수 없다고 말했다. 대신 백업 자원은 엘카미노병원의 미션 크리티컬한 애플리케이션을 미러링 한다. 즉, 피플소프트, 마이크로소프트 익스체인지, 보케라 보이스 커뮤니케이션 배지와 SQL 데이터베이스를 의미한다.
우선순위의 비즈니스 연속성 계획은 몇 가지 페일오버가 자동적이라는 것을 의미한다. 이에 반해 다른 것들은 수동적이다. 예를 들어 베리타스의 클러스터 서버 페일은 자동적으로 클러스터 서버의 또 다른 부분으로 이동한다. 그러나 이러한 과정은 마이크로소프트 서버가 실패한다면 수동으로 전개해야 한다.
제임스는 “익스체인지 서버는 어떤 서버가 여기에서 멈출 지라도 항상 준비되고 대기 상태에 있다”며 “서버가 백업되고 구동되는 데 1시간 이상 걸리지 않을 것”이라고 설명한다.
베리타스의 클러스터 서버 구축은 엘카미노병원이 신규 서버의 도입 필요성 없이 새로운 애플리케이션을 구매함으로써 5년 이상 250만달러의 ROI를 산출할 수 있는 서버 통합 및 집중화 노력의 일부다. 병원의 복잡한 네트워크가 측면 지진에 의해 끊긴다면, 시스코 글로벌 사이트 셀렉터 4491 로드밸런서는 자동적으로 데이터센터의 서버 A에서 어바인 사이트의 서버 B로 애플리케이션을 다시 지정할 것이다. 제임스는 “우리는 이를 매직 네트워킹 레이어라고 부른다”고 말했다.

리히터를 벗어나…
새로운 병원 설비는 또 다른 진기한 비즈니스 연속성 기술의 특징을 갖는다. 지진방어 시스템이 바로 그 것으로 엘카미노병원 백본망 위에 보안 가상랜(VLAN) 상에서 구동된다.
안전한 인터넷 접속을 통해 국토 주위를 수백 개의 센서로 묶고 있는 지진 경고 시스템의 퀘이크가드(QuakeGuard) 센서는 지진이 발생하기 전에 지진 활동을 감시하고, 퀘이크가드 고객의 네트워크 여기저기로 경보를 보낸다. 이 센서는 진원지의 위치에 기반해 지진 발생 1분 전에 병원에 경보장치를 울리게 할 것이다.
세 가지 발전기와 더불어 UPS 시스템을 지진으로부터 보호할 장치가 충분히 갖춰져 있기 때문에, 이 병원은 서버를 자동으로 셧다운 실행시켜줄 지진 경보를 갖출 필요는 없다. 다른 네트워크와 새로운 병원 건물에 대한 서버 장비에 대해 엘카미노병원은 가능한 기존 장비의 사용을 고수하고 있다. 예를 들어 새로운 서버와 스위치를 추가로 구매했지만 현재의 시설을 유지하는 것이 기본적인 목표다. 제임스는 “도로를 운전하는 동안 차 내부의 엔진을 바꾸는 것과 유사하다”고 비유했다.

The Hard Shell

“재난에 미리 대비하라”

비즈니스 연속성은 병원 입장에서는 존폐의 문제와 연결될 수 있다. 캘리포니아 어바인의 새로운 재난복구 사이트의 필요성을 설파하며 장비를 판매하는 것은 어려운 부분은 아니었다. 오히려 도전은 제한된 예산으로 설비를 구성하는 데 있었다.
캘리포니아 마운틴뷰의 기술 서비스 이사 버드 제임스는 “우리의 상위 관리팀은 비즈니스 연속성의 중요성과 실제 이를 구현하기 위해 무엇을 해야 하는지 이해하는, 기술적으로 잘 알고 있는 인력들로 구성돼 있다”며 “그러나 예산안에서 운용돼야 하며, 데이터센터에서 모든 서버를 완전히 복제할 수 있는 능력을 갖추는 것은 아니다”고 설명했다.
엘카미노병원의 IT 그룹은 100만달러의 백업 시설 구축비용을 짜내야만 했는데, 이미 2천만달러의 연간 예산이 할당돼 있었다. 병원의 모든 애플리케이션을 미러링 하기 위한 충분한 예산은 없다. 이에 따라 우선순위를 조정해야 했다.
제임스와 그의 팀은 시만텍(구 베리타스)의 도움으로 각각의 애플리케이션을 다룰 수 있는 데이터를 위한 RTO & RPO(Recovery-Time and Recovery-Point Objective)를 포함하는 비즈니스 연속성을 구현했다. 제임스는 “우리는 대다수의 미션 크리티컬한 애플리케이션을 위해 최신의 페일오버를 확보할 것이며 나머지 애플리케이션을 위한 백업 및 복구 소프트웨어인 애크로니스(Acronis)를 통해 원거리 프로비저닝과 정보처리 기능을 구현할 것”이라고 말했다.
애플리케이션은 미러링을 위해 병원의 SQL 데이터베이스와 보케라 MS 익스체인지, 피플소프트를 선택했다. 엘카미노병원이 이클립스에 IS 부문을 아웃소싱 했음에도 불구하고 병원의 부서는 여전히 웹서비스 또는 무선랜을 적용하는 것과 같은 작은 프로젝트에 대해 제임스의 IS그룹에 직접 문의를 한다.
프로젝트는 이사회에서 승인된 10만달러 이상의 비용이 요구된다. 이 병원은 비영리를 목적으로 하고 있어, 연방 및 주 펀드는 물론 지역 소유 세금으로부터 조성된 기금의 적은 몫을 얻어야 한다. 제임스는 “비용의 대부분은 서비스 요금에 기반 한 매출로부터 이뤄진다”고 말한다.
엘카미노병원은 대규모 자금을 모으고 있는 재단을 확보하고 있다. 무선랜 보안과 랜 장비는 새로운 메디컬 병동에 구축될 예정이며, 현재 건설이 진행중에 있다. 프로젝트는 보안 장비를 위해 1억5천만달러를 편성했다. 무선과 유선 랜 데이터는 새로운 건물에 분리된 채로 남게 될 것이다. 제임스는 “해커가 공격하게 될 것으로 끊임없이 주의해야 한다”고 덧붙였다.

애플리케이션 마이그레이션

새로운 병원의 신축과 재난복구 사이트의 구축이 충분하지 않았다면, 엘카미노병원은 구 메인프레임 병상 애플리케이션 시스템의 윈도 대체를 유지해야 한다. 새로운 시스템으로 마이그레이션 하는 일은 쉽지 않았다. 150개의 다른 애플리케이션들과 통합해야 하기 때문이다.
환자의 병상 기록을 담고 있는 새로운 이클립스 SCM(Sunrise Clinical Manager)은 마이크로소프트의 닷넷 플랫폼을 기반으로 하는데, 모든 애플리케이션에 적용된 것은 아니다. 이 병원의 기술 서비스 이사인 버드 제임스는 “그것은 오랫동안, 열심히 전개해 왔다”며 “다른 부서의 모든 애플리케이션은 미션 크리티컬 하다”고 말했다.
비 닷넷 애플리케이션과 SCM을 통합하기 위해 인터페이스 엔진은 셋업 돼야 했다. 예를 들어 엘카미노병원의 어카운팅 애플리케이션은 환자를 등록, 검증하고 보험을 청구할 수 있는 SCM의 병상 정보가 필요하다. 이에 따라 제임스 팀은 두 가지 시스템 사이의 실시간 커뮤니케이션을 위해 이클립스의 e링크 인터페이스 엔진으로 바꿨다. e링크는 비 닷넷 애플리케이션 사이에 위치해 있다. 제임스는 “커다란 도전 중 하나는 e링크 엔진이 정확히 클러스터 됐다는 것을 책임지는 것으로 이는 애플리케이션 지원을 위해 유용성이 있어야 했기 때문”이라고 설명했다.
병원의 SQL 서버는 64비트에 기반해 구동되는데, 애플리케이션은 이와 달랐다. 엘카미노병원은 빠른 처리 속도의 이점을 얻을 수 없었다. 제임스는 “애플리케이션 스스로 64비트 시스템 기반 위에 구동된다면 보다 빠르게 작동될 것”이라며 “대용량 메모리 지정공간의 이점을 취할 수 있을 것”이라고 말했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.