시스템 업그레이드와 시스템 장애
상태바
시스템 업그레이드와 시스템 장애
  • INTERNETWEEK
  • 승인 2001.08.28 00:00
  • 댓글 0
이 기사를 공유합니다

지난 6월 새로운 소프트웨어를 설치하면서 사이트가 다운되는 바람에 낭패를 본 오비츠(Orbitz)와 나스닥, 뉴욕증권거래소(NYSE)가 향후 시스템 업그레이드를 위해 그들이 마련한 일련의 조치들을 발표했다.

이들은 모두 보다 엄격한 테스팅 및 구현 프로시저를 약속했다. 오비츠는 사이트를 재설계해 업데이트를 할 때 전체 사이트의 운영을 중단시키는 일이 다시는 없도록 하겠다고 밝혔다. 절단된 통신 케이블로 인한 피해도 입은 이 회사는 또 새로운 이중성 확보 조치들을 취하겠다고 약속했다.

나스닥은 올해 말 트레이딩 시스템에 몇 가지 기능들을 추가 적용할 때, 장이 열리기 직전에 코드 문제들을 가려내 정정하도록 고안된 새로운 테스팅 프로시저들을 구현하겠다고 밝혔다. NYSE는 이번 사태가 발생하게 된 문제의 원인을 쉽게 찾지 못해 애를 썼지만 중단 없는 서비스를 다시 제공하겠다고 약속했다.

시스템 장애 내용
업그레이드를 하면서 이들 3사가 겪은 장애는 다음과 같은 것이었다.

*수개월 간의 시험 운영을 마치고 6월 초 본격 운영에 들어간 지 며칠 만에 오비츠의 전체 사이트는 소프트웨어 업그레이드를 위해 사흘 밤 최고 3시간 동안 다운되었다. 5개 주요 항공사에 의해 운영되고 있는 오비츠는 또 절단된 광섬유 케이블에 의해서도 피해를 입었으나 처음 온라인을 이용하는 구매자들에게 제대로 상황을 설명해줄 수 있을 만큼 충분한 콜 센터 상담원들을 고용하지 않았다.

*6월 초에 발생한 나스닥의 SOES(소규모주문실행시스템) 장애는 탠덤의 「히말라야」 메인프레임 클러스터에 5번째 CPU 및 관련 소프트웨어를 설치한 뒤에 일어났다. 트레이딩이 중단되지는 않았지만 SOES는 이전의 4-서버 파티션으로 복구하기 위해서 30분 동안 운영이 중단되었고 브로커들은 전화로 주문을 받아야 했다.

*NYSE는 PSS(후지원시스템)에 일상적인 소프트웨어 업그레이드를 하면서 객장과 2곳의 원격 데이터 센터들간에 커뮤니케이션이 중단되었고, 그로 인해 소매 트랜잭션이 중단되었다. 거래는 약 90분 동안 중단되었고, 그날 밤이 되서야 전체 거래소가 정상 운영되었다.

『소프트웨어 개발은 여전히 노동 집약적인 프로세스이기 때문에 모든 오류를 피한다는 것은 불가능하다』고 컨설팅 업체인 타워그룹(Tower Group)의 분석가 래리 탭(Larry Tabb)은 말하고 있다.

증권사들과 증권 거래소들은 고도로 자동화되어 있기 때문에 사소한 오류가 트레이딩 시스템을 다운시킬 수 있다. 코드 라인에서 콤마나 마침표를 빠뜨리거나 아주 사소한 문제가 있어도 전체 조직에 영향을 미칠 수 있다는 것이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.