Ⅰ. 개요
이번호에서는 발생할 가능성이 있는 대규모 설비사고에 대한 사례와 유지보수방안을 해외 사례로부터 살펴봄으로써 국내 통신 사업자들이 통신설비의 장애 방지에 적극적으로 대처하고 나아가 근절할 수 있는 길을 모색해본다.
정부는 올해 초고속접속회선의 품질 조사를 실시하였고, 사업자들도 서비스 품질 향상에 어느 때보다 관심을 경주하고 있는 실정이다. 그러나 지금 업계에 관심이 되고 있는 지연이나, 속도보다 훨씬 크게 사회적 해악이 될 수 있는 것이 물리적인 망의 단절 또는 장애로 인한 서비스 제공 중단이다.
일반적으로 대규모 네트워크 설비의 장애 방지 즉, 품질보증문제는 사고를 미연에 방지하는 것이 최상책이며, 발생한 장애는 가능한 신속히 대처하는 것이 기본이다. 그러나 네트워크, 특히 액세스계 설비는 대부분 이중화되어 있지 않아 장애 발생은 곧 ‘서비스 실패’로 직결된다. 일단 장애가 발생하면 고장 발생 장소의 확인, 복구방침의 결정, 서비스 복구까지의 조치, 복구용 자재 및 복구요원 준비 등 최종 복구까지 많은 시간과 준비과정을 필요로 한다.
따라서 액세스계의 설비고장은 장애를 빨리 복구시키는 것도 중요하지만 무엇보다도 장애를 일으키지 않도록 사전에 예방하는 것이 가장 중요하다.
사전에 사고를 예방하는 것은 결국 관련 분야에 종사하는 사람들의 경험과 개선노력으로 달성할 수 있다고 본다. 필자는 자료를 조사하면서 일본 NTT에서는 서비스 운영부가 이러한 네트워크 장애문제를 그간의 경험과 개선과정을 통해 상당히 치밀한 처리체계를 갖추고 있다는 것을 알게되었다. 그래서 지금까지 NTT의 각종 장애 방지 대책 및 복구조치 매뉴얼과 복구사례를 정리함으로써 설비계통의 사고방지에 일조하고자 한다. 이하에서는 일본에서의 장애 사례와 복구시스템 및 지원체제를 통해 그들의 액세스 및 네트워크 계통 품질향상을 위한 대처노력을 살펴볼 것이다.