네트워크 및 시스템 관리
상태바
네트워크 및 시스템 관리
  • 승인 2005.02.25 00:00
  • 댓글 0
이 기사를 공유합니다

Survivor's Guide To 2005
네트워크 및 시스템 관리

올해 지출 규모 “늘어난다”

규모에 맞게 선택해야 … ‘모니터링·구성관리·성능’ 순으로 해결

네트워크 및 시스템 관리(NSM) 툴은 실질적인 비즈니스 문제를 해결하고, 네트워크의 효율성을 향상시킬 수 있다. 2005년 NSM의 동향을 미리 짚어보고, 여기에 따라 네트워크와 시스템 관리 전략을 어떻게 가져가야 할지를 조망해본다.
bboardman@nwc.com>

네트워크와 시스템 관리는 상황에 따라 조직에 따라 그 의미가 달라진다. 어떤 IT 부서에서는 상호 연관된 서비스 사슬을 보는 데 NSM을 사용해 시스템을 모니터링하고 문제를 분류하며, 사슬 안의 링크를 추적 및 수정하기 위한 보다 정밀한 측정의 용도로 NSM을 사용하는 곳도 있다.
고객과 클라이언트가 함께 하는 비즈니스 쪽을 보면, NSM은 IT의 책임성을 추적하는 방편이 된다. 그리고 올해 조직의 IT 서비스 소비와 프로비져닝을 정당화하는 데는 단순한 서비스 제공 보고서 이상의 것을 내놓을 수 있어야 한다. IT 서비스에 들어가는 작은 돈까지 설명할 수 있는 정밀한 사업분석 통계를 제공하기 위한 계획을 세우라. 아프리즈마(Aprisma), BMC 소프트웨어, 컴퓨터 어쏘시에이츠, HP, IBM 티볼리, 마이크로뮤즈(Micromuse) 및 스마츠(SMARTS) 등과 같은 NSM 업체들은 이 점을 잘 알고 여기에 맞춰 툴세트를 마련하기 위해 고심하고 있다.
관리 툴은 네트워크, 시스템 및 애플리케이션을 모니터링하고 계획할 수 있게 도와줄 뿐만 아니라 발생한 문제를 고쳐준다. 하지만 NSM 아키텍처는 IT 인벤토리, 인프라, 트랜잭션 및 서비스 전달을 단순히 링크시켜주는 것만이 아니다. 보다 크고 값이 비싼 관리 툴들은 대형 조직들이 직면하고 있는 문제를 풀어주려 하며, 반면에 보다 저렴하고 집중적인 NSM 제품들은 소형 조직과 IT 부서 조직의 필요를 충족시켜준다.
메타그룹에 따르면, 기업 IT에서는 주문형 컴퓨팅과 어댑티브 엔터프라이즈(Adaptive Enterprise) 등과 같은 창안들에 힘입어 전년에 비해 올해 NSM에 더 많은 지출을 하게 될 것이라고 한다.
한편 본지 독자들은 HIPAA (Health Insurance Portability and Accountability Act), 사베인스 옥슬리 및 식스시그마 등과 같은 규정을 따라야 함으로 인해 감사, 감사 준비, 및 준수 소프트웨어에 더 많은 지출을 하지 않을 수 없다고 말했다. 이것은 곧 나올 IT 베스트 프랙티스 사양인 ITIL(IT Infrastructure Library)에게 큰 힘을 실어주는데, 그 이유는 이것이 다른 여러 가지 중에서도 특히 규정 준수에 따른 어려움들을 다루고 있기 때문이다. 그 어떤 것도 완전히 새로운 것은 없지만, NSM 업체들로서는 입맛이 다셔지는 얘기다.
그렇다면 그 모든 NSM의 의무들을 가려내고, 여기에 맞는 적절한 툴을 찾아내고, 전체적인 NSM 전략을 짜기 위해 어떻게 해야 할 것인가? NSM 전략을 통해 해결할 수 있는 게 어떤 것인지부터 먼저 파악해보자.

규모의 문제
우선 해결하고 있는 문제의 규모를 파악하라. 이는 곧 반드시 IT 조직 전체가 아니라 IT 그룹의 규모를 살펴야 한다는 것을 의미한다.
IT 조직의 규모가 크다면, 조직과 함께 확장될 수 있는 포괄적인 NSM 전략과 제품을 고려해 보라. 한 IT 그룹에서 다른 그룹을 돕기 위해 수집한 인벤토리, 성능 및 서비스 정보를 이용함으로써 중복도 또한 피할 수 있다. IT 그룹과 직접적으로, 혹은 써드파티를 통해 연결되는 NSM 업체를 선택하라.
아프리즈마, BMC, 컴퓨터 어쏘시에이츠, HP, IBM 티볼리, 마이크로뮤즈 및 스마츠 등과 같은 NSM 프레임워크 및 오류수정 업체들은 큰 비전인 IT 관리 전략 규정을 시도하고 있다. 이들의 NSM 패키지는 모든 IT 서비스에 대한 하나의 IT 자산 저장소를 만들어낸다. 이런 제품들은 중복되고 비동기화된 인벤토리를 제거할 뿐만 아니라(네트워크 인프라에부터 서비스 토폴로지에 이르는 모든 것), 관리 작업의 시너지 효과를 추구하고 있다. 예를 들어 이들은 모든 토폴로지를 자동으로 매핑할 것이며, 치료 분류 및 진단 제안도 해줄 것이다.
이러한 툴들은 조직에서 관리 데이터와 액세스를 표준화해준다. ITIL를 비롯한 베스트 프랙티스들의 배치는 아직 요원한 얘기지만, NSM 스위트는 공통의 사용자 인터페이스와 단일 액세스 제어, 그리고 통합된 툴들을 IT에서 공유함으로써 효율성을 향상시켜준다.
그러나 한 업체에서 모든 조직의 모든 관리 툴을 제공할 수는 없다. 따라서 비즈니스 파트너와 내부 개발자들 사이에서 제품의 유용성을 확산시킬 수 있도록 API와 문서화된 명령어 라인이 있어야 한다. 약속된 것과 같은 관리 만병통치약의 폭넓은 수용은 이러한 방안의 복잡성과 비용으로 인해 이뤄지지 못했다. 대형 업체들은 큰 조직들이 IT 시스템을 추적 및 관리할 수 있는 패키지만을 제공하고 있다.
HP 오픈뷰는 여기서 최고의 제품들 가운데 하나로 건재하고 있으며, HP는 계속해서 자사의 플랫폼을 가다듬고 확장해 가고 있다. CDP(Cisco Discovery Protocol)와 시스코의 브리지 MIB를 이용해 레이어 2 토폴로지 탐색을 이행하는 NNM(Network Node Manager)는 올해 새로운 IEEE 802.1ab 레이어 2 탐색 프로토콜의 혜택을 누리게 될 것이다. 802.1ab가 CDP나 EDP(Enterasys Discovery Protocol)와 같은 전용 프로토콜을 대체하게 될지 여부는 시간이 지나야 알 수 있겠지만, HP와 시스코가 새 사양의 배후에 있기 때문에 그 가능성은 충분하다(시스코는 또한 스위치와 시스코웍스 관리 소프트웨어를 위해 802.ab 작업에도 참여하고 있다).
오픈뷰의 애플리케이션 모니터링은 혁신적이며, 오픈뷰의 트랜잭션 어낼러시스(Transaction Analysis)는 n티어 애플리케이션 아키텍처 토폴로지를 자동화해준다. 이것은 애플리케이션 서비스 사슬에서 제대로 수행되지 않는 컴포넌트를 가려내는 데 가장 좋은 툴이다. 많은 성능 모니터링 패키지들이 이 문제를 집어내지만, HP의 경우 보다 정밀하고 유연하며 자동화가 돼있다.
HP와 같은 NSM 업체들에게서 발견할 수 있는 또 한 가지 멋진 점은 SOA(Service-Oriented Architecture)를 따가잡고 있다는 것이다. IT를 비즈니스에 맞추고 있는 조직들은 서비스 보고 이상의 것들을 필요로 한다. 즉 이들은 비즈니스에 미치는 영향과 비즈니스 요구에 대한 IT의 대응 등과 같은 세부정보들을 요구한다. 웹서비스는 조직들이 변화를 좇아가기 더욱 힘들게 만들기 때문에, 관리 업체들은 SOA 전략에 발맞춰야 한다는 압박감을 느낀다. ITIL, 변화 및 가용성 관리가 여기에 속하기를, 그리고 NSM 업체들이 이것을 시장에 내놓기를 기대해 본다.
HP를 비롯해, 콘코드 커뮤니케이션즈(Concord Communi-cations)나 매니지드 오브젝츠(Managed Objects)와 같은 대형 업체들은 BSM(Business Service Management)을 SOA에 대한 해답으로 거론하고 있다. 현재까지 BSM용으로 사용 가능한 주요 작품들로는 HP의 n티어 토폴로지 자동탐색과 BMC의 변화 및 구성관리 통합 제품 등이 있다.
만약 규모가 작은 IT 조직이라면, 규모나 전략 문제로 시간을 소모할 필요없이, 특정한 문제에 맞는 것에 집중하는 게 좋다. 포커스가 있는 NMS 툴들은 보통 저렴하며 무료로 나오는 것들도 있다.
규모가 큰 NSM 소프트웨어는 셋업하는 데 분명히 몇 시간이 걸리겠지만, 간단한 NMS 제품들도 역시 주의와 보살핌이 필요하다. 무엇이 경보를 필요로 하는지를 결정하고, 이러한 경보들을 관리하는 데는 시간이 소모된다. 서비스 수준 협정을 만드는 데도 또한 시간이 필요하다. 물론 작은 툴을 이용하게 되면 대신 하나의 단일한 관리 방안과 이에 연관된 써드파티 툴들은 포기해야 한다는 사실도 명심하라.
적당한 가격의 간단한 NSM을 내놓고 있는 관리제품 업체들로는 아이피스위치(Ipswitch), 네온소프트웨어(Neon Software), 네스소프트(Nessoft) 및 솔라윈즈(SolarWinds) 등이 있다. 넷코디아(Netcordia)의 넷MRI(NetMRI)는 크고 작은 NSM 필요조건들에 모두 맞는 것으로, 색다른 방식을 채택하고 있다. 즉 이 작은 장비는 시스코 CCIE 기술로 작동해 오구성되고 수행이 제대로 되지 않는 네트워크 장비를 찾아내 준다.

우선순위
그렇다면 어떤 NSM 기술을 선택해야 할까? 우선 기업에서 돌아가는 네트워크 장비와 서버를 모니터링하라. 모든 프레임워크 제품에는 오류 및 모니터링 툴이 있다. 보다 저렴한 대안으로는 아이피스위치의 히트상품 와츠업 골드(WhatsUp Gold)가 있다. 이 툴은 거의 모든 곳에서 사용되며, 활발하고 지적인 사용자 커뮤니티 덕분에 계속 진화하고 있다. 또 한 가지 옵션으로 www.forge.net에서 무료로 다운받을 수 있는 크리켓(Cricket)이 있다. 하지만 다른 여느 무료 솔루션과 마찬가지로, 교육과 유지보수를 스스로 해결해야 하기 때문에 결코 완전히 공짜라고 할 수는 없다.
다음으로, 구성관리가 있는데 이것은 네트워크 장비와 시스템에 적용이 된다. 고성능 NSM 프레임워크에는 소프트웨어를 배치하고, 심지어 하드웨어를 프로비저닝하기 위한 포괄적인 시스템 구성 툴이 있다. 마이크로소프트와 레드햇도 또한 각자의 OS에 이런 툴이 있으며, 시만텍(Symantec)의 고스트(Ghost)와 같은 이미징 시스템도 좋은 대안이 된다. 알티리스(Altiris), 랜데스크(LANDesk) 및 톨리시스템즈(Tally Systems)와 같은 다른 많은 데스크톱 관리 업체들도 구성 관리 툴들을 제공하고 있다.
큰 프레임워크들이 해결하지 못하는 한 가지가 바로 네트워크 장비 구성인데, 이것은 아마도 초기 네트워크 정책 관리 작업들의 실패나, 혹은 시스코의 시스코웍스나 익스트림 네트웍스의 에피센터(Epicenter)와 같은 업체 전용 솔루션들과의 협력관계 때문일 것이다. 하지만 알터포인트(AlterPoint), 렌디션 네트웍스(Rendition Networks), 보이언스(Voyence) 및 신생업체인 오하이어 네트웍스(Ohia Networks) 등은 다른 업체(즉, 시스코가 아닌)의 하드웨어를 지원하는 NSM 플랫폼을 제공하고 있으며, 방화벽, 부하조절기 및 시스템을 구성한다.
보다 저가의 솔루션으로는 실행 중인 구성을 다운로드하도록 스크립팅된 간단한 TFTP가 있다.

성능에 대한 갈망
다음으로는 성능에 대해 미리 준비하는 자세를 갖춰야 한다. 하지만 사전 준비 이전에 먼저 사후 대응을 할 수 있어야 한다.
성능 모니터링에서는 얼마나 많은 바이트가 전송됐는지, 얼마나 많은 바이트가 수신됐는지, 혹은 얼마나 많은 바이트가 에러가 났는지를 추적한다. 또한 클라이언트, 네트워크, 서버, 스토리지, OS, 웹 서버, 애플리케이션 서버 및 데이터베이스 서버 레벨에서도 측정 가능한 많은 성능 데이터가 있다. 이러한 데이터는 정기적으로(5분, 10분, 15분마다 24/7로) 수집되고 저장이 된다. 그런 다음 데이터는 그래프, 보고서, 포털 및 대시보드로 구성돼 비정상적인 활동이 일어났을 때 이를 알려준다.
여전히 사후 대응적이라고 할 수 있지만, 시간이 지나면 자신의 IT 서비스에만 있는 성능 베이스라인을 알게 된다. 콘코드 커뮤니케이션즈의 e헬스(eHealth)와 같은 일부 제품들은 예를 들어 서버 CPU와 대역폭에서의 자원 압박 가능성을 미리 짚어줄 수 있다. 성능 관리는 폴링된 통계를 자신의 IT 운영에 통합시키면서 사전 대응적이 된다. 그 한 가지로, 간헐적인 폴링을 통해 오류가 발생될 때까지 기다리는 게 아니라 데이터를 수집할 수 있다. 둘째로, 매우 다양한 성능 데이터는 책임 집단으로 문제의 치료책을 보다 신속하고 정확하게 전달하기에 충분한 정보를 제공할 수 있다. 이것은 또한 시스템 운영자와 애플리케이션 개발자들에게 문제의 원인에 대한 보다 상세한 정보를 제공하기도 하는데, 그 이유는 이것이 상세 데이터를 수집하고 히스토리를 추적하기 때문이다.
성능 관리 문제를 다루는 업체들은 수백 곳이 넘는다. 컴퓨터 어쏘시에이츠(Computer Associates), 콘코드(Concord), 엠피릭스(Empirix), HP, 넷아이큐(NetIQ) 및 프로액티브네트(ProactiveNet)와 같은 튼튼한 업체들이 방화벽의 앞과 뒤로 이동하는 어떤 것에서든 데이터를 수집하는 제품을 내놓고 있지만, 여기에는 그만한 댓가를 지불해야 한다. 25만달러 정도를 지출할 능력이 없으면 이런 제품들은 욕심내기 힘들다. 그러나 그만한 예산이 있고, 서비스를 추적하고 문제의 원인을 신속하게 파악하기를 간절히 원한다면, 이 기술이 도움이 될 것이다.
캐슬락컴퓨팅(Castle Rock Computing), 아이피모니터(ipMonitor), 네온소프트웨어(Neon Software) 및 솔라윈즈(SolarWinds) 등에서 내놓는 보다 저렴한 대안들은 맡은 바 임무를 잘 해내긴 하지만 약간의 트레이드오프가 있는데, 그것은 이들이 데이터를 수집할 수 있는 장비 수와, 저장할 수 있는 데이터의 양이 한정적이라는 사실이다. 데이터를 수집, 저장 및 보고하는 데는 CPU와 대역폭이 필요하다는 사실을 명심하라. 보다 고가의 제품들은 이런 일들을 분산 컴퓨팅 아키텍처를 이용해 처리한다.
저가의 툴들은 또한 그다지 깊게 파내려가지를 못한다. 이들이 애플리케이션을 모니터링하는 방식은 값비싼 제품들처럼 애플리케이션을 관통하는 실제 트랜잭션을 돌려 결과를 확인하는 게 아니라 단순히 TCP나 UDP 포트가 반응을 하는지만 점검할 뿐이다.
또 한 가지, RMON 탐색자처럼 회선상에서 수동적으로 TCP 세션을 수집하는 새로운 성능 관리 방식도 있다. 넷QoS(NetQoS)와 넷스카우트(NetScout)에서 한 동안 이 방식을 이용해서 ARM(Appliation Response Measurement)과 다른 전용 기술들을 이용해 애플리케이션 성능을 알아내고 있다. 이 방식의 이점은 에이전트도 없고 폴링도 없어 이행이 수월하다는 것이다.
신규 참여업체인 코러디언트(Coradiant)도 이와 유사한 방식으로 데이터를 수집하고 있다. 이 회사의 트루사이트(TrueSight) 제품은 TCP 세션을 실시간으로 수집하고 이용한다. 따라서 네트워크 운영자는 전통적인 네트워크 관리 폴링 제품으로는 추적되지 않는 보다 작은 그룹의 사용자들로 문제를 확인하고 대응할 수가 있다.
마지막으로, 용량 플래닝을 이행해야 한다. 이것은 대략 부하 테스트와 시뮬레이션으로 나뉘며, 두 가지 모두 생산 전단계에서 성능을 예측해 준다. BMC, 고메즈(Gomez) 및 키노트시스템즈(Keynote Systems)와 같은 부하 테스트 서비스들은 방화벽 밖에서 작동하기 때문에, 새 웹사이트에 있는 잠재적인 문제를 식별할 수 있다. 퀘스트(Quest)의 벤치마크 팩토리(Benchmark Factory)와 엠피릭스의 e테스트 스위트는(eTest Suite) 방화벽 안에서 돌아가는 소프트웨어들로, 수천 명의 고객들이 네트워크, 서버 및 애플리케이션으로 마구 들어오는 흉내를 내준다.
이것은 진짜 트래픽이며, 랩에서긴 하지만 진짜 네트워크와 시스템 설정을 필요로 한다. 애널리티컬 엔진스(Analytical Engines), 오프넷(Opnet) 및 팀퀘스트(TeamQuest) 등의 시뮬레킹션 소프트웨어는 일정 노드, 링크, 트랜잭션, 대역폭, 메모리 등에서 어떤 일이 발생할 것인지를 산술적으로 계산해 준다. 이들은 강력한 제품들이긴 하지만, 주로 정부와 서비스 사업자, 그리고 대기업에서 채택되고 있다. 이들 중 하나를 고려하고 있다면, 각각의 제품을 전담하는 숙련된 IT 전문가가 필요하다는 사실을 명심하라. 그리고 이들은 수만에서 수십만 달러를 호가할 것이다. 시뮬레이션에 대한 대안으로 IT 자원을 넘치거나 부족하게 해 보다 현명한 IT 자원 관리를 통해 정단화가 이뤄도록 하는 방법도 있다.
신중하게 하지 않으면, 네트워크와 시스템 관리는 블랙홀이 되어 조직의 돈과 인력을 빨아들일 수 있다. 하지만 조직의 실질적인 NSM 필요를 제대로 파악하고 한 번에 한 가지씩 관리 문제를 해결해 간다면, IT 서비스를 보다 효율적이고 일관성 있게 할 수도 있을 것이다.

네트워크 및 시스템 관리에서 가장 중요한 것은?

데스크톱 지원을 책임진 사람들이 라우터나 스위치 구성보다 소프트웨어를 보다 전략적으로 생각하는 것은 당연한 일이다. 그렇다며 네트워크와 데스크톱 지원을 관리하는 사람에게는 어떤 것이 더 전략적일까? 비겁한 대답같아 보일지 몰라도 둘 다다.
전략적인 중요도에 따라 네트워크 및 시스템 관리 툴의 순위를 매겨보았다.

1. 네트워크 모니터링. 이 기본적인 화재경보기는 언제나 가장 우선돼야 한다.
2. 데스크톱 및 서버 관리. 좋은 이미지에 불과하다 하더라도 장만을 하라.
3. 네트워크 구성 관리. TFTP 서버와 스크립트는 자산을 구해줄 수 있다.
4. 성능 관리. 시간만 있으면 이런 툴에서 유용한 정보를 얻을 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.