모니터링 트렌드 ‘통합’…성능부터 비용 최적화까지 (3)
상태바
모니터링 트렌드 ‘통합’…성능부터 비용 최적화까지 (3)
  • 윤현기 기자
  • 승인 2022.02.15 08:30
  • 댓글 0
이 기사를 공유합니다

서비스 안정성·편의성 등 고려해야…국산 SW 제값주기도 필요

[데이터넷] 온프레미스 환경에서의 성능관리는 서비스 가용성과 밀접한 관련이 있었지만, 운영 시스템이 클라우드로 이전되고 스케일 업/다운이 손쉽게 구현되는 현 시점에서의 성능관리는 비용 관리 측면에서 다뤄지게 됐다. 향후에는 서비스 가용성은 기본으로 하되, 최적의 성능관리를 통해 안정적인 서비스를 얼마나 더 저렴한 가격에 운영할지에 초점이 맞춰질 것으로 업계는 기대하고 있다.

클루커스는 이 같은 요구 사항에 부합하고자 여러 엔터프라이즈 고객사들에게 자동화된 성능관리 모델을 적용시켜 왔으며, 다양한 경험을 무기로 영업을 진행하고 있다.

클루커스가 제공하는 IT 성능관리 오퍼링은 크게 클라우드 관리 플랫폼(CMP) 툴인 ‘클루옵스(ClooOPs)’와 매니지드 서비스로 구별된다.

클루커스 ‘클루옵스’ BI

클라우드 환경에서는 자산에 대한 기본 성능 로그가 무료로 제공되지만, 클루옵스에서는 API를 통해 성능 정보를 수신하고, 클루커스의 노하우로 이를 분석해 대시보드 형태로 제공하고 있다. 즉 성능 모니터링이 자동화돼 있는 것이다.

그리고 매니지드 서비스 운영 담당자는 이러한 모니터링 결과를 확인한 뒤 클라우드 포털에서 지난 한 달간의 가용성 데이터와 비교하고, 필요시 고객사에 성능 최적화를 제안하고 있다. 만약 고객사에서 자동화된 성능관리 시스템을 검토하고 있다면 자동 스케일 인/아웃이 가능한 시스템을 설계하고, 필요할 경우 코드 작업을 통해 스케일 업/다운을 구현한다.

국내에 코로나가 확산된 이후 클라우드를 활용한 가상 데스크톱 인프라(VDI) 시스템 도입 사례가 많아지고 있다. 클루커스 고객사 중 한 곳은 클루커스에서 애저 가상 데스크톱 시스템을 구축, 운영 중이다. 해당 고객사는 클루옵스에서 데스크톱에 대한 월간 성능을 분석해 적정 사이즈를 제안하고, 사용자별 데스크톱 사용량을 월간 단위로 모니터링해 비용을 추출하며, 특정 시간 동안 사용하지 않을 경우 자동으로 데스크톱을 종료하는 방식을 통해 성능과 비용 관리까지 수행하고 있다.

박항서 클루커스 MSP그룹 리드는 “클라우드 시스템에서 자동화된 성능관리를 구현하면 보다 적은 인원으로 보다 많은 시스템을 운영·관리할 수 있다. 즉 클라우드를 잘 이해하는 전문가 한 사람이 성능관리를 통해 비용 최적화도 이뤄낼 수 있는 환경이 만들어지는 것”이라며 “클루커스의 매니지드 서비스는 이와 같은 고객사의 요청을 효율적으로 처리하기 위해 자체적으로 평가 프로세스를 갖추고 자동화 팀을 운영하고 있다”고 말했다.

클라우드 비용 최적화 강조
모니터링이라 하면 대개 성능과 관련된 부분이지만, 클라우드 환경에서는 비용 관련 부분을 빼놓을 수는 없다. 전통적인 레거시 환경에서 인프라 비용은 고정적이었지만, 클라우드 환경에서는 자칫 잘못할 경우 레거시 환경과 유사한 규모의 서비스를 이용하더라도 비용은 그보다 더욱 크게 발생할 수 있기 때문이다.

실제로 클라우드를 이용하는 엔터프라이즈 기업에서 액세스 키가 유출돼 클라우드 자원이 한계치까지 사용된 적이 있었다. 6일간 평소 이용 금액의 15배가 넘는 비용이 청구됐을 때야 문제가 있다는 것을 깨닫게 됐는데, 이는 평소 성능 모니터링만 주시하고 자원 활용 등에 대한 모니터링인 소홀히 한 결과다.

따라서 베스핀글로벌은 클라우드 비용 최적화를 위해 자원 최적화가 이뤄져야 한다고 강조하며 ‘핀옵스’를 내세운다. 데브옵스가 개발과 운영을 긴밀히 통합함으로써 애플리케이션과 서비스를 안정적으로 빠르게 운영하고 개선할 수 있도록 하는 것이라면, 핀옵스는 재무와 운영을 긴밀히 통합함으로써 클라우드 비용을 효율적으로 최적화하고 관리·통제하는 것에 목적이 맞춰져 있다.

베스핀글로벌은 자체 개발 CMP인 ‘옵스나우’를 활용해 고객들에게 핀옵스를 제공하며, 이를 통해 고객들은 라이트 사이징과 사용하지 않는 자원 최적화 등을 달성할 수 있다.

라이트 사이징은 말 그대로 성능이 충분하다 못해 넘치는 과한 스펙의 클라우드 자원을 축소하는 것을 의미한다. 레거시 시스템은 확장/축소가 어려운 만큼 사용 연한을 고려해 최대 스펙의 장비를 들여야 했지만, 클라우드는 확장/축소가 유연하게 이뤄지기에 처음부터 과도한 수준의 시스템을 구성할 필요가 없다. 그러나 간혹 과도하게 자원을 생성하거나 사용이 끝나 필요하지 않은데도 유지되는 자원들이 있다면 이들을 줄이거나 없애 비용을 절감할 수 있다.

또 다른 기능인 사용하지 않는 자원 최적화는 클라우드가 눈에 보이지 않는 인프라라는 점 때문에 등장한 개념이다. 관리자가 콘솔에서 살펴봐도 사용되지 않는 자원들이 구동돼 있는 것까지 일일이 확인하는 것은 결코 쉽지 않기 때문이다. 이들을 체크해 사용을 중지시킨다면 역시 과도하게 청구되는 클라우드 비용을 절감할 수 있다.

한편 베스핀글로벌은 자체 솔루션 외에도 모니터링 솔루션 전문 업체들과 협력해 고객들의 클라우드 모니터링을 지원하고 있다.

“비용·가용성·확장성에 보안까지 고려해야”
이준태 베스핀글로벌 SRE팀장
이준태 베스핀글로벌 SRE팀장

IT 성능관리 관점에서 솔루션을 고려할 때는 비용과 가용성, 확장성 등을 고려해야 한다. 이는 클라우드 환경이 레거시 환경에 비해 비용이 과다하게 청구될 가능성이 매우 크기 때문이다.

과거에는 모니터링이 인프라, 애플리케이션, DB 등 각 부분별로 봐야 했지만, 이제는 이들을 모두 통합해 모니터링할 수 있게 되면서 복잡한 클라우드 환경에서 이상 징후를 포착하기가 한층 쉬워지고 있다. 가령 임계치를 설정했을 경우 시스템이 그에 도달했을 때 별도의 알람을 제공하기도 하며, 머신러닝(ML) 기반의 학습을 통해 이상 징후 탐지도 가능해졌을 정도다.

물론 이는 성능관리 측면에 한정된 경우이며, 비용 관리를 위해서는 핀옵스 기능까지 포함된 솔루션을 선택하는 것이 좋을 것이다.

이에 더해 가장 중요하다고 할 수 있는 것이 보안이다. 이는 엔터프라이즈 기업인지 중소기업인지를 따질 필요가 없다. 과거에는 IT 시스템 대부분이 인터넷데이터센터(IDC)라는 물리적인 공간에 격리돼 있어 보안을 유지하기 한층 쉬웠지만, 클라우드 환경에서는 액세스 키만 알면 누구나 어디에서든 기업 IT 시스템에 접근할 수 있기에 주의가 필요하다.

클라우드 풀스택 모니터링 제공
글로벌 통합 모니터링 플랫폼 데이터독도 국내 진출 이후 선전을 이어가고 있다. 데이터독은 각 영역에 대해 단편적인 가시성만을 제공하는 것이 아니라 엔드 투 엔드 영역에 걸쳐 연계 분석을 제공함으로써 신속하고 정확한 트러블슈팅을 할 수 있도록 돕는다.

데이터독의 가장 큰 특징은 500개 이상의 모니터링 통합을 지원해 시스템 운영 개발 비용을 절감할 수 있다는 데 있다. 별도 개발 없이 쿠버네티스, 서버리스와 같은 최신 기술 스택에 대해서도 손쉽게 가시성 확보가 가능하다.

하나의 플랫폼에 엔드 투 엔드 각 영역에 대한 모니터가 연계된 형태로 시각화가 제공돼 사용자가 손쉽게 장애 분석을 할 수 있으며, ML 기반의 분석 및 알람 기능을 활용해 잠재적인 이슈를 조기에 발견할 수도 있다.

정영석 데이터독 시니어 세일즈 엔지니어는 “클라우드 네이티브 도입이 가속화됨에 따라 더 많은 기업에서 컨테이너, 데브옵스, MSA 환경으로 전환을 하고 있다. 이러한 변화는 개발 생산성을 높이고 비즈니스 요구 사항을 좀 더 빠르게 반영하는 등 긍정적인 면이 있지만, 그 이면에는 서비스 모듈이 세분화됨에 따라 서비스 복잡도가 증가해 장애 발생 시 분석이 어려워지고 있다. 즉 높은 개발 생산성을 유지하면서 발생하는 문제를 해결하기 위해서는 통합 모니터링의 중요성이 점점 높아질 것”이라고 내다봤다.

데이터독 대시보드 화면
데이터독 대시보드 화면

여타 통합 모니터링 솔루션이 네트워크, 인프라, 애플리케이션 및 사용자 모니터링만을 언급하고 있는 반면, 데이터독은 서비스 성능 모니터링 항목에 보안 및 IT서비스 관리(ITSM)까지 솔루션 영역을 확대해 서비스 개발 형상·서비스 성능·보안 영역에 이르기까지 포괄적으로 커버하는 통합 모니터링 플랫폼으로 진화하고 있다.

데이터독을 이용하는 대표적인 고객사는 마켓컬리다. 마켓컬리는 클라우드 네이티브로 전환하면서 서비스의 구조가 점차 복잡해지며 통합 모니터링에 대한 니즈가 큰 상황이었다. 데이터독 도입 전에는 이슈 발생 시 다양한 모니터링 툴을 통해 구간별 분석은 가능했으나 연계 분석을 할 때는 A 솔루션에서 B 솔루션으로 분석 컨텍스트 전환이 필요했다.

그러나 데이터독 도입 후 모니터링 지표 수집부터 알람까지 데이터독으로 통합돼 이슈 발생 시 단일 모니터링 플랫폼에서 분석이 가능해져 이슈 원인을 찾는 시간을 크게 단축할 수 있었다.

데이터독은 국내에서 여러 클라우드 파트너사들과 협력하고 있지만, 그중에서도 메가존클라우드와는 많은 협력 사례를 만들어가고 있다. 현재 메가존클라우드는 데이터독 사업을 위한 전담 인력을 구성해 운영 중이며, 지난 2년여 동안 데이터독이 국내 시장에서 자리를 잡는데 든든한 지원군 역할을 했다.

메가존클라우드에서 데이터독 사업을 맡고 있는 김영환 팀장은 “클라우드 풀스택 모니터링을 고민한다면 데이터독이 정답”이라며 “메가존클라우드는 뛰어난 전문성을 앞세워 데이터독의 글로벌 최고 파트너사로 도약할 것”이라고 포부를 전했다.

서비스 안정성·편의성 고려…제값주기도 필요
점차 빠르게 변화하는 IT 환경에서 IT 성능관리 솔루션은 직접적으로 대고객 서비스 및 비즈니스와 연계되며, 궁극적으로 대고객 서비스 레벨을 향상시킬 수 있는 주요 방안 중의 하나로 활용될 수 있다.

이를 위해 기업이 IT 성능관리 솔루션을 도입했을 경우 서비스 안정성과 편의성이 보장돼야 한다. 안정성인 서비스 환경은 사용자에게 신뢰감을 심어줄 수 있으며, 편리하고 효율적인 서비스 경험은 재사용 가능성을 높여주기 때문이다.

아울러 클라우드 환경에서는 AI 기술 등을 활용해 보다 적은 인원으로 많은 시스템을 운영·관리할 수 있는지의 여부와 비용 최적화가 가능한지도 함께 살펴봐야 할 부분이다.

현재 국내 IT 성능관리 시장은 국산 솔루션들이 시장을 장악하고 있는 상황이지만, 클라우드 시대가 되며 다양한 기능들로 무장한 외산 솔루션들도 다시금 시장에 진입하고 있어 앞으로의 경쟁이 한층 치열해질 것으로 전망된다.

한 업계 관계자는 “국산 솔루션들이 외산 솔루션 경쟁하려면 지속적인 연구개발을 통해 경쟁력을 향상시켜야 하며, 그러기 위해서는 충분한 투자가 이뤄져야 한다. 그러나 국산 솔루션에 대한 유지보수요율 등은 상당히 낮게 책정돼 있어 벤더뿐만 아니라 파트너사들 역시 힘든 상황”이라며 “국산 소프트웨어 생태계의 지속적인 발전을 위해서라도 제값주기가 한층 확산될 필요가 있다”고 지적했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.