성공적인 클라우드 운영, ‘핀옵스’에 달렸다
상태바
성공적인 클라우드 운영, ‘핀옵스’에 달렸다
  • 데이터넷
  • 승인 2020.08.07 10:51
  • 댓글 0
이 기사를 공유합니다

김성수 베스핀글로벌 CTO, 효과적인 클라우드 비용 관리 위한 ‘핀옵스’ 도입 필요성 강조

[데이터넷] 코로나19 팬데믹 이후 클라우드 사용량이 급증하고 있다. 이처럼 빠르게 성장하는 클라우드 환경에서 전통적인 IT 관리 방식은 통하지 않는다. 자칫하다가는 이유도 모른 채 많은 비용을 지불하는 경우도 발생하기 때문이다. 클라우드 환경에서 효율적으로 비용을 관리하고 통제할 수 있는 방법은 무엇인지 알아본다. <편집자>

김성수 베스핀글로벌 CTO
김성수 베스핀글로벌 CTO

불과 몇 년 전만 하더라도 클라우드를 사용해야 하는 타당성에 대한 논쟁이 뜨겁게 진행됐으나, 이제는 모든 기업들이 클라우드로 이동하고 있다. 국내 굴지의 엔터프라이즈 기업들은 이미 클라우드를 앞 다퉈 도입 중이며, 규제가 완화됨에 따라 금융기관도 클라우드를 도입하기 시작했다. 또한, 공공기관들도 클라우드로의 이동을 진행, 도입률과 활용률이 증가 추세에 있어 본격적인 클라우드 시대로 전환되고 있다 해도 과언이 아니다.

특히, 코로나19 이후로 비대면 서비스 사용량이 급증하면서 클라우드 인프라 사용량도 급증하고 있는 추세다. 재택근무용 솔루션 대부분이 클라우드 기반으로 서비스되면서 2020년 1분기 전 세계 클라우드 시장은 지난해 같은 기간 대비 무려 37% 급증한 290억 달러 규모로 추산되고 있다. 시장조사기관 가트너는 2022년까지 클라우드 시장의 연평균성장률이 15.9%에 달할 것으로 예상했다.

이렇게 급격하게 성장하고 있는 클라우드 환경에서 IT 관리 방식은 완전히 변화해야 한다. 지난 수십 년간 IT 자산은 사용부서와 재무부서에서 예산을 승인받아 구매부서를 통해 구매와 인수가 진행되고, 정보시스템 관리 부서에서 수년간 감가상각과 자산실사를 통해 관리하는 대상이었다. 예산, 구매, 사용, 폐기의 전 과정에서 여러 부서들이 눈에 보이는 실물을 관리했다.

전통적인 IT와 달라진 과금 체계
하지만 클라우드 환경에서는 구매와 사용 과정에서 전통적인 재무, 구매, 정보시스템 관리부서가 기존과 같은 방식을 따르기가 어려운 상황이 됐다. 클라우드 환경에서는 엔지니어나 소프트웨어 개발자가 클라우드 서비스 공급자(CSP)들이 제공하는 콘솔에서 자원을 생성하는 것으로 자원의 사용과 비용 발생이 시작된다.

생성된 자산은 언제든지 사양을 변경하거나 특별 할인 프로모션 적용과 같이 비용 조건을 변경할 수 있다. 구매 전 적절한 사양을 산정하기 위해 고민할 필요가 없고, 사용 중인 자원의 변경 및 폐기도 손쉽다. ‘오토 스케일링’과 ‘스팟 인스턴스’와 같은 기술들을 사용해 수시로 리소스들이 자동 생성되고 삭제되기 때문이다.

클라우드의 리소스에 대한 비용은 서버 한 대 단위가 아니라, 가상머신, 네트워크 장비, 네트워크 IP, 데이터 인/아웃(In/Out), 하드디스크, 백업 장비 등 세부 단위로 계산된다. 비용 계산 방식이나 기준 비용도 사용량, 성능, 적용된 OS, 생성된 리전 등에 따라 다르고, 고정형 요금, 계단형 요금, 예약할인 요금, 크레딧 등 다양한 옵션들이 적용된다.

너무나 편리하고 합리적인 방식이지만, 전통적인 IT 관리 방식으로는 대응할 수 없다. 그렇기 때문에 ‘기업들은 클라우드로 이전했더니 비용이 더 많이 나온다’는 불만을 제기하기도 한다. 비즈니스 변화에 빠르게 대응하기 위해 클라우드로 IT를 이전하고, 클라우드의 이점과 기술을 잘 활용하고자 개발팀에 클라우드 사용 권한을 부여했는데, 이것이 마치 직원에게 한도 없는 법인카드를 발급하고 마음껏 사용하게 한 것과 같은 상황이 됐다.

클라우드 비용은 생성된 자원의 사용량과 사용 조건에 따라 시시각각으로 빠르게 변화한다. 한 시간당 몇 원 단위의 상품도 있지만, 시간당 몇 천원, 즉 한 달에 수백만 원을 넘어가는 서비스도 허다하다. 이는 CSP와 기업고객 간 비용 분쟁이 일어나는 이유다.

베스핀글로벌 ‘옵스나우(OpsNow)’가 제공하는 이상금액 모니터링 대시보드
베스핀글로벌 ‘옵스나우(OpsNow)’가 제공하는 이상금액 모니터링 대시보드

인지하지 못한 비용 과다 발생
기업은 실제 비즈니스에 활용하지 않았거나 테스트 용도로, 혹은 단순한 실수로 서비스를 생성해 비용 발생에 대해 인지하지 못한 상황에서 수백 또는 수천만 원의 비용이 청구되는 사례를 생각해보면 된다. 보유한 클라우드 계정의 관리 책임은 기업에게 있기 때문에, 그 계정에서 리소스가 생성돼 이미 비용이 발생했다면 이를 되돌릴 수 없다.

예상치 못한 비용이 크게 발생하는 경우를 살펴보자. 대부분 외부에서 클라우드로 넣는 데이터(Data-In)는 무료이고, 클라우드에서 외부로 데이터를 빼내는 경우(Data-Out)는 유료다. 클라우드 환경에서 애플리케이션을 개발하고 고객에게 서비스를 제공하는 기업의 입장에서 보면, 서비스를 개발하고 테스트하는 단계에서는 데이터 전송 비용이 거의 발생하지 않다가 운영이 본격적으로 시작되고 다수의 사용자가 데이터를 다운로드 받는 상황이 되면 비용이 갑작스럽게 상승하는 현상이 나타난다.

네트워크 전송 속도가 빠르기에 수백 메가바이트(MB)의 데이터 다운로드는 서비스 품질에 문제가 되지 않는다고 쉽게 생각했다가 기업이 부담해야 하는 인프라 비용이 폭증하는 상황이 된다. 간혹 공동 개발을 위해 본사가 위치한 지역의 클라우드 리전과 해외 연구소가 있는 지역의 클라우드 리전 간 대량의 데이터를 주고받았다가 큰 비용이 발생하는 경우도 있다.

최근 빠르게 늘고 있는 머신러닝 서비스에서도 비슷한 경우를 찾아볼 수 있다. 머신러닝 모델을 설계하고 학습시키는 단계에서는 비용이 거의 발생하지 않는다. 고성능의 컴퓨팅 인스턴스를 밤낮으로 며칠 동안 사용해도 프리 티어(Free-tier)에서 머신러닝 모델을 만들 수 있다.

그런데 이 모델이 운영 환경에 배포된 순간부터 비용이 발생하기 시작한다. 만약 수천 명의 사용자가 서비스를 이용하는데, 서비스 운영비용이 예상 이상으로 폭증한다면 큰 문제가 될 수 있다.

안타깝게도 데이터 사이언티스트라고 불리는 대부분의 머신러닝 모델 개발자들은 일반적인 개발자나 엔지니어보다 인프라나 운영 환경 등에 대해 잘 모르는 경우가 많다. 운영 환경을 관리하는 엔지니어 입장에서도 데이터 사이언티스트가 만든 서비스 모델이 얼마나 비용을 발생시킬 지 검증하기가 쉽지 않다. 이처럼 운영 환경에서 비용이 얼마나 발생할 지 고려해보지 않은 상태에서 대고객 서비스가 시작되기도 한다.

클라우드 비용 최적화 ‘핀옵스’
현 상황에서 개발자, 엔지니어, 데이터 사이언티스트가 클라우드의 이러한 특징들을 전부 파악하고 개발하기를 기대할 수는 없다. 기업 차원에서 클라우드에 대한 철저한 준비가 필요하다. 이에 클라우드 환경의 IT 비용 관리를 위한 절차와 통제를 위해 핀옵스(FinOps)라는 개념이 생겨났다. 데브옵스(DevOps)가 개발과 운영을 긴밀히 통합함으로써 애플리케이션과 서비스를 안정적으로 빠르게 운영하고 개선할 수 있도록 하는 것이라면, 핀옵스는 재무와 운영을 긴밀히 통합함으로써 클라우드 비용을 효율적으로 최적화하고 관리·통제하는 데 목적이 있다.

핀옵스는 크게 세 가지 핵심 요소로 구성된다.

첫 번째는 클라우드 비용 전문가다. 스마트폰을 구매할 때도 전문가는 같은 제품이라 할지라도 훨씬 좋은 조건으로 구매할 수 있다. 아마존웹서비스(AWS), 마이크로소프트(MS), 구글(Google) 등 글로벌 톱 3 CSP들과 빠르게 성장하고 있는 알리바바, 텐센트 등 중국의 신흥 CSP들, 공공·금융 등 국내 비즈니스 특성에 맞춰 성장 기반을 확보한 KT, NBP 등 국내 CSP 에서 클라우드 IaaS, PaaS, SaaS 상품이 매일매일 새롭게 출시되고 있다.

수천 개의 상품과 다양한 사용조건들 속에서 전문가 없이 클라우드 비용을 관리하는 것은 ‘나무 위에 올라가 물고기를 찾으려 하는 것’과 같다. 물론 도입 초기에 소규모로 일부 애플리케이션만 클라우드로 운영한다면 어렵지 않다고 생각할 수 있지만, 금방 한계에 도달한다. 처음부터 불필요한 수고를 줄이고, 체계 있는 가이드를 받으며 클라우드를 도입하는 것이 가장 좋은 접근 방법이다.

클라우드 비용 전문가는 ▲계정·리소스 관리 ▲비용을 조직과 프로젝트로 적정하게 분배하고 모니터링하는 방법 ▲RI/SP/EDP의 적정한 커버리지를 결정하고, 계약을 가이드하고, 사용량을 모니터링 하는 방법 ▲미사용 자원을 찾아내는 것 ▲리소스를 적정한 사이즈로 조정하는 것 ▲서버리스 아키텍처를 도입해 비용을 최적화하는 방법 등 다양한 클라우드 비용 최적화 활동으로 가이드를 제공하고 체계를 잡아줄 수 있다.

베스핀글로벌이 제공하는 핀옵스 구성도
베스핀글로벌이 제공하는 핀옵스 구성도

클라우드 가시성 확보
두 번째 요소는 클라우드 자원에 대한 가시화 도구다. 서버 10대, 데이터베이스 3대 정도의 규모로 클라우드에서 애플리케이션을 운영한다고 가정하면, 초 단위로 사용량이 산출되는 빌링 아이템이 하루에 수천 개 이상 발생한다. 앞서 언급한 바와 같이 하나의 서버라고 해도 열 개 이상의 하위 요소로 구성되고, 서버가 구동되기 위한 네트워크, 보안 그룹, 로그 추적 도구 등 수많은 파생 상품들이 같이 생성돼야 하기 때문이다.

또한 기업 입장에서는 프로젝트나 부서에 따라 클라우드 계정을 공유하기도 하고, 한 부서에서 여러 계정을 사용하기도 한다. 뿐만 아니라 다수의 기업들이 특정 CSP에 종속되지 않기 위해서나 운영 안정성을 확보하기 위해서 멀티 클라우드, 하이브리드 클라우드를 운영하고자 한다.

예약 인스턴스 계약은 리소스 단위로 맺어지는 것이 아니라 기업이 보유한 여러 계정들 사이에 공유되는 방식이다. 계단형 요금제의 할인율 또한 여러 계정들에서 발생하는 총량을 합쳐서 적용될 수 있다. 이렇게 여러 CSP와 프라이빗 클라우드에서 다수의 계정별로 복잡하게 생성된 리소스와 비용들이 각 부서나 프로젝트 별로 분배돼야 관리를 시작할 수 있다. 이를 수작업으로 집계하고 관리하는 것은 시간과 노력이 많이 걸릴 뿐만 아니라 새로운 상품, 가격정책이 등장해도 따라갈 수 없다는 한계가 있다.

가시화 도구는 비용과 리소스에 대한 현황을 관리하는 것뿐만 아니라 비용 최적화를 가능하게 한다. 비용 최적화를 하려면 ▲사용하지 않는 자원을 찾아내 삭제할 수 있게 해주는 기능(Unused Resource) ▲CPU, 메모리, 디스크, 네트워크 사용 측정(Metric)과 애플리케이션의 워크로드를 분석해 적합한 리소스 사양을 결정하는 기능(Right Sizing) ▲예약 인스턴스, 스팟 인스턴스, 세이빙 플랜 등 특정한 할인계약 조건을 활용하기 위한 활용(Utilization)·범위(Coverage)·추천(Recommendation) 기능 등이 필요하다.

이러한 기능 들은 경험에 의한 룰(Rule)로 동작하기도 하고, 통계적 분석, 머신러닝과 같은 데이터 분석 기법에 의해서 제공되기도 한다. 잘못된 판단을 내릴 경우 서비스에 영향을 주거나 비용 절감 효과가 오히려 상쇄될 수도 있기 때문에, 정확한 현황을 파악하고 절감안을 추천하는 기능은 가시화 도구의 필수적인 요건이다.

‘옵스나우’에서 리소스 최적화를 통해 클라우드 비용 절감을 기대할 수 있다.
‘옵스나우’에서 리소스 최적화를 통해 클라우드 비용 절감을 기대할 수 있다.

클라우드 거버넌스 수립·통제
세 번째 요소는 클라우드 거버넌스에 대한 수립과 지속적인 통제다. 클라우드는 전통적인 IT 관리 환경과 완전히 다르기 때문에 클라우드 환경에 맞는 정책 수립과 실시간 모니터링은 매우 중요한 요소다. 기본적으로 리소스를 생성하고 사용하는 과정에 대한 생성 및 스케줄링 정책부터 계정과 권한에 대한 보안 정책, CSP들이 제공하는 여러 워크로드에 대한 검증된 최적 아키텍처(Well Architecture)와 비교하는 정책, ISMS, GDPR 등의 컴플라이언스를 준수하기 위한 정책들을 체계적으로 수립하고 정기적으로 검사를 진행해야 한다.

인증 키나 리소스에 대한 접근 권한이 외부에 노출되는 실수는 언제든지 발생할 수 있다. 클라우드 활용의 성숙도가 높지 않은 조직에서는 단순한 실수로 수천만 원의 피해가 발생하기도 한다. 모 회사의 개발 프로젝트에 참여한 어떤 개발자가 자신이 작성한 코드를 공개 소스코드 리포지토리에 올렸는데, 그 코드 중 클라우드 계정에 대한 액세스 키(access key)가 포함돼 한 달간의 급여가 날아갔다는 글은 잊을 만하면 한 번씩 올라오고 있다.

흔하게 들을 수 있는 내용인데도 또 누군가 유사한 실수를 해 계속 글이 올라온다는 것은 그만큼 매뉴얼로 관리하기 어렵다는 방증이다. 계정이나 키에 대한 보안 관리, 리소스들에 대한 보안 설정, 불필요한 리소스가 운영되고 있지 않은지, 구매한 예약 인스턴스의 활용이 유지되고 있는지, 계정이나 사용하는 상품별로 비용이 급증하지는 않는지 등 수백 개의 항목들을 이해하고 직접 설정할 수 있는 전문가를 확보하는 것은 매우 어려운 일이다. 하지만 클라우드는 편한 만큼 관리하기 어려운 서비스이기 때문에, 사고를 미연에 방지하는 자동화된 거버넌스 체계의 도입은 필수적이다.

선제적인 핀옵스 도입 필요
많은 기업들이 클라우드 도입 초기에는 데이터센터에서 운영하던 애플리케이션을 클라우드 환경으로 이전하는 부분에만 신경을 쓰고 있다. 그러나 클라우드 환경으로의 시스템 이전은 끝이 아니라 새로운 시작이다. 클라우드 환경으로의 성공적인 이전을 축하하다가 점차 늘어나는 자원과 비용 통제에 어려움을 겪는 경우도 흔하다. 그와 대조적으로 어떤 기업들은 클라우드 도입과 동시에 적절한 통제와 최적의 비용 절감을 이뤄가며 빠르게 변화되는 비즈니스 환경에서 강자로 떠오르고 있다.

이렇듯 클라우드 도입이 성공하느냐 실패하느냐는 클라우드 비용을 얼마나 잘 관리하고 통제할 수 있느냐에 달려 있다. 핀옵스의 3가지 핵심 요소인 ▲클라우드 비용 전문가 ▲클라우드 가시화 도구 ▲클라우드 거버넌스를 통해 클라우드 비용을 관리·통제할 수 있는 기업만이 클라우드 환경에서 성공할 수 있다. 이제 클라우드는 선택이 아닌 필수이며, 더 나아가 기업의 생존과 직결돼 있기에 핀옵스를 선제적으로 도입함으로써 급변하는 클라우드 환경에서 승자가 될 수 있도록 준비해야 할 때다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.