“물리·가상 환경 모니터링 서비스 보장 솔루션 필수”
상태바
“물리·가상 환경 모니터링 서비스 보장 솔루션 필수”
  • 데이터넷
  • 승인 2022.02.28 08:50
  • 댓글 0
이 기사를 공유합니다

5G 모든 사이클에 심층 모니터링·분석 보장해야 … 전체 서비스 가시성 확보 중요
정기원 넷스카우트코리아 이사
▲ 정기원 넷스카우트코리아 이사

[데이터넷] 4차 산업혁명으로 이어지는 기업 생태계를 위한 기반 시설로 5G 특화망은 필수적이다. 그러나 새로운 사용 사례를 위해 5G의 완벽한 구축과 원활한 운영을 보장하는 것은 매우 어렵다. 어떤 이유든 서비스 지연 및 중단은 미션 크리티컬한 5G 서비스들에 심각한 문제가 발생하기 때문이다. 서비스 보장과 보안으로 완벽한 5G 특화망 만들기에 대해 상세히 살핀다. <편집자>

정부는 5G 특화망 정책과 주파수 공급 방안을 발표해 비통신 기업이 5G 망을 직접 구축할 수 있는 환경을 마련했다.

5G 기술은 다양한 산업 분야와 융합하면서 디지털 트랜스포메이션을 가속하며 자율주행, 스마트 팩토리, 디지털 미디어 등 기존 산업 분야의 산업 첨단화를 촉발해 새로운 부가가치 창출과 동시에 전후방 산업 생태계로 파급돼 경제를 고도화하는 동인으로 작용할 전망이다.

[그림 1] 5G 구축 사이클에 대한 넷스카우트 솔루션 커버리지
[그림 1] 5G 구축 사이클에 대한 넷스카우트 솔루션 커버리지

기업 생태계 기반 시설로 5G 특화망 필수
4차 산업혁명으로 이어지는 기업 생태계를 위한 기반 시설로 5G 특화망은 필수적이다. 그러나 변화하는 애플리케이션에 발 맞춰 운영 방식을 현대화하는 일은 굉장히 복잡한 문제가 될 수 있다.

특히 레거시 이더넷을 이용해 연결돼 있는 곳이라면 무선 이더넷을 사용해 일부 시설의 현대화를 진행할 수 있지만 상업용 와이파이와 LTE 통신망은 안정적인 저지연 보장은 어렵고 이동성, 확장성 측면에서 제약 사항이 존재해 무선 연결망이 요구되는 고도로 자동화된 지능형 시스템들에는 적합하지 않아 5G 특화망은 유일한 선택이 될 수밖에 없다.

5G는 동일한 작업을 더 빠르게 수행하는 것만이 아닌 엄청나게 짧은 대기 시간과 높은 처리량을 통해 광범위한 산업에서 완전히 새로운 애플리케이션 시대를 여는 것이다. 예를 들면 5G는 2023년까지 세계 경제에 연간 1조5000억 달러에서 2조2000억 달러를 추가할 수 있는 스마트 팩토리의 완전 자율화를 가능하게 할 것으로 기대를 모으고 있다.

이러한 새로운 사용 사례를 위해 5G의 완벽한 구축과 원활한 운영을 보장하는 것은 매우 중요하다. 영화 다운로드가 오작동하는 것과 5G로 구현되는 원격 수술을 위한 것은 완전히 다른 얘기로 언제 어디서나 산업 환경에 맞는 등급의 SLA(Service-Level Agreement) 성능을 제공하는 것이 필수로, 어떤 이유든 서비스 지연 및 중단은 미션 크리티컬한 5G 서비스들에 심각한 문제가 발생하게 된다.

[그림2] 5G NSA 환경의 넷스카우트 레이어 7 가시성 커버리지
[그림2] 5G NSA 환경의 넷스카우트 레이어 7 가시성 커버리지

5G 서비스 중단 원인
일반적으로 5G 서비스 중단의 원인은 크게 두 가지로 구분해 볼 수 있다. 첫 번째는 무엇인가 고장이 났거나 보안적인 의미로 누군가 침입한 것으로, 다시 말하면 대기 시간의 문제가 발생할 때 이것은 단순한 구성 오류로 발생하거나 제어 평면 문제(예: 인증 실패), 연결 실패, 개별 장치 오작동 등에 의한 것일 수 있다. 두 번째로는 DDoS 공격과 같은 악의적인 행위로 인해 대기 시간을 늘리거나 서비스를 완전히 중지시킬 수도 있다.

첫 번째 경우는 서비스 보장이다. 기본적으로 스마트 팩토리와 같은 5G 특화망의 경우 엔드 투 엔드 서비스 제공을 위해 IT(Information Technology), CT(Communication Technology), OT(Operational Technology)라는 3개 도메인간의 통합을 통해 하나의 서비스가 이뤄지게 된다.

예를 들어 하나의 IoT 센서가 서비스를 제공받는 경우에 이 센서는 우선 5G 망에 접속하기 위해 여러 절차들을 거치게 된다. 첫 째로 RAN(Radio Access Network)에서는 무선 자원을 할당 받고 5G 코어망에서는 가입자 정보를 가져와 인증, 암호화, IP할당, 그리고 SLA에 맞게 세션을 생성해 준다. 이후 생성된 세션을 통해 사용자 평면의 실제 데이터를 전송하게 된다.

이 전송된 데이터는 OT와 IT를 경유하게 된다. 이때 웹 기반이라면 웹-WAS-DB를 거치는 IT를 이용하거나 OT의 경우 머신간의 데이터를 주고받기 위한 프로토콜을 기반으로 메시지를 교환하게 된다.

이 과정의 어느 한 부분에 지연이 발생하거나 고장, 즉 에러가 발생할 경우 전체 서비스에 영향을 미치게 된다. 따라서 하나의 서비스를 이루는 모든 컴포넌트, 트랜잭션에 대한 모니터링 및 레이어 7 가시성 획득은 문제 발생에 대한 근본 원인 분석을 위해 필수다.

넷스카우트에서는 이를 엔드 쓰루 엔드(End-Through-End) 모니터링이라 칭한다. 5G 구축 사이클에서 여러 솔루션을 통해 모든 사이클 단계에 대해 심층적인 성능 모니터링과 분석 환경을 제공한다.

특히 넷스카우트 솔루션은 통신사업자 시장에서 이미 검증된 솔루션으로 전 세계 48개국 165개의 통신사업자가 LTE와 5G 망 관리 및 운영 고도화에 활용하고 있다. 이는 미주지역의 모든 통신사, 유럽 톱5 통신사는 물론 국내 모든 통신사 역시 사용하고, 9개의 전 세계 티어1 사업자가 포함돼 있다.

[그림 3] 5G SA 환경의 넷스카우트 레이어 7 가시성 커버리
[그림 3] 5G SA 환경의 넷스카우트 레이어 7 가시성 커버리

넷스카우트 레이어 7 가시성
넷스카우트의 레이어 7 가시성은 3GPP 표준상 NSA(None Stand Alone)/SA(Stand Alone) 환경의 모든 인터페이스에 대해 애플리케이션 및 이벤트 메시지들을 인지한다. 이는 모든 물리적/가상화 환경에서 특히 5G SA의 경우 가상화로 이뤄지는 환경의 경우 레이어 7 가시성을 위해 패킷을 획득하고 모니터링하기 위한 프로브가 가상화 환경 내에서 이스트-웨스트 트래픽에 대한 모니터링이 가능해야 한다.

넷스카우트는 이를 위해 총 4가지 유형의 구축 옵션을 제공한다. 특히 도커 환경에서는 OS 레벨의 도커 브릿지를 통해 트래픽을 획득해 컨테이너 내부에서 통신이 이뤄지는 이스트-웨스트 트래픽을 외부로 전송할 필요 없이 내부에 설치된 가상화된 프로브 솔루션을 통해 모니터링이 가능하다.

이는 큰 장점으로 작용한다. 하나는 동일한 트래픽을 중복 복사해 외부로 보낼 필요가 없기 때문에 비용 측면에서 이점이 있으며 중복 트래픽을 외부로 보내기 위한 하드웨어 병목 현상을 없애 실제 컨테이너의 불필요한 부하를 줄이는 효과도 있다.

3GPP 표준 메시지 이해와 분석
뿐만 아니라 NSA/SA 상의 레이어 7 가시성을 위해 3GPP 표준 메시지들에 대한 이해와 분석이 가능해야 한다. 넷스카우트의 ASI(Adaptive Service Intelligence) 스마트 데이터는 이러한 3GPP 표준 인터페이스간의 레이어 7 메시지들을 이해하고 분석해 정제된 데이터 세트로 제공한다.

예를 들어 5G NSA에서는 단말에서 MME(Mobility Management Entity)로 전송되는 패킷들로부터 3GPP 메시지를 분리해 요청/응답, 응답 성공율, 응답 지연 시간, 응답 실패 코드 등을 분석해 사용자로 하여금 MME의 성능을 확인하고 SLA 준수 등 서비스 보장이 가능하도록 한다.

5G SA도 마찬가지로 AMF(Access and Mobility Management Function), SMF(Session Management Function), AUSF(Authentication Server Function), PCF(Policy Control Function) 등 각 3GPP 표준 인터페이스별 메시지들을 인식하고 각 메시지별 상세 통계 등을 생성해 낸다.

이를 통해 단말의 접속, 인증, 등록 등에 대한 서비스 성능 통계들을 사용자는 얻을 수 있으며 3GPP 표준 콜 플로우 상 어느 단계에서 지연 또는 에러가 발생했는지를 손쉽게 확인이 가능하며 각 3GPP 컴포넌트별로 성능에 대한 지표화 및 관리가 가능하게 된다.

[그림 4] 5G 코어망에 대한 서비스 대시보드를 통해 5G 노드 상태 모니터링
[그림 4] 5G 코어망에 대한 서비스 대시보드를 통해 5G 노드 상태 모니터링
[그림 5] 세션 레벨 분석으로 가입자 실패 사유별 개별 세션 트래킹 사례
[그림 5] 세션 레벨 분석으로 가입자 실패 사유별 개별 세션 트래킹 사례
[그림 6] NSA 솔루션을 통한 엔드 투 엔드 네트워크 검증 사례
[그림 6] NSA 솔루션을 통한 엔드 투 엔드 네트워크 검증 사례

성능 저하 문제 선제 모니터링
이는 또한 단순히 각 컴포넌트에 대한 성능만을 보여주는 것이 아니다. 엔드 쓰루 엔드로서 무선 구간의 RRC(Radio Resource Control)를 포함해 5G 코어 및 IMS 또는 Sgi/N6 인터페이스 뒷단의 애플리케이션 서버까지 성능을 보여주고, 이는 또한 엔드 투 엔드 콜 트레이싱으로 제공한다.

따라서 서비스 대시보드를 통해 CT, IT, OT의 각 도메인별 서비스를 하나의 논리적인 서비스로 묶어 관리가 가능해 서비스 성능 저하 문제에 대한 선제적인 모니터링과 알람이 가능하다. 사용자는 이를 통해 하나의 서비스가 어떤 장비, 어떤 구간, 어떤 단계에서 문제가 발생해 전체 서비스가 영향을 받았는지에 대한 가시성을 확보할 수 있으며, 운영 및 트러블 슈팅 전반에 활용이 가능하다.

[그림 4]는 넷스카우트 엔지니어스원(nGeniusONE) 솔루션을 통해 5G SA SBA(Service-Based Architecture) 환경 전체에 대한 모니터링을 대시보드화한 것으로 SBA 전체의 실패율은 1%에 그치지만 전체 중 AMF의 실패율은 10% 수준까지 발생하는 것을 한 눈에 확인하는 사례다. 이러한 대시보드는 각 지역단위로 더욱 세분화할 수 있어 보다 정밀한 모니터링이 가능하다.

나아가 ASI 스마트 데이터를 통해 서비스에 대한 상세 통계를 확인할 수 있다. 여기에서는 애플리케이션, 서버, 클라이언트 개별로 만들어진 통계를 확인해 주요 노드간에 성능 지표를 비교하거나 분석해 볼 수 있으며, 이것을 통해 AMF의 실패율에 대한 근본 원인의 대한 분석이 가능하다.

[그림 5]은 특정 AMF와 클라이언트간에 특정 애플리케이션의 실패율이 35.71%이며 이것에 대한 에러코드를 우측 하단의 그래프로 확인이 가능하다. 이는 N2 PDU(Protocol Data Unit) 설정 미허용으로 인한 서비스 중단이 발생한 사례다.

뿐만 아니라 제공된 ASI 스마트 데이터는 세션 레벨의 가시성을 동시에 제공한다. [그림 7]과 같이 특정 IMSI(International Mobile Station Identity)를 가진 사용자의 세션 연결에 대해 세션 레벨의 분석이 제공돼 해당 세션의 요청과 응답 시간의 지연 및 에러 발생을 손쉽게 트레이싱해 가입자 실패 사유를 각 세션별로 분석 가능하다.

넷스카우트 프로브의 경우 24×7로 모든 패킷을 실시간으로 저장하고 있기 때문에 문제에 대한 확실한 증적자료로 패킷을 제시할 수 있다. 이는 가장 정확한 증적자료로 모든 문제에 대해 여러 조직간에 가장 정확한 자료로 사용돼 문제를 빠르게 해결할 수 있다.

엔드 투 엔드 콜 트레이싱의 경우, VoC(Voice of Customer) 분석과 같은 특정 콜에 대한 분석 필요 시 필수로 요구되는 기술로, 이는 무선 구간을 포함한 전 인터페이스 구간의 메시지들을 분석해 하나의 콜로 스티칭을 해주는 기능이다.

LTE를 포함한 5G의 경우 대부분 품질 관련 문제들의 80% 이상이 RAN 구간의 품질 문제와 연관돼 있는 것으로 알려져 있다. 이 경우에 단순히 코어 구간의 가시성만 가지고는 근본 원인의 문제가 분석되지 않는 경우가 많기 때문에 RAN 구간을 포함한 콜 트레이싱 기술은 필수적이며 강력한 기능이다. 

넷스카우트 nSA(nGenius Session Analyzer)는 [그림 6]과 같이 가입자, 세션당 트러블슈팅이 가능하고 모든 도메인 RAN, 코어, IMS(IP Multimedia Subsystem) 등을 아우르는 엔드 투 엔드 상관관계 분석을 제공한다. 또한 강력한 필터링 기능을 통해 원하는 콜 실패 사례만 필터링이 제공돼 네트워크 설계 구현 및 검증에 활용하고 고객 경험 보장을 위한 툴로도 사용이 가능하다.

[그림 7] 모드버스-TCP 성능 대시보드 및 서비스 맵 화면
[그림 7] 모드버스-TCP 성능 대시보드 및 서비스 맵 화면
[그림 8] 모드버스-TCP 애플리케이션별 통계 화면
[그림 8] 모드버스-TCP 애플리케이션별 통계 화면

IT·CT·OT 도메인 모두 모니터링
앞서 언급한 것처럼 5G 특화망에는 CT 도메인만 존재하는 것이 아닌 IT 도메인, OT 도메인도 공존하고 있다. 따라서 이러한 서비스 보장 및 성능 모니터링 도구의 경우 CT 도메인뿐 아니라 스마트 팩토리에서 사용하는 OT 및 IT에 대해서도 모니터링이 가능해야 한다.

[그림 7] 사례를 통해 OT 도메인에서 사용되는 모드버스-TCP 프로토콜의 성능 및 서비스 모니터링을 살펴보자. 대시보드에는 모드버스 애플리케이션을 각 지역 단위로 대시보드를 구성해 모니터링을 한다. 이는 넷스카우트의 레이어 7 가시성을 통해 모드버스 애플리케이션의 각 메시지 요청과 응답을 구분함으로써 가능하며 이를 통해 사용자는 서비스 성능 모니터링 및 서비스 보장을 할 수 있다.

[그림 7]에서 보는 것처럼 스마트 메뉴팩처링이란 상위 도메인 하에 3개의 지역별 모드버스-TCP의 성능 통계가 대시보드화되고 있으며 서비스 맵에 화면에서는 특정 서버(빨간색 라인)의 경우 재전송이 26건으로 전송 성능 저하가 발생되는 것을 확인할 수 있다. 이는 다시 각 애플리케이션의 메시지 타입별로 세분화돼 통계가 모니터링되며 이를 통해 빠른 문제 분석이 가능하다.

마지막으로 수집된 실제 패킷을 통해 해당 세션이 RST를 통해 비정상으로 종료되는 것에 대한 증적을 확보하는 사례다.

결론적으로 5G 특화망의 서비스 보장을 통한 완벽한 네트워크 구축을 위해서는 CT, IT, OT 도메인을 아우르고 5G 인프라인 RAN부터 코어까지를 볼 수 있으며 물리적 및 가상화 환경에서 모니터링할 수 있는 아키텍처를 갖는 서비스 보장 솔루션이 필수로 요구된다. 이러한 솔루션을 통해 사용자는 5G 계획부터 운영 고도화에 이르기까지 서비스에 대한 보장을 충실히 이행해 나갈 수 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.