비씨카드 SAN 인프라 구축 사례
상태바
비씨카드 SAN 인프라 구축 사례
  • 권혁범 기자
  • 승인 2004.02.10 00:00
  • 댓글 0
이 기사를 공유합니다

3천만명에 육박하는 가입자를 확보하고 있는 국내 최대 신용카드 업체인 비씨카드는 기하급수적으로 증가하는 가입자수에 비례해 폭증하는 거래량, 가입자 정보 관리 및 다양한 콘텐츠 활용 등을 신속하게 처리하기 위해 지능형 SAN 인프라를 구축했다. 이로 인해 관리 효율성 극대화, 상면 공간 활용과 같은 표면적인 이득은 물론, 대고객 서비스 개선 및 기업 이미지 제고 등 부수적인 효과도 기대할 수 있게 됐다.

전산시스템 환경에 있어 비씨카드는 선견지명을 자랑한다. 비씨카드는 지난 1997년 메인 프레임을 걷어내고 유닉스 기반의 클라이언트/서버 환경으로 전환했다. 당시만 하더라도 금융권의 메인 프레임 포기는 단순히 운영 체제 교체가 아닌 안정성 포기를 의미했다는 점을 감안하면 상당히 파격적인 결정이 아닐 수 없다. 물론 유닉스 전환 이후 메인 프레임 시절에는 사용하지 않았던 DBMS, 미들웨어, 그리고 코볼과 같은 생소한 C언어까지 사용하게 돼 수많은 시행착오를 거쳤지만, 지금은 유닉스 환경에서의 기술력에 있어 비씨카드와 견줄만한 국내 금융권은 거의 없다.

하지만 스토리지 구성 방식에 있어서 만큼은 비씨카드의 대응이 늦었다. 가입자 증가로 거래량이 폭증하고, 가입자 정보 관리 및 다양한 콘텐츠 활용 등을 신속하게 처리할 수 있는 솔루션 도입이 요구되던 2002년까지 비씨카드는 기존 SCSI 디스크 기반의 DAS 환경을 고집했다. 그 결과 전체 서버는 160여대에 이르렀고, 서버 시스템과 연결된 스토리지를 관리하는 작업은 그야말로 막노동이나 다름없게 됐다.

장애위험·관리문제 등 DAS 환경 한계 봉착

이러한 문제를 해결하기 위해 비씨카드가 선택한 것은 시스템관리시스템(SMS) 툴이다. 비씨카드는 주요 서버 30여대를 비엠씨소프트웨어의 ‘패트롤’로 묶어 장애 관리, 성능, 통계, 자산관리를 시도했고, 그 결과 서버 관리 포인트를 줄일 수 있었다. 그렇지만 이것만으로는 근본적인 해결책이 될 수 없었다. 문제는 장애 포인트가 훨씬 많은 스토리지였기 때문이다.

비씨카드는 DAS 환경 하에서의 작업으로 디스크 추가와 이에 따른 부가 비용(SCSI 카드 등을 추가로 구입하는 등)을 이중으로 지출해야 했으며, 늘어나는 디스크 랙을 보관할 물리적 공간 부족으로 전산센터를 계속 확장해야 하는 등 여전히 어려움에 봉착해 있었다.

또한 시스템 증설과 소프트웨어 인스톨에 따른 전체적인 디스크 및 스토리지 재할당 작업이 거의 불가능해 실질적인 데이터 통합과 관리도 어려웠다.

박희운 비씨카드 정보시스템본부 시스템팀 팀장은 “2002년 당시는 데이터 증가로 인해 디스크를 계속 늘리던 시기였다. 하지만 스토리지를 DAS 방식으로 묶다보니 서버에 디스크를 물리는 것도 한계에 이르렀고, SCSI 케이블까지 늘어나 셧다운 한 번 하는 데만도 엄청난 시간이 소요됐다. 수많은 장애 포인트에 그대로 노출돼버린 셈이다. 실제로 디스크 장애로 업무가 다운되는 사태도 발생했었다”라고 말했다.

결국 비씨카드는 DAS 환경을 보다 효율적인 관리가 가능한 SAN 환경으로 전환하는 것만이 궁극적인 해결책이라는 결론에 도달, 대대적인 공사에 착수했다. 지난 2002년 10월 비씨카드는 우선 카드 업무용 메인 시스템, 은행으로 치면 계정계에 해당하는 데이터베이스 스토리지 시스템을 노후된 SCSI 디스크에서 엔터프라이즈급 스토리지로 교체했다. 비씨카드가 선택한 제품은 한국EMC의 엔터프라이즈급 스토리지인 ‘시메트릭스 8830’. 이 제품은 비씨카드가 지향하는 확장성과 안정성을 모두 보장함으로써 안정적인 스토리지 환경의 토대를 마련했다.

곧바로 이어진 2단계 작업의 핵심은 애플리케이션 서버의 데이터를 모두 SAN으로 엮는 것이었다. 비씨카드는 이 작업을 위해 브로케이드코리아의 엔터프라이즈급 SAN 스위치 ‘실크웜 12000 디렉터’를 선택했다. SCSI 디스크를 활용한 DAS 환경의 공간적 비용적 제약과 스토리지 관리 및 통합의 어려움을 해결하고, 스토리지 가용성 및 시스템 운영 속도 개선에 있어 가장 적합하다는 판단에서다. 비씨카드는 지난해 4월부터 9월까지 6개월에 걸친 작업 끝에 결국 애플리케이션 서버 데이터를 모두 SAN으로 엮는 데 성공했다. 그 결과 일부 소형 서버들을 제외한 모든 시스템을 SAN 환경으로 전환시킬 수 있었다.

비씨카드 SAN 인프라 구성도

SAN 전환 후 시스템 운영 효율 ‘대폭’ 개선

스토리지 시스템을 SAN 환경으로 전환한 이후 비씨카드의 전산 환경은 크게 달라졌다. 가장 눈에 띄는 부분은 역시 시스템 운영 속도 개선이다. SCSI 디스크를 DAS로 묶어두던 때에 비해 가용시간이 무려 10배 이상 빨라졌다. 셧다운 작업이나 백업/복구 소요 시간을 살펴보면 보다 확실히 체감할 수 있다.

일반적으로 은행이나 증권사는 서버에 누적된 메모리를 정리하거나 시스템 파라미터 변경 작업을 위해 전체 시스템을 셧다운하는 작업을 수행한다. 비씨카드도 예외가 아니어서 정기적으로 셧다운을 해야했는데, 문제는 엄청난 SCSI 케이블을 일일이 확인하고 셧다운을 진행하다보니 소요되는 시간이 엄청났다. 따라서 정기적으로 셧다운을 한다는 것은 엄두조차 낼 수 없었다. 하지만 SAN 환경 도입 이후 비씨카드는 2개월에 한 번씩 정기적으로 셧다운을 할 수 있을 만큼 여유가 생겼다.

SAN 환경은 백업/복구 속도에도 엄청난 변화를 가져왔다. 비씨카드는 일주일에 한 번씩 풀백업을 실시한다. 현재 메인 시스템 기준으로 7TB 가량 되는 데이터를 백업받는 데 소요되는 시간은 겨우 8시간. 과거 DAS 환경에서는 풀백업을 받기 위해 만사 제쳐두고 매달려야 했던 상황에 비하면 장족의 발전을 거둔 셈이다.

이와 같은 시스템 운영 속도 개선은 시스템 관리 업무에 많은 영향을 미쳤다. 우선 야근이 상당히 많이 줄었다. 몇 년 전까지만 해도 스토리지, 케이블, 카드 관련 장애 복구나 정기적인 셧다운을 위해 야근하는 일이 다반사였다.

하지만 지금은 케이블이나 디스크 장애도 거의 없고(장애 발생 시 EMC에서 미리 감지하고 복구한 뒤 통지하기 때문에 별도의 인력 투입이 불필요), 셧다운 작업도 간편해져 야근 부담이 크게 줄었다. 비효율적인 업무 로드 감소로 인한 관리 인력 재배치 역시 SAN 환경이 가져다준 결과다. 계속해서 늘어나는 서버와 스토리지 관리에 눈코 뜰 새 없던 관리 직원들이 시스템 최적화로 업무에 한결 여유가 생겼으며, 그로 인해 비씨카드는 보다 전문화된 기술 확보를 위해 직원 자질을 높이는 교육 부분에 관심을 기울이고 있다.

DR센터 구축으로 SAN 활용도 ‘배가’

SAN 환경으로의 전환은 비씨카드에게 시스템의 안정성 제고는 물론, 가입자와 결제량 급증에 따른 스토리지 및 서버 증설 작업을 소프트웨어와 스위칭 조작만으로 해결할 수 있게 만들었다. 뿐만 아니라 서버 및 스토리지 통합 관리를 가능케 해 데이터 가용성을 높였으며, 어떠한 서버와 스토리지를 추가할 경우에도 충돌 없이 시스템과 연동할 수 있도록 호환성을 극대화시켰다. 그리고 재난복구시스템(DRS) 구축을 위한 확장성도 매우 용이해졌다.

이에 따라 현재 비씨카드는 오는 5월 말 구축 완료를 목표로 3단계 작업인 재난복구센터 구축에 한창이다. EMC의 재난복구솔루션인 ‘SRDF’를 활용해 서초동 본사와 안양 증권전산 IDC를 연결한다는 계획이다. 애플리케이션 데이터까지 모두 SAN으로 전환된 마당에 더 이상 재난복구시스템 구축을 미룰 이유가 없어진 것이다.

비씨카드는 재해복구시스템 구축과 함께 SAN 환경을 보다 효율적으로 관리하기 위해 더 많은 관리 영역을 자동화시킬 방침이다. 우선 현재까지 수동으로 작업 중인 SAN 스위치 장애 상태 관리 영역이 첫 번째다. 이를 위해 비씨카드는 재해복구시스템 구축을 책임지고 있는 서울일렉트론에 의뢰해 별도의 관리 툴을 개발 중이며, 오는 5월 재해복구시스템 구축과 함께 시스템에 적용시킬 예정이다.

박희운 팀장은 “급증하는 회원 및 거래량의 원활한 관리 등을 위해 보다 빠르고 안정적인 데이터 전송 및 최적화 시스템을 구현하는 작업은 금융권에서 이미 필수불가결한 비즈니스 조건이다”라며 “비씨카드는 이번 SAN 시스템 환경으로의 전환을 통해 안정성, 확장성, 그리고 관리의 효율성까지 극대화할 수 있게 됐다”고 말했다.

[미니 인터뷰] 박희운 비씨카드 정보시스템본부 시스템팀 팀장

“고속의 안정적인 데이터 관리를 원한다면 SAN이 정답이다”

■ SAN 환경으로 전환하게 된 계기는.
지난 2002년 당시는 데이터 증가로 인해 디스크를 계속 늘리던 시기였다. 하지만 스토리지를 DAS 방식으로 묶다보니 서버에 디스크를 물리는 것도 한계에 이르렀고, SCSI 케이블까지 늘어나 셧다운 한 번 하는 데만도 엄청난 시간이 소요됐다. 수많은 장애 포인트에 그대로 노출돼버린 셈이다. 실제로 디스크 장애로 업무가 다운되는 사태도 발생했었다. 결국 이와 같은 문제의 원인이 된 DAS 환경을 보다 효율적인 관리가 가능한 SAN 환경으로 전환하는 것만이 궁극적인 해결책이라는 결론에 도달하게 됐다.

■ SAN 구축 과정은.
우선 카드 업무용 메인 시스템, 은행으로 치면 계정계에 해당하는 데이터베이스 스토리지 시스템을 노후된 SCSI 디스크에서 엔터프라이즈급 스토리지인 ‘시메트릭스 8830’으로 교체했다. 그리고 곧바로 애플리케이션 서버의 데이터를 모두 SAN으로 엮는 작업에 착수했다.이 작업을 위해 브로케이드코리아의 엔터프라이즈급 SAN 스위치 ‘실크웜 12000 디렉터’를 도입키로 했다. SCSI 디스크를 활용한 DAS 환경의 공간적 비용적 제약과 스토리지 관리 및 통합의 어려움을 해결하고, 스토리지 가용성 및 시스템 운영 속도 개선에 있어 가장 적합하다는 판단에서다. 우리는 지난해 9월 드디어 애플리케이션 서버 데이터까지 모두 SAN으로 엮는 데 성공했다.

■ SAN 전환 이후 달라진 점은.
가장 눈에 띄는 부분은 시스템 운영 속도다. SCSI 디스크를 DAS로 묶어두던 때에 비해 가용시간이 무려 10배 이상 빨라졌다. 셧다운 작업이나 백업/복구 소요 시간을 살펴보면 보다 확실히 체감할 수 있다. 그 결과 시스템 관리 업무도 크게 달라졌다. 우선 야근이 상당히 많이 줄었다. 몇 년 전까지만 해도 스토리지, 케이블, 카드 관련 장애 복구나 정기적인 셧다운을 위해 야근하는 일이 다반사였다. 하지만 지금은 케이블이나 디스크 장애도 거의 없고, 셧다운 작업도 간편해져 야근 부담이 크게 줄었다. 그로 인해 우리는 현재 보다 전문화된 기술 확보를 위해 직원 자질을 높이는 교육 부분에 관심을 기울이고 있다.

■ 향후 인프라 확장 계획은.
오는 5월 말 구축 완료를 목표로 재난복구센터를 구축중이다. EMC의 재난복구솔루션인 ‘SRDF’를 활용해 서초동 본사와 안양 증권전산 IDC를 연결하고자 한다. 동시에 SAN 환경을 보다 효율적으로 관리하기 위해 더 많은 관리 영역을 자동화시킬 방침이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.