유닉스급 성능·폭넓은 가상화로 IT 혁신 주도
상태바
유닉스급 성능·폭넓은 가상화로 IT 혁신 주도
  • 김선애 기자
  • 승인 2009.09.30 00:00
  • 댓글 0
이 기사를 공유합니다

인텔 네할렘, 가상화·HPC 환경서 ‘탁월’

장기적인 경기침체 극복을 위해 기업들이 IT 비용절감을 위한 투자를 지속적으로 진행하고 있다. 이러한 배경에서 유닉스에 버금가는 성능을 경제적인 가격에 제공하는 x86 서버 시장이 크게 확산되고 있다. 특히 인텔의 제온 5500(코드명 네할렘)은 뛰어난 성능과 높은 에너지 효율, 향상된 가상화 지원 기술 등을 무기로 x86 시장 성장을 견인하고 있다. <편집자>

최근 시장조사결과를 살펴보면 경제위기로 인한 서버시장의 전반적인 침체 가운데서도 x86 서버는 의미 있는 점유율을 보이고 있으며, 기업들이 비용절감과 비즈니스 유연성 확보를 위해 x86 서버 도입에 우호적인 입장을 나타내고 있는 것을 알 수 있다.
 
특히 현재 기업들이 가장 크게 관심을 갖고 있는 클라우드 컴퓨팅 환경에서 폭넓은 가상화 환경을 지원하고 경제적이면서 비용절감 효과가 높은 x86 플랫폼에 대한 관심이 더욱 높아지고 있다.

x86 서버의 성능이 월등히 향상된 데에는 ‘인텔 제온(Xeon) 프로세서 5500 시리즈(코드명 네할렘-EP, 이하 네할렘)’가 큰 몫을 담당하고 있다. 인텔이 “15년 전 펜티엄 프로 프로세서가 출시된 이래 가장 혁신적인 서버 프로세서”라고 소개하는 네할렘 프로세서는 시스템 속도와 다목적성을 향상시키는 최첨단 기술을 제공한다.
 
특히 ▲터보 부스트(Turbo Boost) ▲하이퍼스레딩(Hyper-Threading) ▲통합 파워 게이트 ▲EPT(Extended Page Tables)를 통해 경험할 수 있는 인텔 가상화 기술(VT)은 클라우드 컴퓨팅 환경에서 시스템이 다양한 작업을 지원할 수 있도록 도와준다. (page_break)퀵패스 아키텍처로 2배 이상 성능향상
인텔은 프로세서를 개발할 때 ‘새로운 공정 기술(틱)’과 ‘새로운 마이크로 아키텍처(톡)’를 번갈아 발표한다. 이를 ‘틱톡’ 모델이라고 하는데, 네할렘 프로세서는 2007년 발표한 45나노 기술을 유지하면서 아키텍처 상에서 혁신적인 변화를 꾀한 ‘톡’ 모델에 해당한다.

기존의 인텔 프로세서 아키텍처는 메모리 컨트롤러 허브(MCH)를 중앙에 두고 CPU와 메모리, 디스크, IO를 주변에 배치했다. MCH에서 발생하는 병목현상은 캐시메모리 용량을 늘리는 방법으로 해결했다.


네할렘은 퀵패스 아키텍처(QuickPath Architecture)를 채택해 메모리와 컨트롤러를 통합한 통합 메모리 컨트롤러, 프로세서와 기타 구성요소 연결을 위한 고속 인터커넥터를 통해 병목현상을 방지하고 기존 제품보다 2배 이상 성능향상 효과를 보이고 있다.
 
고속 인터커넥터는 명령이 메모리와 IO로 전송되는 단일한 버스가 없어 IO와 허브의 고속연결을 제공한다. 이를 통해 서버나 고성능 워크스테이션의 모든 프로세서는 단일 메모리의 공유 풀 대신 프로세서 다이상의 통합 메모리 컨트롤러를 통해 직접 액세스하는 전용 메모리를 갖는다. 이 기술은 초당 6.4기가트랜스퍼(Gigatranfers) 링크를 사용해 다른 인터커넥터보다 300% 높은 초당 25GB의 총 대역폭을 제공하며, 멀티 프로세서 시스템에서 필요한 통신량을 줄여 빠른 페이로드를 제공한다.

네할렘 프로세서의 또 다른 중요한 특징은 에너지 효율이 크게 높아졌다는 것이다. 네할렘은 클럭 속도를 높이기 위해 많은 에너지를 사용하는 방식을 선택하지 않고, 프로세서가 사용할 수 있는 클럭 사이클과 전력을 향상시키는데 집중하고 있다. 이는 하나의 프로세서가 동일한 전력 혹은 보다 적은 전력을 사용하면서 더 많은 업무를 할 수 있다는 것이다. 쉽게 말해 다른 프로세서가 클럭당 3개 이하의 명령을 처리하는 반면 네할렘은 클럭당 4개의 명령까지 처리할 수 있다. 다른 프로세서보다 작업을 일찍 끝낼 수 있어 프로세서가 저전력 상태로 전환되거나 다른 업무를 빠르게 처리할 수 있다.

전력제어와 관련된 또 다른 기능으로, 인텔 데이터센터 매니저(Intel Data Center Manager) 소프트웨어 개발킷이 포함된다. 이는 랙이 파워레벨을 초과하지 않도록 변화하는 서버 작업량에 맞춰 작동해 관리 콘솔 벤더들이 플랫폼 전력 제어력을 강화하고 랙 및 데이터센터의 전력 방침을 역동적으로 규정할 수 있게 해준다. 또한 새롭게 디자인된 인텔 10GbE 컨트롤러는 서버 블레이드, LOM, 메짜닌 카드를 실행하기에 적합하며, PHY를 통합해 비용 및 보드 공간을 감소시켜 준다.

인텔의 45나노 하이-k 메탈 게이트 실리콘 기술은 네할렘에도 전승된다. 이 공정은 하이-k 게이트 유전체와 도체의 새로운 물질 결합을 통해 칩 및 PC 설계, 크기, 전력 소비 및 비용을 제한할 수 있는 트랜지스터로부터의 누전을 감소시키면서 PC, 랩톱 및 서버 프로세서 성능을 기록적으로 향상시킬 수 있도록 한다. 인텔의 45나노 하이-k 실리콘 공정 기술은 트랜지스터의 스위칭 속도를 증가시켜 높은 코어 및 버스 클럭 주파수를 가능해 동일한 전력과 발열 엔벨롭에서 더 높은 성능을 가능케 한다. (page_break)네할렘 적용한 HPC 기업의 성공사례
HPC에 적용되는 네할렘 프로세서는 기능과 성능, 에너지 효율성 측면에서 이전세대에 비해 월등히 앞서고 있다. 네할렘 프로세서를 사용해본 기업의 평가를 소개한다.

● 사이넷(Scinet)
사이넷은 항공우주학, 천체물리학, 생물정보학, 화학물리학, 기후변화예측, 의료 이미징, 글로벌 ATLAS 프로젝트의 최첨단 연구 활동을 수행하고 있으며, 높은 컴퓨팅 성능을 끊임없이 요구한다.
사이넷 CTO인 크리스 로켄(Chris Loken) 박사는 “새로운 제온 5500 시리즈는 우리의 새로운 발견이 가능하도록 하기 위해 최첨단 HPC 기술 혁신을 이용할 수 있게 해 준다”고 밝혔다.

● 필립스 헬스케어(Phillips Healthcare)
필립스 헬스케어는 첨단 의학기술과 임상 노하우를 접목해 의료진이 보다 신속하고 정밀한 의료서비스를 제공할 수 있도록 한다. 필립스 헬스케어 CT 엔지니어링의 워크스테이션 프로그램 매니저인 버룩 사바(Baruch Sabbah)는 “우리는 ‘브릴리언스 워크스페이스(Brilliance Workspace)’라는 기술을 보유하고 있는데, 이는 엔터프라이즈급의 실시간 이미지 프로세싱을 제공하는 CPU 집약적인 업무다”며 “네할렘 기반 워크스테이션에서 이 기술을 작동했을 때 기존 시스템에 비해 50% 성능향상 효과를 거두는 것으로 나타난다”고 평가했다.

● 독일 율리히 연구소(Forschungszentrum Julich)
독일 율리히 연구소는 헬름홀츠 연구협회 산하의 국책 연구기관으로, 건강, 정보, 에너지, 환경 분야에서 4200여명의 연구원이 활동하고 있다. 율리히 연구소는 기후 모델의 기초인 대기의 화학적 공정 이해에서부터 융합에너지, 신경과학, 생물 물리학, 나노시스템 및 소립자 분야에 대한 연구를 진행하며, 애플리케이션 성능이 높아질수록 높은 컴퓨팅 성능이 요구된다. 이 연구소의 노베르트 에이커(Norbert Eicker) 박사는 “HPC 애플리케이션 성능의 핵심은 메모리 대역폭과 입출력 성능이다. 인텔 제온 5500 시리즈는 양쪽 측면 모두를 확실하게 강화시킨다. 우리는 이 프로세서를 기반으로 차세대 다용도 슈퍼컴퓨터 쥬로파(JuRoPA)를 실행하기로 결정했다”고 밝혔다. (page_break)HPC·가상화 환경서 탁월한 성능
네할렘은 고성능 컴퓨팅(HPC: High Performance Computing)에 적합한 모델을 제공한다. HPC는 인체 발견, 우주, 기본적인 물질 구성 요소, 재난 및 기상 예측을 비롯한 다양한 과학 분야에서 최상의 성과를 지속적으로 추구하고 있으며, 초 당 1000조 번의 부동 소수 연산이 가능한 페타플롭급 기기를 요구한다.


제온 X5570, X5560, X5550 등 HPC 용 프로세서는 퀵패스 인터커넥트와 DDR 1333 MHz를 지원하는 3채널 통합 메모리 컨트롤러를 통해 플랫폼 대역폭을 향상시켰으며, 메모리 대역폭을 세 배 이상 강화시켰다.

HPC 환경에서 탁월한 성능을 보이는 네할렘은 병렬 프로세스 기능을 향상시켜 한 번에 더 많은 연산을 처리할 수 있다. 윈도우와 스케줄러의 수를 늘리고 코어 내의 다른 버퍼의 수도 증가시키는 방법으로 더 많은 명령을 수행한다. 또한 프로세서의 고성능을 위해 지원하는 분기예측 기능을 더욱 향상시켜 보다 정확한 예측이 가능하도록 한다. 또한 분기가 사용하는 정보를 캐시에 저장하며, 잘못 예측된 복귀 명령을 피할 수 있도록 한다.

프로세서 성능을 저하시키는 요인 중 하나인 ‘스톨(stall, 데드 사이클)’을 극복하기 위해 네할렘은 알고리즘을 보다 효율적으로 개선시켰다. 특히 멀티 스레드 소프트웨어 증가에 맞춰 더 빠르게 스레드 동기화를 지원해 스레드 기반 소프트웨어 성능향상을 꾀한다.

‘하이퍼-스레딩(HT)’이라고 불리는 이 기술은 기존의 펜티엄 시리즈에 적용된 기술이 한층 개선된 것으로, 단일 실행 코어가 두 개의 스레드를 동시에 실행할 수 있도록 한다. 예를 들어 멀티 코어 프로세서에서 동시 멀티 스레딩은 각 프로세서가 동시에 실행할 수 있는 전반적인 스레드의 가능한 수를 배가시킨다. 쿼드 코어 프로세서의 경우 최대 8개의 스레드를 동시에 실행할 수 있으며, 네할렘의 경우 큰 캐시와 큰 대역폭으로 HT의 장점을 극대화 할 수 있다.

캐시 기능을 보다 지능화하기 위해 최대 8MB 크기의 내장 공유 L3(최종 레벨) 캐시를 추가한 ‘스마트 캐시’를 지원한다. 모든 코어가 공유하는 캐시 이외에 내장 공유 L3 캐시를 통해 프로세서 코어에 대한 트래픽을 줄이면서 성능을 증가시킬 수 있다. 또한 네할렘은 XML 같은 효율적인 가속화된 문자열과 텍스트 처리 애플리케이션을 위한 7개의 새로운 애플리케이션 전용 가속기(ATA: Application Targeted Accelerator)를 추가했다.

이 기술은 새로운 문자열 및 텍스트 처리 명령을 제공해 문자열과 텍스트 처리 연산 성능을 향상시킨다. 예를 들어 XML 문자열과 텍스트를 더 높은 속도로 분석할 수 있도록 하며, 의미 구분, 토큰화, 정규 표현 평가, 바이러스 스캐닝 및 침입 탐지에 유용하다.

가상화 기능에서 네할렘이 제공하는 이점은 기업이 클라우드 컴퓨팅 환경을 구현할 때 비용절감과 안정성, 성능향상 등의 효과를 제공한다는데 있다. 네할렘의 가상화 기능은 각 파티션에서 별도의 운영체제와 소프트웨어를 실행할 수 있도록 컴퓨터를 분할해 하나의 컴퓨터가 여러 개처럼 동작하게 한다.

네할렘은 가상화 환경에서 소프트웨어 성능을 향상시키는 새로운 기능을 추가했으며, 메모리 유형 규격을 갖는 게스트 운영 체제에서 메모리 유형 규격을 지원하는 가상화 시스템에서의 호스트 운영 체제의 메모리 유형 규격과 일치시키기 위한 확장 페이지 테이블(EPT)을 지원한다. (page_break)통신 네트워크용 임베디드 솔루션 지원
인텔은 네할렘 프로세서와 함께 통신 네트워크에 활용되는 새로운 칩 시리즈 등 앞선 임베디드 프로세서로 기술을 선도하고 있다. 통신 및 임베디드 시장용으로 발표된 네할렘 프로세서는 유선전화 및 팩스와 같은 레거시 통신 인프라를 지원하며 4G와 홀로그래픽 통신 등의 기술을 구현한다.


통신용 임베디스 프로세서는 구식 텔레포니 애플리케이션을 결합하고, 통합·관리할 수 있으며, 공간 및 에너지 사용량을 줄여준다. 통신 시장을 타깃으로 고안된 버전인 L5518 및 L5508 모델은 통신 인프라, 보안, 스토리지, 의료 애플리케이션 용 블레이드 및 어플라이언스, 캐리어급 랙형 서버, 라우터 모듈과 해저 기술 등에 이상적인 저전력 옵션이 포함된다.

최근 부상하고 있는 10기가비트 이더넷(10GbE) 환경을 위한 인텔 82599 10GbE 컨트롤러는 인텔의 3세대 듀얼포트 10GbE 컨트롤러로, PCI 익스프레스 2.0을 지원한다. 이 새로운 컨트롤러와 네할렘 시리즈 플랫폼이 결합하면 가상화된 데이터센터 내 고대역폭 애플리케이션 지원에 필요한 성능을 제공할 수 있다.

10GbE 컨트롤러는 입·출력 가상화를 위한 하드웨어 최적화가 포함되며, 통합된 네트워킹을 지원한다. LAN, SAN, IPC 트래픽이 동일한 이더넷 네트워크를 공유할 수 있게 된다. 이 컨트롤러에는 SFP+ 어댑터를 위한 통합 PHY, LOM(LAN on Motherboard), 블레이드 서버 메짜닌 카드 디자인도 적용된다.

네할렘 플랫폼은 늘어가는 서버 통합과 가상화의 입·출력 수요를 충족시킬 수 있도록 이더넷 확장력을 더욱 높여준다. 보다 높은 프로세싱 파워와 새로운 로컬 메모리 아키텍처, 보다 빠른 PCI 익스프레스 2.0 IO 인터페이스 버스 등을 제공한다. 이 컨트롤러는 가상화된 서버 환경의 전반적인 시스템 성능을 향상시킬 수 있는 인텔 접속용 가상화 기술인 ‘인텔 VT-c’를 지원하며, IO 병목현상 감소, 작업량 증가, 대기시간 단축에 도움이 되는 하드웨어 최적화 기능이 포함된다.

또한 다양한 트래픽 유형들이 단일 이더넷 커넥션을 공유할 수 있도록 네트워크 인프라를 통합하기 때문에 데이터센터의 비용과 복잡성을 낮출 수 있다. 특히 FCoE(Fibre Channel over Ethernet) 환경에서 프로세싱과 연관된 CPU 오버헤드를 줄여주는 등 SoE(Storage over Ethernet) 최적화를 지원한다.

iSCSI 환경에서는 SAN 및 LAN 트래픽에서 전용 iSCSI 어댑터가 필요하지 않으며, 기존 이더넷 인프라를 공유할 수 있게 한다. iSCSI 원격 부팅으로 서버는 SAN에서 OS 이미지로 부팅할 수 있으며, 이는 서버 통합 및 가상화 뿐만 아니라 고집적 클러스터 서버에 유용하다. 인텔 82500 10GbE 컨트롤러에는 iSCSI 트래픽을 가속화하는 기능이 포함된다. 또한 제온 5500 프로세서 시리즈에는 시스템 성능에 미치는 영향은 최소화하면서 신속하고 효율적인 데이터 보전성 확인을 구현하는 CRC 명령어 세트가 내장된다. (page_break)인텔 프로세서, 그 혁명의 역사
‘무어의 법칙’은 ‘무어의 법칙’은 인텔의 공동 창업자인 고든 무어(Gordon Moore)가 1965년 “칩 한 개에 탑재되는 트랜지스터 수가 2년마다 두 배씩 증가하게 될 것”이라고 예측하면서부터 칩 개발 기술의 정설로 인식돼왔다. 무어의 법칙에 따라 칩 기술은 끊임없이 혁신돼왔으며, 인텔은 성능 및 전력 효율성 증진을 위해 프로세서에 탑재되는 트랜지스터 수를 기하급수적으로 증가시켰다.

펜티엄 프로 프로세서가 출시되기 전 인텔 아키텍처(IA) 기반의 서버는 전체 서버 시장의 10%에 불과한 75만대였다. 그러나 x86 서버용 펜티엄 프로가 출시되면서 IA 서버는 x86 서버의 대명사로 인정될 만큼 급속하게 퍼져나갔다.

현재 전체 서버 시장의 80%는 인텔 기술을 기반으로 하고 있으며, 국내에서는 IA 서버가 90% 이상 점유율을 차지하고 있다. 특히 인텔 네할렘 기술은 유닉스 서버와 견주어 전혀 손색없는 성능을 제공하고 있어 하이엔드 애플리케이션, HPC, 클라우드 컴퓨팅과 같은 신흥시장에서 크게 각광받고 있다.

● 최초의 PC용 프로세서는 ‘인텔 8088’
인텔 프로세서의 역사를 살펴보면 1971년 출시된 ‘4004’ 모델은 에니악(ENIAC)과 동일한 연산 능력을 지닌 프로세서였으며, 1979년에는 최초의 16비트 프로세서인 8086이 등장한다. 이어 출시된 8088은 IBM의 새로운 퍼스널 컴퓨터 사업부의 주문을 받으면서 IBM의 새로운 히트 상품으로 등장하게 된다.

처음으로 1μ대 공정을 기록한 286 프로세서는 1982년에 출시됐으며, 1985년 출시된 386 프로세서는 개인용 PC가 널리 보급되는데 크게 기여했다.

1990년대 인터넷의 개념이 등장하면서 연설, 음향, 필체 및 사진 이미지 등의 데이터를 컴퓨터에 내장시킬 수 있는 ‘펜티엄 프로세서’가 등장한다. 펜티엄 프로세서는 1993년 처음 출시됐으며, 64비트 외부버스를 지원했다. 2년 후인 1995년에 출시된 펜티엄 프로 프로세서는 다이내믹 익스큐션(Dynamic Execution)이라는 기능이 더해지면서 3D 가상화 및 인터렉티브 성능을 실행할 수 있는 혁신적인 기술발전이 이뤄졌다.

● 2000년대 나노기술 시대 본격 개막
2000년대는 나노기술 시대가 본격적으로 열리기 시작했으며, 2002년 출시된 펜티엄 M이 90나노 공정을 완성해 노트북과 같은 이동형 컴퓨터가 가능해졌다. 듀얼코어 디자인이 적용된 펜티엄 D, 모바일 아키텍처가 강화된 코어 2 듀어가 잇따라 발표됐으며, 2006년에는 하나의 다이에 4개의 코어가 장착되는 쿼드코어 프로세서가 등장했다.

2007년 출시된 제온 프로세서(코드명 펜린)는 마이크로아키텍처가 더욱 강화되며, 비디오, 이미징, 3D 콘텐츠를 지원하고, 성능과 전력효율성이 높아진다. 2008년에는 넷북의 기술진화를 가져온 센트리노 아톰 프로세서(코드명 실버손)이 등장했으며, 모바일 인터넷 디바이스(MID)와 임베디드, 디지털 헬스 시장에서 인텔의 위상을 더욱 높였다.

● 네할렘, 프로세서 역사상 제2의 혁명
‘코드명 네할렘’으로 발표된 최초의 제품인 코어 i7은 데스크톱용 프로세서로, 필요에 따라 성능 조절이 가능하고, 퍼포먼스 온 디맨드 기능을 강화시키고 데이터 작업량을 극대화하는 새로운 기술을 기반으로 구축됐다.
 
코어 i7 프로세서는 전력 소모량의 증가 없이 비디오 편집, 몰입형 게임 등 인터넷 및 컴퓨터 작업의 속도를 최대 40% 향상시킨다. 이 프로세서에는 동시 멀티스레딩이라고도 알려진 인텔 하이퍼쓰레딩(Hyper-Threading) 기술이 내장되며, 네 개의 프로세서 코어를 통해 여덟 개의 소프트웨어 스레드(threads)를 처리할 수 있다.

2009년 3월 발표된 서버용 제온 5500은 유닉스 시스템에 버금가는 성능과 가상화 기술, 저전력 구현 등을 통해 클라우드 컴퓨팅과 HPC, 다이내믹 데이터센터를 지원한다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.