> 뉴스 > 기획특집 > 구축사례
  • 트위터
  • 페이스북
  • 구플러스
  • 네이버밴드
  • 카카오스토리
     
빠르고 정확한 검색으로 무한정보 욕구 충족
디지틀조선일보 통합검색시스템 구축
2007년 11월 26일 00:00:00 데이터넷
빠르고 정확한 검색으로 무한정보 욕구 충족
다양한 전문 콘텐츠 제공 기반 ‘확보’ … 검색 속도·정확성 ‘만족’


지난 1995년 조선일보의 뉴미디어계열 자회사로 탄생한 디지틀조선일보(www.chosun.com)는 리얼타임 뉴스서비스, 포털화 전략, 동영상 서비스 제공 등으로 네티즌들의 무한한 정보욕구를 충족시키고 있다. 디지틀조선일보는 최근 뉴스 포털내의 대용량 데이터 콘텐츠에 대한 안정적이며 효율적인 검색서비스 제공 및 관리를 목적으로 다이퀘스트의 마리너2를 도입해 통합검색시스템을 새롭게 구축함으로써 더욱 빠르고 정확한 정보를 제공할 수 있는 기반을 마련했다.
I글·김나연 기자·grace@datanet.co.krI
I사진·김구룡 기자·photoi@naver.comI


웹2.0 기술을 바탕으로 사용자 맞춤형 뉴스 서비스 및 UCC를 기반으로 하는 인터넷 서비스를 제공하고 있는 디지틀조선은 다양한 언론사들의 뉴스를 모은 뉴스 뱅크(아카이브)를 추진하면서, 독자의 니즈에 부합하는 전문성 있는 기사를 제공하기 위해 중요한 콘텐츠를 안전하게 보존하고 있다.

다이퀘스트 마리너2 도입
모든 매체의 각종 인터뷰 및 심층 기획기사를 한꺼번에 볼 수 있는 아카이브 시스템 마련이라는 야심찬 계획을 구상하고 있는 디지틀조선일보는, 쿼리 분석 작업을 위한 언론사간 제휴 단계를 거치고 있다고 밝혔다.
먼저 일부 전문지와 체결한 제휴로 오는 연말쯤에는 심층기획기사 및 CEO 인터뷰 등 전문지 기사도 제공할 수 있다는 것이 디지틀조선일보 측의 설명이다. 이와 같은 양질의 콘텐츠 제공을 위해서 가장 중요한 요소가 바로 뛰어난 검색시스템의 확보라는 것은 두말할 나위가 없다.
지난 2000년 도입한 기존 검색엔진의 계약완료 기간과 맞물려 디지틀조선일보는 기본적인 성능을 갖춘 간단한 검색엔진을 선택했다고 밝혔다. 그러나 인터넷 사용자가 기하급수적으로 증가하고 현재 디지틀조선일보 하루 평균 방문자도 100만명을 기록하는 등 단순한 검색엔진으로는 사용자 요구를 만족시키기에 부족하다고 판단해, 다이퀘스트의 마리너2를 새로운 검색엔진으로 도입하게 됐다.
심인숙 디지틀조선 편집본부장은 “2006년 9월부터 본격적으로 차세대 통합 검색엔진 도입을 검토하기 시작했다. 다이퀘스트의 마리너2가 타 사이트에서도 우수한 성능을 인정받고 있을 뿐 아니라, 여러 가지 부가 검색기능 마련에도 손색이 없는 검색엔진의 안정성에 높은 점수를 줄 수 있었다”며 다이퀘스트 마리너2를 선택하게 된 이유를 설명했다.
이에 디지틀조선일보는 지난 2월부터 새로운 검색시스템 기획에 돌입해 지난 5월 마리너2 검색엔진 도입을 완료했고, UI 개선 및 콜렉션(뉴스, 동영상, 사진 등)을 새롭게 추가해 지난 9월에 2차 오픈을 성공적으로 마쳤다.
디지틀조선일보는 검색엔진을 개편하면서 ‘검색플러스’라는 이름으로 서비스 아이덴티티도 새로 교체했다. 기존의 ‘통합검색’은 조선일보만의 검색 밸류를 전달할 수 없었는데, 검색과 뉴스 등을 결합한 서비스 아이덴티티가 2차 개편과 함께 도입됐다.


다양한 검색옵션 제공해 편의성 향상
심인숙 편집본부장은 “검색속도의 성능 향상은 물론 여러가지 부가 검색기능을 제공할 수 있는 검색시스템을 구축하는 것이 관건이었다”며 “뉴스, 인물정보, 동영상 등의 대용량 콘텐츠를 보유하고 있는 조선닷컴의 지적 자산활용을 극대화 해 대표 뉴스 포털로서 자리매김할 수 있는 인프라 도입이 최우선 도전과제였다”고 검색엔진 도입 당시를 회상했다.
심 편집본부장은 “소스가 저장돼 있는 DB에서 검색 엔진으로 데이터를 전달하는 방식에 있어 시행착오도 많았지만, 협의점을 찾아가는데 큰 어려움은 없었다”고 덧붙였다.
디지틀조선일보는 사용자들이 가장 편리하고 빠른 방법으로 콘텐츠를 검색할 수 있도록 검색옵션을 다양하게 하는 방법에 가장 중점을 두고, 무엇보다 정확한 검색결과를 나타내고 누락되는 데이터가 없도록 준비했다.
검색엔진 마리너2를 도입한 디지틀조선일보는 각 서버간 비 동기식 검색처리 능력과 고효율의 검색DB 압축 기술을 적용해 방대한 문서들에 대한 대용량 처리기술로 600만건 이상의 문서검색도 안정적이며 빠르게 검색할 수 있게 했다.
또 이전에 비해 크게 향상된 검색엔진 관리도구는 시스템 모니터링, 에러 추적 기능 등(검색 서비스 중단의 손실 최소화)과 콜렉션 추가/삭제 관리, 유의어 등록, 정렬 결과 랭킹 조정, 프로세스/작업상태관리, 최근 색인 내역 확인, 색인상황조회 등 다양한 관리 기능을 제공한다.


실시간 증분색인 기능·속보 검색도 ‘OK’
디지틀조선일보는 무엇보다 빨라진 색인 작업 속도에 크게 만족한다고 밝혔다. 검색을 하기 위한 데이터를 만드는 작업인 색인 작업에 기존에는 이틀 정도 소요됐지만 마리너2 도입 후 3시간이면 충분히 색인 작업이 가능하게 됐다. 색인 속도를 단축시키고 향상된 압축 기술로 색인 DB 관리를 빠르고 효율적으로 할 수 있게 된 것.
또 기사를 검색하면 누락돼 나타나지 않는 기사도 있었는데 지금은 누락된 기사가 한건도 발견되지 않는다며, DB에 있는 모든 뉴스가 빠짐없이 색인됐기 때문이라고 큰 만족감을 드러냈다.
디지틀조선일보는 온라인 뉴스 사이트에서도 포털에서 제공하는 것과 같은 편리한 검색기능이 제공돼야 경쟁 사이트와 차별화 할 수 있다고 판단, 장문에 대한 검색이 가능한 ‘문장검색기능’을 도입했다. 또 실시간 증분색인 기능을 탑재, 분초를 다투는 속보성 기사가 주를 이루는 언론포털의 특성을 살려 새로 생성되거나 수정, 삭제된 뉴스들에 대한 검색결과를 즉각 반영하고 있다.
실시간 증분색인 기능은 문서가 저장돼 있는 저장소(보통 DBMS)의 문서내용과 검색을 위해 저장소에서 추출한 색인DB의 내용이 거의 일치하도록 해 문서의 변경, 삭제, 생성되는 일련의 변화를 이용자 검색결과에 반영하는 시간을 최소화 시키는 기능으로 마리너2만이 가지는 특장점이자 디지틀조선일보의 차별성으로 떠올랐다.
이 밖에도 뉴스상세검색기간에 ‘오늘만’을 추가, 매체별, 출처별 등 검색기능의 상세한 옵션을 제공함으로써 검색편의성을 크게 증진시켰다.

‘검색’과 ‘뉴스’ 결합한 신규 서비스 창출
심인숙 편집본부장은 “빠르고 정확한 검색, 사용자에게 편리한 검색옵션을 제공하기 위해 많이 고려했다. 이의 일환으로 조만간 ‘검색 개인화 서비스(가칭)’를 선보일 예정이다”고 밝혔다. 그는 “사용자가 특히 관심을 갖고 있는 키워드·기호에 맞춘 검색결과를 제공하고, 오픈 API 서비스를 제공하려고 준비하고 있다”고 덧붙였다.
검색과 뉴스를 결합시켜 다양한 서비스를 만들어 낼 수 있다는 판단으로, 디지틀조선일보는 오는 12월경 ‘검색 개인화 서비스(가칭)’를 기업고객을 대상으로 시작할 계획이다.
검색시스템의 안정적인 운영 및 관리가 보장됨에 따라, 오픈 API제공서비스와 개인화 검색 등의 웹2.0을 표방하는 고급형 사이트로 발전가능성을 확보하게 된 디지틀조선일보는 검색시스템의 자연어처리기능으로 문장검색을 활용한 ‘기사 내 간편검색(가칭)’ 도입도 고려하고 있다. 기사를 읽다가 검색을 요하는 내용이 있으면 현재는 검색창으로 다시 올라가서 검색을 해야 하지만, 앞으로는 그 자리에서 검색을 쉽게 할 수 있게 한다는 계획이다. 한편, 검색시스템 개편 후 꾸준히 증가하는 검색 이용량은 이용자로부터 사이트 신뢰도를 확보했다는 증거로, 디지틀조선일보의 새로운 비즈니스 창출 기반으로도 큰 역할을 하게 됐다.
심 편집본부장은 “전문포털에 비한다면 대응력이 부족할 수도 있겠지만, 뉴스에 관한한 사용자에게 최고의 서비스를 제공하는 매체로 확고하게 자리잡겠다. 디지틀조선일보가 계획중인 모든 신규 서비스에는 반드시 검색엔진을 기반으로 한다”고 치켜세웠다.


인터뷰/ 심 인 숙 | 디지틀조선일보 편집본부장

검색엔진으로 신규 서비스 창출영역 ‘무궁무진’




다이퀘스트 마리너2를 도입한 이유는.
지난 2000년 도입한 기존 검색엔진의 계약완료 기간과 맞물려 디지틀조선일보는 기본적인 성능을 갖춘 간단한 검색엔진을 선택했다고 밝혔다. 그러나 인터넷 사용자가 기하급수적으로 증가하고 현재 디지틀조선일보 하루 평균 방문자도 100만명을 기록하는 등 기존의 검색엔진으로는 사용자 요구를 만족시키기에 부족하다고 판단해, 다이퀘스트의 마리너2를 새로운 검색엔진으로 도입했다.
다이퀘스트의 마리너2가 타 사이트에서도 우수한 성능을 인정받고 있을 뿐 아니라, 여러 가지 부가 검색기능 마련에도 손색이 없는 검색엔진의 안정성을 높이 평가해 도입 결정을 내릴 수 있었다.

다이퀘스트 마리너2 도입 효과는.
검색시스템의 안정적인 운영 및 관리가 보장됨에 따라, 오픈 API 제공서비스, 개인화 검색 등 웹2.0을 표방하는 고급형 사이트로 발전가능성 확보하게 됐다.
검색시스템의 자연어처리기능으로 문장검색을 활용한 ‘기사내 간편검색(가칭)’ 도입을 고려하는 등 검색활용도 역시 높은 편이다.
검색 개편 후 꾸준히 증가하는 검색 이용량과, 방대한 문서들에 대해 우수한 검색성능 및 기능을 제공할 수 있어 이용자로부터 사이트 신뢰도를 확보했다.
이 밖에도 데이터 색인 성능이 크게 향상돼 빠르고 효율적인 색인 DB 관리가 가능해졌다.

향후 활용 계획은.
조만간 ‘검색 개인화 서비스(가칭)’을 선보일 예정이다. 사용자가 특히 관심을 갖고 있는 키워드·기호에 맞춘 검색결과를 제공하고, 오픈 API 서비스를 제공하려고 준비하고 있다.
검색시스템의 안정적인 운영 및 관리가 보장됨에 따라, 오픈 API 제공서비스와 개인화 검색 등 웹2.0을 표방하는 고급형 사이트로 발전가능성을 확보하게 돼 검색시스템의 자연어처리기능으로 문장검색을 활용한 ‘기사내 간편검색(가칭)’ 도입도 고려하고 있다.
한편, 검색시스템 개편 후 꾸준히 증가하는 검색 이용량은 이용자로부터 사이트 신뢰도를 확보했다는 증거로, 디지틀조선일보의 새로운 비즈니스 창출 기반으로도 큰 역할을 하게 됐다.
검색속도의 성능 향상은 물론 여러가지 부가 검색기능을 제공할 수 있는 검색시스템을 구축하게 돼 뉴스, 인물정보, 동영상 등 보유하고 있는 지적 자산활용을 극대화할 것이다. 이를 통해 최고의 서비스를 제공하는 뉴스 포털로 자리매김하겠다.
ⓒ 데이터넷(http://www.datanet.co.kr) 무단전재 및 재배포금지 | 저작권문의  

     

인기기사

 
가장 많이 본 기사
인사·동정·부음
전체기사의견(0)  
 
   * 200자까지 쓰실 수 있습니다. (현재 0 byte/최대 400byte)
   * 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
전체기사의견(0)
사명: (주)화산미디어 | 주소: 서울시 강남구 강남대로 124길 26 유성빌딩 2층 | 전화: 070-8282-6180 | 팩스: 02-3446-6170
등록번호: 서울아03408 | 등록년월일: 2014년 11월 4일 | 발행년월일: 2003년 12월 17일 | 사업자등록번호: 211-88-24920
발행인/편집인: 정용달 | 통신판매업신고: 서울강남-01549호 | 개인정보관리 및 청소년보호 책임자: 박하석
Copyright 2010 데이터넷. All rights reserved. mail to webmaster@datanet.co.kr