웹 로그 분석
상태바
웹 로그 분석
  • 승인 2004.11.12 00:00
  • 댓글 0
이 기사를 공유합니다

“분석하라. 그리하면 얻을 것이다”

비즈니스 의사결정에 결정적 도움 … 에러·문제 탐지 능력 필수

회사의 웹 사이트를 잘 알고 있다고 생각하는가? 단순히 방문객 수를 헤아리고 있다면 아니라고 대답해야 한다. 사이트 활동의 세부 사항들은 조직에서 보다 나은 비즈니스 결정을 내리는 데 도움이 될 수 있다. 즉 제품 공급을 계속해야 할지 중단해야 할지, 아니면 내부의 사용자와 고객을 위해 사이트를 보다 매력적이고 효율적으로 만들 수 있는 방법은 무엇인지 등을 결정하는 데 유용하다. 웹 로그를 가장 잘 활용할 수 있는 방법들을 알아보자.

웹 로그를 잘 활용할 수 있는 지식을 얻기 위해서는 수동으로나, 상용 웹 분석 툴을 이용하거나, 혹은 상용 서비스의 도움을 받아서 웹 로그를 분석해 볼 필요가 있다. 하지만 웹 로그의 정보 과부하와 로그 데이터를 해독하는 데 따르는 어려움을 잘 알고 몸을 사리는 관리자들도 있으며, 상당수는 데이터를 어떻게 활용하는지도 알지 못할 것이다.

상용 로그 분석 패키지 이용이 최선책
웹 로그 분석 소프트웨어를 사용하는 사람들이라 하더라도 여기서 최대한의 것을 꼭 얻어내란 법은 없다. 웹 사이트 관리용으로 로그 분석을 사용하는 데 대한 최근의 컨퍼런스에 참가한 200명의 웹 관리자들이 자신들의 웹 서버가 사이트에 대한 활동을 로깅하도록 구성됐다고 말했다. 이들 중 약 절반은 상용 소프트웨어를 이용해 로그 파일 데이터를 분석하고 있으며, 1/4이 매주, 혹은 매일 분석을 한다고 답했다. 하지만 그러한 결과물들을 기반으로 어떠한 행동을 정기적으로 취한다는 관리자는 두 명에 불과했다. 그렇다면 로깅을 하고 사이트의 활동을 분석하는 이유는 대체 무엇인가?
웹 분석은 그럴만한 가치가 있다. 예를 들어 몇 달 간 회사의 웹 트래픽을 분석해 온 전자 기기 유통 중소업체는 스마트카드와 같은 보안 제품쪽의 관심이 증가한 것을 목격했다. 이에 이 회사는 보안 제품에 대한 마케팅 활동을 시작하고, 몇 개월 안에 예전에는 관심을 받지 못했던 부문에서 막대한 매출 상승을 목격했다.
다음은 우리가 시러큐스 대학에서 웹 로그를 분석한 방식이다. 첫째, 우리는 로그 파일 업데이트를 실시간으로 보여주는 ‘tail -f access_log’를 이용해 우리의 아파치 웹 서버들 가운데 하나로 텔넷을 했다. 이것은 많은 데이터를 제공했지만, 기본적인 분석밖에는 하지 못했다. 서버를 두드리는 트래픽을 보면서 우리는 사용자들이 에러를 경험하는지, 그리고 외부 웹사이트나 검색 엔진에 의해 우리 사이트가 조회가 됐는지 여부를 파악할 수 있었다. 사용자가 검색 엔진에 의해 조회가 되면, 우리는 어떤 것인지 뿐만이 아니라 이들이 어떤 키워드를 사용하는지도 알 수가 있었는데, 이것은 조직에서 마케팅이나 콘텐츠 관리를 할 때 도움이 될 수 있는 정보다.
텔넷 화면을 보지 못하는 처지일 수도 있는데, 이럴 때 심도 깊은 트래픽 분석을 얻을 수 있는 최선의 방법은 상용 로그 분석 패키지를 이용하는 것이다.

건초더미에서 바늘찾기
대부분의 중형급, 혹은 대형 조직들은 데이터베이스로부터 정보를 만들어 내는 역동적인 웹 사이트를 구축하고 있다. 불행히도 이렇게 되면 다음과 같이 사이트의 URL들이 비슷해 보일 수 있기 때문에 사용자 행동을 분석하기가 더 힘들어진다.

www.mydomain.com/products.aspx?productid=20
www.mydomain.com/products.aspx?productid=21

대부분의 로그 분석 소프트웨어는 이런 URL들을 하나의 페이지(products.aspx)로 처리하며, 제품들이 실제로 보여지는 것을 가리켜주는 추가 패러미터는 무시한다(product id=20 과 productid=21). 패러미터를 지정할 수 있게 해주는 로그 분석 소프트웨어를 선택해야만 전체 질의 문자열을 기반으로 한 보다 상세한 보고서를 얻게 될 것이다.
예를 들어 넷아이큐의 인기 있는 웹트렌즈(WebTrends) 분석 툴에서 고급 사양 관리 항목에 있는 ‘URL Paramater Analysis’ 탭은 페이지 콘텐츠의 특정 항목까지 내려갈 수 있게 해준다. 페이지 이름(products.aspx)과 패러미터 이름(productid)을 주면 툴이 특정 제품 페이지가 뜬 횟수 등과 같은 특정 결과를 패러미터 분석 보고서로 제공한다. 그런 다음에는 사이트에서 가장 많이, 혹은 가장 적게 요청된 제품 등과 같이 보다 유용한 정보를 파악할 수 있다. 패러미터를 설정할 때는 번역 파일을 이용할 수 있는데, 이런 상황에서 이 파일은 이름과 ID 번호를 상호연관시켜줄 것이다. 즉 예를 들어 product ID 20은 widget1이고 product ID 21은 widget 2라는 식이다.
그러나 웹트렌즈는 패러미터를 전체 경로 분석의 일부로 보지 않는다. 패러미터가 미치는 영향은 패러미터 분석 보고서에서만 보여진다. 이것은 하나의 시작이긴 하지만, 이런 패러미터를 예를 들어 출입과 경로 분석 보고서에서도 사용한다면 더 유용할 것이다.

사용자와 클라이언트가 웹 사이트를 통과해 가는 경로를 분석해 보면, 방문객들이 언제나 사이트에 홈페이지부터 들어와서 찾는 정보를 찾은 후에 나가는 게 아니라는 사실을 알게 될 것이다. 대신 이들은 홈페이지의 특별 코너 등과 같이 보다 전략적이라고 생각되는 정보를 우회해 가는 경로를 선택하는 경우가 많다.
사용자들이 이것을 내비게이팅하고 사용하는 방식을 변경하기 위해 사이트를 개조할 수 있다. 예를 들어 한 교육적인 질문/답변 서비스 업체에서는 자사 직원이 처리할 수 있는 것보다 더 많은 질문을 받고 있었다. 경로 분석을 통해 사이트 방문객들이 질문 양식을 찾는 방식을 알게 된 후, 이 회사의 웹 관리자는 ‘질문하기’ 링크를 보다 눈에 덜 띄는 곳으로 옮겨놓았으며, 그 후 질문의 양은 금방 줄어들었다(수신 질문이 더 많기를 바랄 때는 이 페이지를 다시 홈페이지로 링크시켜둘 수도 있었다).

5%의 법칙
대부분의 로그 분석 제품에는 어떠한 형태의 경로 분석 보고가 함께 한다. 로그 분석에 있어서의 경험을 바탕으로, 필자는 입장 페이지용으로 5%의 법칙을 즐겨 이용하고 있다. 즉 웹 사이트로 가는 방문객의 5% 이상이 특정 페이지를 통해 들어오면(예를 들어 제품 페이지에서부터), 그 페이지는 홈 페이지만큼이나 중요하게 생각한다는 것이다. 따라서 이 페이지를 역동적인 콘텐츠와 특집 등으로 장식할 수 있다. 5%의 법칙은 나가는 페이지에도 또한 적용되어 사용자들을 사이트에 좀더 오래 붙잡아두고 더 많은 구매를 하도록 부추기거나 추가 정보를 찾도록 할 수 있다.
실제로 대부분의 방문객들은 불과 수 분 동안 머무를 뿐 제품을 구입하는 경우는 거의 없다. 출구 페이지 분석을 검토해 보고 방문객이 어디서 웹 사이트를 빠져나가는지를 파악해 보라. 이것이 제품 분류가 나와 있는 페이지처럼 의도한 목적지로 생각하는 페이지가 아니라 어떤 제품도 보여주지 않는 페이지라면, 페이지의 아키텍처나 콘텐츠를 바꿔 이들의 방향을 바꿀 수 있다.
출구 페이지의 콘텐츠가 너무 길거나 너무 짧은 것일수도 있고 어쩌면 지루해서일 수도 있다. 잘못된 링크가 있거나 열리는 데 너무 오래 걸리는 이미지가 있을 수도 있다. 유용성 조사를 실시해 방문객이 왜 특정 페이지에서 빠져나가는지를 알아볼 수도 있지만, 이것은 값이 비싸고 시간 소모적이다. 좋은 소식은 사이트에 변경을 가하면 사용자 행동에서 즉각적으로 그 결과를 볼 수 있다는 것이다.
웹트렌즈는 패러미터 분석과 경로 분석을 별도로 취급한다. 따라서 입구와 출구 페이지를 기반으로 유용한 결과를 확인하기 위해서는 보고서의 전체 URL(질의 문자열 등)을 보여주는 옵션을 웹트렌즈에서 켜야 한다. 우리는 보고서에서 ASP 확장자에 대한 전체 질의 문자열을 보여달라고 ASP 확장자 생략 URL에서 디폴트 옵션을 바꿈으로써 이렇게 했다.
그런 다음 경로 분석(출입 페이지 보고서 포함)에는 보다 나은 관리 결정을 할 수 있게 도와주는 상세한 정보가 있어야 한다. 그 대신 가끔씩 전체 질의 문자열이 번역을 하지 않을 수도 있다. 예를 들어 웹트렌즈는 www.mydomain. om/roster.asp?playerid=1253&sport=189&roster=143과 같은 보고서의 패러미터는 번역할 수 없다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.