웹로그 분석에 대한 표준이 있습니까?

googling의 이미지

안녕하세요.

얼마전에 다음과 같은 과제를 할당받았습니다.

"우리사이트의 공식적인 접속자수,페이지뷰 등을 조사해서 마케팅 부서에서 참고할 수 있도록 준비하세요."

물론, 지금도 analog 를 이용해서 웹로그 분석이 되고 있기는 하지만, Google Analytics 에서 보여주는 값과 순수하게 우리 웹서버에서 생성된 웹로그를 분석한 값과 차이가 만만치 않게 나더군요.

그래서, analog 외에 많이 사용하는 웹로그 분석툴(webalizer, awstats) 을 이용해서 분석한 자료와의 차이가 얼마나 나는지 확인을 해보았습니다.

다음은 3월 20일에 생성된 웹로그 자료를 위 3가지 툴로 분석한 결과치 입니다.

awstats			analog					webalizer
-----------------------------------------------------------------------------------------------------
접속자수 : 24559		접속한 고유한 호스트수 : 25199			총개별사이트 : 25627
(uniq visitors)		(Distinct hosts served)			(Total Uniq Sites)
 
접속회수 : 32276							전체 Visits : 60974
(number of visits)							(Total Visits)
 
읽은페이지 : 1236970	성공한 페이지 요청 건수 : 1189624		전체 Pages : 1062591
(Pages)			(successful requests for pages)		(Total Visits)
 
조회수 : 1378749		성공한 요청건수 : 1399933			총 히트수 : 1452643
(hits)			(successful requests)				(Total Hits)
 
전송량 : 32.69GB		전송데이터량 : 33.79GB			총 KByte : 35442681
(Bandwidth)		(Data transferred)				(KBytes per Day)

'각 로그분석 프로그램의 환경화일에 따라서 차이가 나는 부분이겠지' 라고 생각하려고 했지만, 도대체 웹로그 분석툴에서 사용하는 용어나 값들이 차이가 나는 이유는 무엇일까.. 이 부분에 대한 표준용어, 그리고 접속자수, 페이지뷰 에 대한 기준은 정해져 있는지.. 등등에 대한 의문이 생겨났습니다.

RFC 에 이러한 부분이 명시되어 있는지 찾아보았지만.. RFC2616 에는 없는것 같았습니다.

규모가 큰 회사들이 공식적으로 발표하는 '우리 회사의 일일 페이지 뷰는 xxxx 이고, 방문자수는 xxx 다' 라고 말할수 있는 근거는 도대체 어떤 기준입니까?

여러분은 어떻게 생각하십니까?