apache 의 access_log 파일분석중
'test.html' 이라는 문자열이 들어간 부분의
ip 와 날짜만 출력하고 싶습니다. 물론 ip 중복은 제외 하구요.
egrep 'test.html' access_log | awk '{print $1}' | sort -u
위와 같이 하면 되긴 되는데 날짜가 빠지네요.
그래서 awk '{print $1}' 부분에 예를들어
'{print $1 $2 $4 $5}' 와 같이 바꿔보면 이상하게
통계숫자가 틀려집니다. ip 는 같은데 시간이 다를경우도
포함되므로 더 많아지겠죠... 결국 중복 ip 가 포함이 되는것이죠.
어떻게 하면 제가 원하는 결과를 정확히 얻을 수 있을까요?