웹서버의 로그를 통계적으로 분석하는 프로그램을 만들고 있습니다.
서버내의 URL들간이 통계를 위해서 트리를 이용하고자 하는데, 각 노드에는
디렉토리나 파일이름이 들어가서 계층적 구조를 이루고, 이런 구조는 여러가지 통계적 접근이 가능하게 하거든요..
문제는 각노드들을 서칭할때 스트링을 통째로 비교하는것 보다 해쉬를 사용하는게(키값을 순서적으로 배열해서 일종에 소팅으로 놓고 접근합니다. 키값보다 커버리면 그위치에서 바로 노드를 만들어 버리죠..)좋을것 같아서요. 아무래도 인덱싱에서 빠르니깐요..