[질문] access.log 에서 한글 페이지 접근 로그 작성시에...
글쓴이: mainyh / 작성시간: 금, 2003/03/14 - 6:44오후
안녕하세요.
apache 버전은 1.3.27 로 컴파일 후에 한글 페이지(예:한글페이지.htm)
에 접근 하면 로그가 이상한 영문으로 깨어져서 나옵니다.
정상 출력시 - - [14/Mar/2003:17:32:09 +0900] "GET /image4/bottom_line.jpg HTTP/1.1" 200 3491)
이런 식으로 나와야 할 부분이 GET 다음에 한글페이지.htm이 출력될 부분에 u7801%u9090%u6858%ucbd 이런식으로
깨져서 출력됩니다.
이 문제를 해결하기 위해 갖은 고생끝에 1.3.19 mod_log_config.c 를 이용해 컴파일을 하면 정상적으로 로그가 출력되는 것을 확인했습니다.
궁금한 점은 왜 이런 문제가 발생하는 건가요? 1.3.27에 있는 mod_log_config.c 가 1.3.19와 다른 점은 무엇인가요?
프로그래밍도 전혀 모르고 리눅스도 이제 시작하는 거라 어렵게 설명해 주시면 이해를 못합니다. ^^;
쉽게 설명해 주시면 감사하겠습니다~
Forums:
자세히 보지 않아서 모르겠으나, 한글 URL이 다른 형태로 인코딩 되는
자세히 보지 않아서 모르겠으나, 한글 URL이 다른 형태로 인코딩 되는 것 같습니다. 얼핏 보아서는 유니코드 같네요. 영어권에서 제작된 프로그램들 가운데에 한글과 같은 2바이트 문자를 그와 같은 방식으로 표현하는 경우가 많습니다.
원래 URL에는 US-ASCII이외의 코드는 없습니다. 한글 표시를 위해
원래 URL에는 US-ASCII이외의 코드는 없습니다. 한글 표시를 위해서 그런 표현 방식을 사용할 수 있는데 uXXXX(x는 16진수)로 되어 있는걸 보면 유니코드로 표현하는 것 같군요.
첫번째는 URL에 한글이 들어가지 않도록 하는 것이 가장 좋고, 두번째는 로그를 적당한 유니코드 변환기를 사용해서 한글을 euc-kr로 복구할 수 있을 겁니다. 오류라고 보기는 조금 어렵네요(아예 엉뚱한 인코딩으로 만드는 것이 아니라면)
--
익스펙토 페트로눔
댓글 달기