RSS를 wget으로 페이지를 다운받아서 보니까 한글대신 다음과 같은 문자열이 길게 있더군요
(XML선언에 보면 로케일은 일단 UTF8이라고 나옵니다.
그리고 자동변환을 막기위해서 ;,<,>, 앞에 공백을 넣었습니다)
< title >정 ;의 ;란 ; ...... < /title >
물론 파이어폭스에서 그 RSS페이지를 열어보면, 제대로 글자가 잘 나옵니다.
대체 저런문자를 일반문자로 정상적으로 가져오려면 어떻게 해야할까요?
iconv로 바꿀려고 해도, 대체 어떻게 바꿔야 할지 몰라서 고민이에요 (정확한 로케일(?) 옵션(?) 을 모르니)
(어짜피 결과만 얻으면 되니까, 어지간하면 직접 코딩안하고 하려고요)
혹시 조금이라도 아시는분이 계시면 도움을 좀 주세요.