리눅스상에서 한글인식문제...
글쓴이: daphne / 작성시간: 화, 2003/11/11 - 10:40오전
인터넷상에서 웹문서를 긁어와서 태그를 제거하고 한글로 되어 있는 내용들을 읽어들일려고 하는데 이 한글부분이 인식되지 않는데 무슨 이유인지 모르겠습니다. 그렇다고 다시 그 내용들을 모두 타이핑할수도 없는 입장입니다. 직접적인 원인이나 리눅스 운영체제상에서 한글을 어떻게 사용하는지 전문가님들의 조언 부탁드리겠습니다. 좀더 진보적인 질문을 해야 하는데 죄송합니다. 읽어주셔서 감사.. ^^;;
Forums:
어떤형태로 한글을 추출하는지에 대한 언급이 미진하군요.프로그램을 직접
어떤형태로 한글을 추출하는지에 대한 언급이 미진하군요.
프로그램을 직접 작성해서 읽어들인다는 것인지 script를 이용해서 읽어들인다는 것인지...
또한 한글부분을 인식안된다고 한부분도 명확하질 않습니다.
글씨가 깨져서 보인다거나 아예 없어진다거나하는 지문이 없이 그냥 인식만 안된다고
하면 무엇을 어떻게 하라고 설명하기 힘듭니다.
만일 프로그램으로 만들었다면 영문페이지를 먼저 Test해 보세요.
만일 영문 페이지도 데이터를 추출하지 못한다면 프로그램을 잘못 작성한것일
테니까요...
대부분 프로그램을 잘못 작성한경우 데이터를 추출하지 못하는 일이 발생하죠.
P.S. : 이질문은 이쪽보다는 프로그램 질문/답란에 더 적합한질문같습니다.
또한 질문을 올릴때는 최소한 컴파일 환경과 잘 안된다고 생각되는 루틴정도는
공개를 하셔야 더 많은 도움을 얻을 수 있습니다.
------------------------------
좋은 하루 되세요.
댓글 달기