- 로그인도 하지 않고, 글을 올렸군요. ^^ 익명사용자로 글이 등록되서 삭제도 안되네요... -
파싱해야할 XML파일이 있습니다. encoding은 UTF-8이구요.
그런데, 한글이 광 산...이런식으로 있네요.
이걸 어떻게 변환하고, 어떤 타입으로 받아야하나요?
숫자값이 각 글자의 유니코드 값입니다. 숫자값 뽑아내서 유니코드값을 UTF8 인코딩으로 변경하면 됩니다.
10진수 44305를 16진수로 변환하면 0xad11입니다. Unicode에서 0xad11번째 글자를 U+AD11 이렇게 적는데, '광'입니다.
10진수 49328을 16진수로 변환하면 0xc0b0입니다. Unicode에서 0xc0b0번째 글자를 U+C0B0 이렇게 적는데, '산'입니다.
Prentice님이 말씀하신 것은 알고 있습니다....만, 문자열에서 44305를 추출해서 바꿔주는 작업을 하나씩하는 방법말고 한꺼번에 바꿔주는 방법을 여쭙습니다.
libxml2를 사용해서 xml문서를 파싱할거구요. 인코딩 문제라면 iconv를 사용하면 될거 같은데, 이건 그 문제가 아니라 해결법을 찾고 있는중입니다.
Somewhere over the rainbow...
http://xmlsoft.org/html/libxml-parserInternals.html#xmlStringDecodeEntities
요거로는 해결이 안 되는 문제인가요? 6^^; 제가 프로그래밍에 무지해서 여쭤봅니다.
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
숫자값이 각 글자의 유니코드 값입니다. 숫자값
숫자값이 각 글자의 유니코드 값입니다.
숫자값 뽑아내서
유니코드값을 UTF8 인코딩으로 변경하면 됩니다.
10진수 44305를 16진수로 변환하면
10진수 44305를 16진수로 변환하면 0xad11입니다. Unicode에서 0xad11번째 글자를 U+AD11 이렇게 적는데, '광'입니다.
10진수 49328을 16진수로 변환하면 0xc0b0입니다. Unicode에서 0xc0b0번째 글자를 U+C0B0 이렇게 적는데, '산'입니다.
네...
Prentice님이 말씀하신 것은 알고 있습니다....만,
문자열에서 44305를 추출해서 바꿔주는 작업을 하나씩하는 방법말고 한꺼번에 바꿔주는 방법을 여쭙습니다.
libxml2를 사용해서 xml문서를 파싱할거구요.
인코딩 문제라면 iconv를 사용하면 될거 같은데, 이건 그 문제가 아니라 해결법을 찾고 있는중입니다.
Somewhere over the rainbow...
http://xmlsoft.org/html/libxm
http://xmlsoft.org/html/libxml-parserInternals.html#xmlStringDecodeEntities
요거로는 해결이 안 되는 문제인가요? 6^^; 제가 프로그래밍에 무지해서 여쭤봅니다.
댓글 달기