아래와 같은 코드로 되어 있는 데이터를 받았는데요. 한글인 것 같습니다.
"\352\265\277 \355\225\240\353\247\214\355\225\250"
이게 어떤 한글 인코딩 방식인지 혹시 아시는 분 있으시면 알려주세요.~!!
감사합니다.!!!~~
\352 같은 표현은 8진수 352 = 16진수 0xEA = 234를 뜻합니다. 그냥 UTF-8 환경에서 python 실행시켜서,
>>> print "\352\265\277 \355\225\240\353\247\214\355\225\250" 굿 할만함
...이렇게 나오네요.
EUC-KR 쓰는 환경에서는, 문자열을 화면에 그대로 뿌리면 알수없는 문자들이 나오고 문자열을 UTF-8로 간주하여 EUC-KR로 변환해주면 제대로 한글로 나옵니다.
$ locale | head -1 LANG=C.eucKR $ printf '\352\265\277 \355\225\240\353\247\214\355\225\250' 援??좊쭔?? $ printf '\352\265\277 \355\225\240\353\247\214\355\225\250' | iconv -f UTF-8 -t EUC-KR 굿 할만함$
UTF-8 쓰는 환경에서는 변환없이 화면에 뿌려도 제대로 나옵니다.
$ locale | head -1 LANG=ko_KR.UTF-8 $ printf '\352\265\277 \355\225\240\353\247\214\355\225\250' 굿 할만함$
다 되는 것은 아니지만,
$ printf "\352\265\277 \355\225\240\353\247\214\355\225\250" | file - /dev/stdin: UTF-8 Unicode text, with no line terminators
역시.. 다 되는 것은 아니지만, python chardet 으로...
$ echo "import chardet; print chardet.detect('\352\265\277 \355\225\240\353\247\214\355\225\250'); " | python - {'confidence': 0.93812499999999999, 'encoding': 'utf-8'}
감사합니다.!!!!!!~^^
권위를 의심할 것,어긋남을 존경할 것,자리잡기를 거부할 것,항상 자신을 재창조할 것 - MIT 미디어랩 -
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
...
\352 같은 표현은 8진수 352 = 16진수 0xEA = 234를 뜻합니다.
그냥 UTF-8 환경에서 python 실행시켜서,
>>> print "\352\265\277 \355\225\240\353\247\214\355\225\250"
굿 할만함
...이렇게 나오네요.
UTF-8 인코딩된 문자열입니다
EUC-KR 쓰는 환경에서는,
문자열을 화면에 그대로 뿌리면 알수없는 문자들이 나오고
문자열을 UTF-8로 간주하여 EUC-KR로 변환해주면 제대로 한글로 나옵니다.
UTF-8 쓰는 환경에서는 변환없이 화면에 뿌려도 제대로 나옵니다.
다 되는 것은 아니지만,$ printf
다 되는 것은 아니지만,
역시.. 다 되는 것은 아니지만, python chardet 으로...
감사합니다.!!!!!!~^^
감사합니다.!!!!!!~^^
권위를 의심할 것,어긋남을 존경할 것,자리잡기를 거부할 것,항상 자신을 재창조할 것 - MIT 미디어랩 -
댓글 달기