[해결] 리눅스 LANG=ko_KR.UTF-8 환경에서 euc_kr로 인코딩된 텍스트 파일을 어떻게 유니코드로 변환 하나요?

ikpil의 이미지

코드는 없어도 되고, 말로만 설명해 주셔도 되세요.

어떻게 했는가?
1. std::locale::global( std::locale( "ko_KR.UTF-8" ) ); 로 처리함
2. std::string 에 euc_kr로 인코딩된 를 밀어 넣음
3. std::string 에 있는 것을 mbstowcs 인코딩 하여 std::wstring 으로 밀어 넣음

결과는 어떤가?
1. 한글이 있는 이후 부터의 데이터가 없습니다 ..
abcdefg한글hijk 라는 문자가 있을 때, abcdefg?? 라고 되어 있고 나머지 뒷부분은 없습니다.

제가 무엇을 잘못 한 것인가요?

ikpil의 이미지

std::locale::global( std::locale( "korean" ) );
으로 해도 결과는 똑같네요 ..ㅠ_ㅠ

ikpil의 이미지

export LANG="korean" 으로 바꾸어도 똑같네요 무엇인가 잘못하고 있는거 같은데...

zz181321의 이미지

보통은 iconv를 사용해서 바꾸곤 하는데, iconv를 적용 못하는 경우인가요?

kirrie의 이미지

시스템 로케일은 파일의 캐릭터셋 인코딩과는 상관이 없습니다.
iconv를 사용해서 인코딩하세요.

>iconv -f euc-kr -t utf-8 foo.txt > bar.txt
--->
데비안 & 우분투로 대동단결!

--->
데비안 & 우분투로 대동단결!

ikpil의 이미지

iconv 를 못쓰는 상황입니다. C++ 코드로 어떻게 못바꿀까요..

ikpil의 이미지

iconv 무척 편하군요. 인코딩 문제인제 왜 euc_kr 이 mbstowcs을 사용해서 변환이 안되는지가 큰 관건인제 모르겠네요 ...

ikpil의 이미지

처리했습니다. setlocale(LC_ALL, "korean") 이라고 처리 하면 됩니다.
std::locale::global( std::locale( "ko_KR.UTF-8" ) ) 은 mbstowcs 에 영향을 미치지 않나 봅니다.

아참, 물론 언어팩 euc_kr이 설치 되어 있어야 합니다. 이것으로 해결 완료

여담,
.. 유니코드만 써야 한다고 생각 합니다 ....

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.