[해결] 리눅스 LANG=ko_KR.UTF-8 환경에서 euc_kr로 인코딩된 텍스트 파일을 어떻게 유니코드로 변환 하나요?
글쓴이: ikpil / 작성시간: 금, 2009/06/19 - 11:18오후
코드는 없어도 되고, 말로만 설명해 주셔도 되세요.
어떻게 했는가?
1. std::locale::global( std::locale( "ko_KR.UTF-8" ) ); 로 처리함
2. std::string 에 euc_kr로 인코딩된 를 밀어 넣음
3. std::string 에 있는 것을 mbstowcs 인코딩 하여 std::wstring 으로 밀어 넣음
결과는 어떤가?
1. 한글이 있는 이후 부터의 데이터가 없습니다 ..
abcdefg한글hijk 라는 문자가 있을 때, abcdefg?? 라고 되어 있고 나머지 뒷부분은 없습니다.
제가 무엇을 잘못 한 것인가요?
Forums:
std::locale::global(
std::locale::global( std::locale( "korean" ) );
으로 해도 결과는 똑같네요 ..ㅠ_ㅠ
http://www.ikpil.com
export LANG="korean" 으로
export LANG="korean" 으로 바꾸어도 똑같네요 무엇인가 잘못하고 있는거 같은데...
http://www.ikpil.com
보통은 iconv를 사용합니다만...
보통은 iconv를 사용해서 바꾸곤 하는데, iconv를 적용 못하는 경우인가요?
시스템 로케일은
시스템 로케일은 파일의 캐릭터셋 인코딩과는 상관이 없습니다.
iconv를 사용해서 인코딩하세요.
>iconv -f euc-kr -t utf-8 foo.txt > bar.txt
--->
데비안 & 우분투로 대동단결!
--->
데비안 & 우분투로 대동단결!
iconv 를 못쓰는
iconv 를 못쓰는 상황입니다. C++ 코드로 어떻게 못바꿀까요..
http://www.ikpil.com
iconv 무척 편하군요.
iconv 무척 편하군요. 인코딩 문제인제 왜 euc_kr 이 mbstowcs을 사용해서 변환이 안되는지가 큰 관건인제 모르겠네요 ...
http://www.ikpil.com
처리했습니다.
처리했습니다. setlocale(LC_ALL, "korean") 이라고 처리 하면 됩니다.
std::locale::global( std::locale( "ko_KR.UTF-8" ) ) 은 mbstowcs 에 영향을 미치지 않나 봅니다.
아참, 물론 언어팩 euc_kr이 설치 되어 있어야 합니다. 이것으로 해결 완료
여담,
.. 유니코드만 써야 한다고 생각 합니다 ....
http://www.ikpil.com
댓글 달기