'똠방각하'가 이상하게 변환 / iconv로 EUCKR -> UTF8 변환할 때.
글쓴이: purewell / 작성시간: 화, 2006/04/11 - 6:17오후
char original[] = "가나다라 똠방각하 만만세!! ABC"; // EUCKR char* iptr(original); size_t isize(sizeof(original)); char target[isize*3+1]; size_t osize(sizeof(target)); // iconv 초기화 생략 iconv(iv, &iptr, &isize, &optr, &osize); // 에러 없음. printf("%s", optr);
결과 : 가나다라 c방각하 만만세!! ABC
ㅡ_-)a 뭐가 잘못된거죠?
Forums:
자문자답
자문자답입니다.
원본이 EUCKR이 아니라 CP949였습니다. 쀍!
----------------------------------------
언제나 맑고픈 샘이가...
http://yubink.com - 강아지 필요하세요?
http://purewell.biz - 헙!!
_____________________________
언제나 맑고픈 샘이가...
http://purewell.biz
저는 구분하지 않고
저는 구분하지 않고 가끔 썼었는데..
낭패볼뻔 했네요..ㅎㅎ
먼저 알게 된 것을 알려주는 것은 즐거운 일이다!
http://hangulee.xo.st
----
먼저 알게 된 것을 알려주는 것은 즐거운 일이다!
http://hangulee.springnote.com
http://hangulee.egloos.com
C방각하라.. ;; 무슨
C방각하라.. ;;
무슨 욕 변환기 돌린듯하네요. ^^;;
___________________
한글을 사랑합니다.
-----------------
한글을 사랑합니다.
항상
항상 궁금했던건데....
cp949(UHC)가 euc-kr의 합집합이라고 보면 되는걸까요?
iconv -f cp949 혹은 vim 에서 set fileencodings=ucs-bom,utf8,cp949
이런식의 지정이 euc-kr에 대해서도 항상 안전한건가요?
--
마잇
--
마잇
CP949에서는 똠 자를 처리 못하나 보죠?
CP949에서는 똠 자를 처리 못하나 보죠?
캐릭터셋때문에 점점 머리가 꼬이네요.
CP949 가 euc_kr 인줄 알았는데.. 흑...
무인도에 갇힌다면 당신이 가지고 갈 세가지는?
원본이 cp949 인데
> CP949에서는 똠 자를 처리 못하나 보죠?
원본이 cp949 인데 euc-kr로 착각해서
cp949 -> utf-8 이렇게 변환해야 할 것을
euc-kr -> utf-8 이렇게 변환하려고 시도해서 그런 문제가 생긴게 아닐까요?
마잇님께... cp949 는
마잇님께...
cp949 는 euc-kr 에 대한 하위 호환성을 가집니다 :) 그렇기 때문에 euc-kr 로 작성된 문서를 cp949 로 취급하는건 문제가 되지 않습니다. (반대의 경우엔 문제가 생길 수 있습니다)
---
오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...
http://mytears.org ~(~_~)~
나 한줄기 바람처럼..
오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...
http://mytears.org ~(~_~)~
나 한줄기 바람처럼..
답글
답글 감사합니다.
UTF-8로 기본으로 읽기 쓰기로 하고,
넘어오는 데이터 읽기는 cp949로 읽고,
윈도우즈와의 데이터 호환이 필요한곳은 euc-kr로 써서 주고,
euc-kr로 표현 못하는 문자를 입력해야 하는 경우는 cp949로 써서 준다.
(vim에서 '똠' 입력하고 fileencoding=euc-kr로 저장을 시도 하면 에러를 내주네요)
이 정도 전략이면 현명할까요 : )
--
마잇
--
마잇
7bit ASCII 문서를
7bit ASCII 문서를 UTF-8로 취급해도 괜찮은 것과 비슷한 건가요
댓글 달기