[완료] c/c++ 한글 처리 관련질문..
글쓴이: paek1ju / 작성시간: 일, 2011/09/04 - 11:33오전
안녕하세요.
지인을 도와 장애인용 어플의 영문 키보드를 한글 키보드화를 하고 있는 사람입니다.
한글 처리가 생각 보다 어렵내요. 우선 기본적인 것이 이해가 안가더라구요..
'ㄱ' 한자를 처리하는 코드에서요. 'ㄱ' 을 getchar로 입력받아 프린트 해보니
227, 132, 177 이렇게 3 바이트의 숫자로 이루어져 있더라구요.
해서 아래와 같이 테스트를 해보았는데요. 결과가 이해가 안갑니다..ㅜㅜ
'ㄱ' 을 처리하기위해 3바이트의 코드를 쓰는 것은 이해가 가는데요.
c++ string으로 'ㄱ'을 입력해서 같은 방식으로 각 한 바이트를 출력해보면
이상한 값이 나옵니다..
int i = 0; /****************************************************************************************/ int temp[64]; memset(temp, 0, sizeof(temp)); // "ㄱ" 을 int로 입력 temp[0] = 227; temp[1] = 132; temp[2] = 177; for (i=0; i < 3; i++) { printf("%c", temp[i]); // "ㄱ" 출력 } printf("\n"); for (i = 0; i < 3; i++) { printf("%d\n", temp[i]); // "ㄱ" 을 int로 출력 } /****************************************************************************************/ /****************************************************************************************/ const char *ctemp; string str ("ㄱ"); printf("str size %d\n", (int)str.size()); // string을 char로 변환 ctemp = str.c_str(); for (i = 0; i < str.size(); i++) { printf("%c", ctemp[i]); // "ㄱ" 출력 } printf("\n"); for (i = 0; i < str.size(); i++) { printf("%d\n", ctemp[i]); // "ㄱ" 을 int로 출력 } /****************************************************************************************/ >>>> 결과 ㄱ 227 132 177 str size 3 ㄱ -29 -124 -79
분명 제가 뭐를 모르고 있는 것 같습니다.
작업하는 코드가 string 으로 되어있고 이를 한글화 하기 위해 wstring으로 작업하고 있는데요.
기본 적인것이 이해가 안가니 영 진도를 못나가고 있습니다.
조언을 부탁드립니다.
Forums:
이상한 값이 아니고, 둘다 같은 값입니다. 정확히
이상한 값이 아니고, 둘다 같은 값입니다. 정확히 말하자면, 비트표현이 같습니다.
1바이트로는 부호없이는 0~255, 부호가 있으면 -125~125의 범위를 나타낼수 있는데,
앞에결과는 부호없이 출력한 결과고, 뒤의 결과는 부호를 가지고 출력한 결과입니다.
맨앞의 첫비트를 숫자로 처리할지, 부호비트로 처리할지의 차이입니다.
두개 빼보세요. 셋다 256이 나옵니다.
보통 인코딩된 raw data에 대해서는 부호는 의미가 없기 때문에 unsigned char를 많이 이용합니다.
안녕하세요. 답변 감사합니다. 네 그렇군요. 개발
안녕하세요. 답변 감사합니다. 네 그렇군요. 개발 경험 오래되어도 아직도 가야할 길이 머네요..^^
xylosper 님 감사합니다.
댓글 달기