[완료] c/c++ 한글 처리 관련질문..

paek1ju의 이미지

안녕하세요.

지인을 도와 장애인용 어플의 영문 키보드를 한글 키보드화를 하고 있는 사람입니다.

한글 처리가 생각 보다 어렵내요. 우선 기본적인 것이 이해가 안가더라구요..

'ㄱ' 한자를 처리하는 코드에서요. 'ㄱ' 을 getchar로 입력받아 프린트 해보니

227, 132, 177 이렇게 3 바이트의 숫자로 이루어져 있더라구요.

해서 아래와 같이 테스트를 해보았는데요. 결과가 이해가 안갑니다..ㅜㅜ
'ㄱ' 을 처리하기위해 3바이트의 코드를 쓰는 것은 이해가 가는데요.
c++ string으로 'ㄱ'을 입력해서 같은 방식으로 각 한 바이트를 출력해보면
이상한 값이 나옵니다..

         int i = 0;
 
	/****************************************************************************************/
	int temp[64];
 
	memset(temp, 0, sizeof(temp));
 
	// "ㄱ" 을 int로 입력
	temp[0] = 227;
	temp[1] = 132;
	temp[2] = 177;
 
	for (i=0; i < 3; i++) {
		printf("%c", temp[i]); // "ㄱ" 출력 
	}
	printf("\n");
 
	for (i = 0; i < 3; i++) {
		printf("%d\n", temp[i]);  // "ㄱ" 을 int로 출력
	}
	/****************************************************************************************/
 
	/****************************************************************************************/
	const char *ctemp;
	string str ("ㄱ");
 
	printf("str size %d\n", (int)str.size());	
 
	// string을 char로 변환
	ctemp = str.c_str();
 
	for (i = 0; i < str.size(); i++) {
		printf("%c", ctemp[i]);  // "ㄱ" 출력
	}
	printf("\n");
 
	for (i = 0; i < str.size(); i++) {
		printf("%d\n", ctemp[i]);  // "ㄱ" 을 int로 출력
	}
	/****************************************************************************************/
 
 
>>>> 결과
 
ㄱ
227
132
177
 
str size 3
ㄱ
-29
-124
-79

분명 제가 뭐를 모르고 있는 것 같습니다.
작업하는 코드가 string 으로 되어있고 이를 한글화 하기 위해 wstring으로 작업하고 있는데요.
기본 적인것이 이해가 안가니 영 진도를 못나가고 있습니다.
조언을 부탁드립니다.

klara의 이미지

이상한 값이 아니고, 둘다 같은 값입니다. 정확히 말하자면, 비트표현이 같습니다.
1바이트로는 부호없이는 0~255, 부호가 있으면 -125~125의 범위를 나타낼수 있는데,
앞에결과는 부호없이 출력한 결과고, 뒤의 결과는 부호를 가지고 출력한 결과입니다.
맨앞의 첫비트를 숫자로 처리할지, 부호비트로 처리할지의 차이입니다.
두개 빼보세요. 셋다 256이 나옵니다.
보통 인코딩된 raw data에 대해서는 부호는 의미가 없기 때문에 unsigned char를 많이 이용합니다.

paek1ju의 이미지

안녕하세요. 답변 감사합니다. 네 그렇군요. 개발 경험 오래되어도 아직도 가야할 길이 머네요..^^
xylosper 님 감사합니다.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.