EUC-KR(KSC5601완성형, 2바이트, 0xa1-0xfe, 0xa1-0xfe)

글쓴이: 익명 사용자 / 작성시간: 일, 2001/10/14 - 12:22오전
여기서 맨날 질문만 하는군요..
질문 내용은 다음과 같습니다.
ksc5601에서 한글의 범위는 0xb0a1(가)부터 0xc8fe(힝)으로 알고있습니다.
그래서 이것을 이용하여 한글만 추출하는 프로그램을 만들었는데
(ㄱ) 부분을 추출하지 못하더군요
그래서 찍어보니까 가->0xafa1 이더군요..
궁금해서 찾아보니까 kldp의 문서중에 제목과 같은 말이 있더군요..
그런데 무슨 뜻인지 도무지 모르겠내요...
제목의 뜻이 무엇인지...
그리고
리눅스에서 사용하는 한글코드의 범위를 알고 싶습니다.
그럼.....
Forums:
Re: EUC-KR(KSC5601완성형, 2바이트, 0xa1-0xfe, 0xa1-0xfe)
책에 있는 내용을 발췌해봅니다.(이건 걸릴 수도 있는데... ^^;)
컴퓨터를 이용한 정보교환용 부호에대한 규격에는 ISO-646, ISO-2022,
ISO-6429, ISO-4873등이 있습니다. 여기서 KSC-5601(완성형)에 가장
많은 영향을 미친것은 ISO-2022인데 이것은 부호확장법을 명시하고있
습니다.
이 구성은
0 32 128 160 255
0+-------+--------------+-------+------------------+
| |C0제어부호영역| |C0,C1제어부호영역 |
32+-------+--------------+-------+------------------+
| | | | |
| C0 | | C1 | |
| | A 영역 | | B 영역 |
| 영역 | | 영역 | |
| | | | |
128+-------+--------------+-------+------------------+
| | C0,C1영역 | | C1영역 |
160+-------+--------------+-------+------------------+
| | | | |
| C0,C1 | | C1 | |
| | C 영역 | | D 영역 |
| 영역 | | 영역 | |
| | | | |
255+-------+--------------+-------+------------------+
이렇게 되어있답니다.(--; 힘들다...그림이 깨지네요. --;)
여기서 제어문자로 할당된 영역들을 제외하면 D영역만이 남게됩니다.
(자세한건 ISO-2022를 참고하시라네요. ^^;)
이 D영역이 바로 0xA1~0xFE까지 입니다. 즉, 제목의 0xA1~0xFE,
0xA1~0xFE는 위 그림의 D영역을 나타내는 것이고 그것을 조합하면
0xA1A1~0xA1FE,0xA2A1~0xA2FE...,0xFEA1~0xFEFE까지의 범위내에있는
것들이 한글(정확하게는 아닙니다.)이라는 소립니다.
정확하게 한글이 아니라는 소리는 D영역은 8836자이고 여기에는
한글이 2350자, 한자 4888자, 특수문자 1128자, 사용자 정의영역 470자를
할당했답니다.... 휴~~~
하여간에 제목에있는것은 저 D영역을 나타냅니다.
댓글 달기