컴파일러 한글 인식에 관한 질문...(C언어)
글쓴이: izlley / 작성시간: 목, 2003/05/22 - 11:33오후
C언어로 컴파일러를 만들시에
scanner에서 여러 토큰들을 읽어 구분을 해줘야하는데..
알파벳은 isalpha(); 으로
digit은 isdigit(); 으로 구분해줄수 있는데..
만약 그문자가 한글일 시에는 어떻게 구분해 줘야만 하는지요?
ID를 영문뿐만 아니라 한글로도 가능하게 해줘야만 하는데...
한글을 어떻게 인식시켜야 될지 의문입니다.. :?:
혹시 라이브러리에 header파일이 있지 않을까 궁급합니다..
답변 감사드리겠습니다...
Forums:
scanner를 무엇으로 작성하실지는 모르겠지만... 한글에도 여러종류
scanner를 무엇으로 작성하실지는 모르겠지만... 한글에도 여러종류 코드가 있습니다.
코드마다 다른 함수가 필요하겠지요.
권하는 방법은 읽어들인 multi-byte character 문자열을 wide character 문자열로 바꾸어 token 을 처리하는 것이 좋을 것 같습니다.
그렇게 되면, 모든 문자열은 wide 계열로 작성하게 될 것입니다.
자세한 것은 본 BBS에서 mbs 나 wcs 등의 키워드로 검색해 보세요.
---
http://coolengineer.com
저도 고생하고 연구했었는데
저도 이문제 떄문에 많이 연구하고 고생많이 했던것 같은데
가장 중요한 포인트가 몇byte를 한글 한글자로 처리하냐 ? 인데.
multybyte char -> wide char 바뀔떄
포인트는 현재 system의 locale 에 의존하는것 같습니다
즉 현재 locale이 ko_KR.EUC 이면 wide char에서 2byte가 1글자로 인식되는거죠
pynoos님 혹시 제가 틀린부분이 있으면 지적을 ^^
맞습니다.mbstowcs 문자열 변환은 locale 관련 libr
맞습니다.
mbstowcs 문자열 변환은 locale 관련 library를 따르게 되지요.
mbstowcs 전에 setlocale 함수를 한번 호출하여 변환하고자 하는 mbs 의 종류를 명시해줘야합니다.
---
http://coolengineer.com
댓글 달기