컴파일러 한글 인식에 관한 질문...(C언어)

글쓴이: izlley / 작성시간: 목, 2003/05/22 - 11:33오후

C언어로 컴파일러를 만들시에
scanner에서 여러 토큰들을 읽어 구분을 해줘야하는데..
알파벳은 isalpha(); 으로
digit은 isdigit(); 으로 구분해줄수 있는데..
만약 그문자가 한글일 시에는 어떻게 구분해 줘야만 하는지요?

ID를 영문뿐만 아니라 한글로도 가능하게 해줘야만 하는데...
한글을 어떻게 인식시켜야 될지 의문입니다.. :?:

혹시 라이브러리에 header파일이 있지 않을까 궁급합니다..

답변 감사드리겠습니다...

Forums:

프로그래밍 QnA

댓글 달기

scanner를 무엇으로 작성하실지는 모르겠지만... 한글에도 여러종류

글쓴이: pynoos / 작성시간: 목, 2003/05/22 - 11:48오후

scanner를 무엇으로 작성하실지는 모르겠지만... 한글에도 여러종류 코드가 있습니다.
코드마다 다른 함수가 필요하겠지요.

권하는 방법은 읽어들인 multi-byte character 문자열을 wide character 문자열로 바꾸어 token 을 처리하는 것이 좋을 것 같습니다.

그렇게 되면, 모든 문자열은 wide 계열로 작성하게 될 것입니다.

자세한 것은 본 BBS에서 mbs 나 wcs 등의 키워드로 검색해 보세요.

---
http://coolengineer.com

답글

저도 고생하고 연구했었는데

글쓴이: linuxqna / 작성시간: 금, 2003/05/23 - 10:13오전

저도 이문제 떄문에 많이 연구하고 고생많이 했던것 같은데
가장 중요한 포인트가 몇byte를 한글 한글자로 처리하냐 ? 인데.
multybyte char -> wide char 바뀔떄
포인트는 현재 system의 locale 에 의존하는것 같습니다
즉 현재 locale이 ko_KR.EUC 이면 wide char에서 2byte가 1글자로 인식되는거죠
pynoos님 혹시 제가 틀린부분이 있으면 지적을 ^^

답글

맞습니다.mbstowcs 문자열 변환은 locale 관련 libr

글쓴이: pynoos / 작성시간: 금, 2003/05/23 - 12:50오후

맞습니다.

mbstowcs 문자열 변환은 locale 관련 library를 따르게 되지요.

mbstowcs 전에 setlocale 함수를 한번 호출하여 변환하고자 하는 mbs 의 종류를 명시해줘야합니다.

---
http://coolengineer.com

답글

댓글 달기

이름

제목

댓글 *

텍스트 포맷에 대한 자세한 정보

텍스트 양식

Filtered HTML

텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
You can use Textile markup to format text.
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
Quick Tips:
- Two or more spaces at a line's end = Line break
- Double returns = Paragraph
- *Single asterisks* or _single underscores_ = Emphasis
- **Double** or __double__ = Strong
- This is [a link](http://the.link.example.com "The optional title text")
For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

HTML 태그를 사용할 수 없습니다.
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
줄과 단락은 자동으로 분리됩니다.

CAPTCHA

이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.

부 메뉴

컴파일러 한글 인식에 관한 질문...(C언어)

scanner를 무엇으로 작성하실지는 모르겠지만... 한글에도 여러종류

저도 고생하고 연구했었는데

맞습니다.mbstowcs 문자열 변환은 locale 관련 libr

댓글 달기

Filtered HTML

BBCode

Textile

Markdown

Plain text

주 메뉴

둘러보기

부 메뉴

현재 위치

컴파일러 한글 인식에 관한 질문...(C언어)

scanner를 무엇으로 작성하실지는 모르겠지만... 한글에도 여러종류

저도 고생하고 연구했었는데

맞습니다.mbstowcs 문자열 변환은 locale 관련 libr

댓글 달기

Filtered HTML

BBCode

Textile

Markdown

Plain text

주 메뉴

검색 폼

둘러보기

사용자 로그인

Oauth2 Login :