VC 6 컴파일러에서 string 이 내부적으로 유니코드를 지원하는지 궁금합니다.
const char* string::c_str()
이렇게 지정되어있던데.. -_-;
지원 안하는 건가요?
안하면 어떻게 하면 위에처럼 짜진 프로그램에서 최소의 수정으로
-_-;; UTF8을 지원할 수 잇을까요?
std::wstring 이 유니코드 타입의 스트링인 것으로 알고 있습니다.
제가 사용한 경우는 MSXML을 이용한 프로그래밍에서 편리하게(보다 게으르게 ; ) 작성하고자 썼었거든요. 사용법은 일반 std::string와 동일하구요.
일반 char는 유니코드타입이 아니고, wchar_t 또는 WCHAR가 유니코드 인 것으로 알고 있습니다만 .....
---- 한 발자국, 한 발자국 - 언젠가는 도약하리라 ~
그냥 UTF8을 저장하기 위한 변수를 원하신다면 std::string을 그냥 쓰시면됩니다.
원래 UTF8은 ASCII와 완벽히 호환이 되는 포멧이기 때문에 문제없이 동작합니다.
단지 입력/출력시 내부의 데이터를 출력 장치의 코드에 맞게 변환을 해야하고, string에서 문자 개수를 센다던지 하는 경우에 UTF8용 함수를 사용해야 하겠지요.
일반 시스템 내부에서 유니코드를 사용하고자 한다면 rOseria님이 말씀하신대로 wchar_t나 윈도우의 경우 TCHAR을 사용합니다.
UTF8에 대해서 물어 보신것을 보니 처리해야할 데이터가 UTF8으로 이루어진것으로 보입니다.
이런 경우는 입출력작업시 코드 변환 함수를 통해서 컴파일러에서 지원하는 타입인 wchar_t나 TCHAR로 변환해서 처리하는 것이 일반적입니다.
감사합니다. 많은 도움 되었습니다. ^^
TCHAR의 사용에 대해서는 다소 주의할 필요가 있습니다.
Generic-Text Mappings in Tchar.h:http://msdn2.microsoft.com/en-us/library/c426s321.aspx Generic-Text Mappings :http://msdn2.microsoft.com/en-us/library/szdfzttz.aspx Routine Mappings:http://msdn2.microsoft.com/en-us/library/tsbaswba.aspx
TCHAR은 매크로상수 _UNICODE 의 정의 여부에 따라 타입이 바뀝니다. TCHAR을 사용한다는 것은 해당 함수들도 역시 General-Text Mapping 함수들로 사용한다는 것을 뜻합니다.
A Sample Generic-Text Program:http://msdn2.microsoft.com/en-us/library/4t912wf5.aspx
위의 예를 참고하셔서 프로그램을 작성하시길 권합니다.
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
데브피아쪽이 더 빠르실텐데 :)
std::wstring 이 유니코드 타입의 스트링인 것으로 알고 있습니다.
제가 사용한 경우는 MSXML을 이용한 프로그래밍에서 편리하게(보다 게으르게 ; ) 작성하고자 썼었거든요. 사용법은 일반 std::string와 동일하구요.
일반 char는 유니코드타입이 아니고, wchar_t 또는 WCHAR가 유니코드 인 것으로 알고 있습니다만 .....
----
한 발자국, 한 발자국 - 언젠가는 도약하리라 ~
그냥 UTF8을 저장하기 위한 변수를 원하신다면 std::string을
그냥 UTF8을 저장하기 위한 변수를 원하신다면 std::string을 그냥 쓰시면됩니다.
원래 UTF8은 ASCII와 완벽히 호환이 되는 포멧이기 때문에 문제없이 동작합니다.
단지 입력/출력시 내부의 데이터를 출력 장치의 코드에 맞게 변환을 해야하고,
string에서 문자 개수를 센다던지 하는 경우에 UTF8용 함수를 사용해야 하겠지요.
일반 시스템 내부에서 유니코드를 사용하고자 한다면 rOseria님이 말씀하신대로 wchar_t나 윈도우의 경우 TCHAR을 사용합니다.
UTF8에 대해서 물어 보신것을 보니 처리해야할 데이터가 UTF8으로 이루어진것으로 보입니다.
이런 경우는 입출력작업시 코드 변환 함수를 통해서 컴파일러에서 지원하는 타입인 wchar_t나 TCHAR로 변환해서 처리하는 것이 일반적입니다.
감사합니다.
감사합니다. 많은 도움 되었습니다. ^^
TCHAR의 사용에 대해서는 다소 주의할 필요가 있습니다.Gene
TCHAR의 사용에 대해서는 다소 주의할 필요가 있습니다.
Generic-Text Mappings in Tchar.h:
http://msdn2.microsoft.com/en-us/library/c426s321.aspx
Generic-Text Mappings :
http://msdn2.microsoft.com/en-us/library/szdfzttz.aspx
Routine Mappings:
http://msdn2.microsoft.com/en-us/library/tsbaswba.aspx
TCHAR은 매크로상수 _UNICODE 의 정의 여부에 따라 타입이 바뀝니다. TCHAR을 사용한다는 것은 해당 함수들도 역시 General-Text Mapping 함수들로 사용한다는 것을 뜻합니다.
A Sample Generic-Text Program:
http://msdn2.microsoft.com/en-us/library/4t912wf5.aspx
위의 예를 참고하셔서 프로그램을 작성하시길 권합니다.
댓글 달기