std::string 에 담겨 있는 한글을 euc-kr 로 인코딩 하는 방법
글쓴이: myhong74 / 작성시간: 금, 2007/02/09 - 6:20오후
안녕하세요~!
회사에서 현재 프로젝트를 진행중인데요..
간략히 설명하자면 웹서버랑 통신을 하는 클라이언트 프로그램을 작업중입니다.
거래처 회사에서 웹서버를 운영중이고..
저희 회사에서 클라이언트 프로그램을 만들어 통신을 해야 하는데요..
프로토콜상 한글은 euc-kr 로 인코딩해서 보내게 되어 있습니다.
현재 std::string 에 보낼 데이타고 있고.. 그것을 euc-kr 로 인코딩 하여 전송을 해야 하는데..
방법이
1. std::string 을 std::wstring 으로 변환한다.
2. std::wstring 에서 한글자를 뽑아 euc-kr 의 코드테이블에서 맞는 해당 값을 찾는다 (?????)
제가 생각하고 있는 그림이 맞는건가요???
난감하네요..
평소에 당연히 생각하던것을 막상 구현하려 하니..
조언좀 부탁드립니다.
좋은 하루 되세요~
Forums:
iconv 라이브러리를 이용하세요
그냥 std::string 만 쓰고 iconv 라이브러리를 이용하시는 방법도 있습니다.
--
There's nothing so practical as a good theory.
- Kurt Lewin
--
There's nothing so practical as a good theory. - Kurt Lewin
"하스켈로 배우는 프로그래밍" http://pl.pusan.ac.kr/~haskell/
클라이언트가 euc-kr
클라이언트가 euc-kr 인코딩을 쓰고 있이면 인코딩 변환을 안 해도 되겠지만 utf-8을 쓰고 있다면 wstring이 16비트 유니코드로 구현되어 있는 경우(?)에는 잘 동작하지 않았던 것으로 기억합니다. 확실치는 않습니다.
std::string로 해도 잘 동작한다면 윗분 말씀대로 그냥 std::string을 쓰는 것을 추천합니다.
아마록에서 가사와 앨범 표지를... http://kldp.net/projects/amarok-script/ 블로그: http://turtleforward.blogspot.com
블로그: http://turtleforward.blogspot.com
std::string 에 들어
std::string 에 들어 있는 값이 일반 완성형 한글과 영문, 그리고 특수 문자들이라면 그냥 std::string::c_str() 으로 char * 를 참조해 바로 보내시면 됩니다. euc-kr 은 일반적인 한글환경의 non-unicode text 문으로 이해하시면 됩니다. 국내환경에서 별다른 처리가 필요하지 않습니다.
euc-kr 이라는 charset은 유니코드로 변환하거나 어떠한 경로로 해당 문자열을 전송할 때, 또는 사람이 보게되는 출력으로 사용될 때 의미가 있습니다.
입력된 그러니까, euc-kr로 전송하기 이전 데이터가 utf-8 이나 utf-16 등의 유니코드 일때만 iconv 를 이용해 euc-kr 로 변환해야할 뿐입니다.
저는 리눅스 상에서
저는 리눅스 상에서 utf-8을 기본으로 하고 있고 cp949를 사용하기 위해 iconv를 사용하고 있습니다. 로케일마다 대처가 달라야 겠죠.
- CN의 낙서장 / HanIRC:#CN
- 죠커's blog / HanIRC:#CN
c++에서 char와 wchar_t
c++에서 char와 wchar_t 는 인코딩에 상관없는 자료의 배열집합입니다.
다만, char는 아스키를 담을정도의 크기이고 wchar는 유니코드를 담을정도의 크기이죠.
euc-kr이나 cp949는 아스키를 담을정도의 크기이면 되는 문자 인코딩 타입입니다.
그러므로 string형으로 만들어도 충분합니다.
http://poksion.cafe24.com/poki/wiki.php/C99/wchar_t 에 관련글이 있습니다.
poklog at http://poksion.cafe24.com/poklog/
poklog at http://poksion.cafe24.com/poklog/
댓글 달기