basic_string<utf8_type>은 안됩니다. utf8로 구성된 배열을 스트링으로 만들 방법이 없을까요?
글쓴이: dltkddyd / 작성시간: 월, 2014/07/14 - 7:27오후
utf8로 인코딩된 자료형을 utf8_type이라는 클래스로 정의해놓았습니다. 그리고 이 클래스는 와이드 문자를 생성자에 전달하며 그 문자를 utf8 인코딩으로 변환해서 데이터를 저장합니다. 그래서
utf8_type utf1=L'가';
라고 하면, oxAC00이라는 '가'의 유니코드 값에 대응되는 utf8 인코딩 0xEAB080으로 변환돼서 저장됩니다. 이 정의해놓은 자료형으로 스트링을 만들려고
typedef std::basic_string utf8string;
이라고 선언했습니다. 그리고
vector vec1=wptutf8(L"키보드")//1) utf8_type* utf1=vec1.data(); utf8string utfstr1=utf1;//2)
2) 에서 '세그멘테이션 오류'가 발생합니다.
그리고 1)은 제가 정의해놓은 함수로 유니코드 문자열을 vector 이라는 컨테이너의 각 요소에 utf8 인코딩으로 변환해서 그 컨테이너를 반환하는 함수입니다. 그 정의는 다음과 같습니다.
const vector<utf8_type> wptutf8(const wchar_t* wstr) { std::vector<utf8_type> vec(wcslen(wstr)+1); unsigned int i=0; for(i;i<wcslen(wstr);i++) { vec[i]=wstr[i]; } vec[i]=L'\0'; return vec; }
이 함수는 제대로 작동합니다. 2)에서 왜 세그멘테이션 오류가 생기는지 모르겠습니다. utf16_type, utf32_type이라는 것도 만들어봤습니다. 이 둘은 제대로 변환돼서 문자열로 생성이 됩니다. utf8_type만 세그멘테이션이 발생합니다.
Forums:
아, 왜 이러죠. 해결했습니다.
0으로 초기화하지 않아서 발생한 문제였네요. utf8_type의 기본 생성자에서 말입니다.
본인 맞습니다.
인증샷
우헤헤헤... 로 대신합니다.
댓글 달기