utf16 변환코드에서 BMP와 서로게이트는 혼용되어 사용되는 것인지요?
글쓴이: dltkddyd / 작성시간: 목, 2014/06/26 - 3:04오후
2bytes의 BMP로 표현되는 언어 중에 서로게이트로 표현해야할 문자가 있을까요? 그러니까 BMP로 표현되는 언어는 오직 BMP만 사용하는 것인지요? 아니면 게중에 표현불가능한 문자가 있을때 서로게이트를 혼용해서 사용한다는 것인가요? 그러니까 한글 중에 고어가 BMP로 표현이 불가능하다면 적어도 고어의 표현은 결국 서로게이트를 선택해야 할텐데, 이럴 경우 현대어는 BMP로 표현하다가 고어의 경우에만 서로게이트를 사용하는 것인가요? 아니면 아예 서로게이트라는 표현방식으로 현대어와 고어를 모두 표현하는 것인지 궁금합니다. 그러니까 서로게이트에 BMP가 포함되 있는 것인가요? 아니면 별개의 것인가요?
Forums:
http://msdn.microsoft.com/en-
http://msdn.microsoft.com/en-us/library/windows/desktop/dd374069%28v=vs.85%29.aspx
둘 째 섹션 첫 문단 중간까지만 읽으셔도 답이 다 나와 있습니다. Unicode surrogate pair로 검색하면 바로 나옵니다.
답변 주신 글 감사합니다.
특정 값이 넘으면 서로게이트 문자라고 판별하면 되겠군요. 덕분에 문제가 속시원히 해결됐습니다. 감사합니다.
본인 맞습니다.
인증샷
우헤헤헤... 로 대신합니다.
잘 이해가 안 가네요.
특정 값이 넘는다는 걸 언제 파악해서 판별하시는 것인지... 코드 포인트가 일정 범위를 넘어가면 서로깃 페어로 되어 있었겠거니 알 수 있겠지만, 그때 쓰는 코드 유닛은 다 원래의 U+0000-FFFF 범위 사이 것들이니... 잘 이해가 안 가네요.
댓글 달기