여러분은 유니코드를 비롯한 문자셋들을 어떻게 생각하십니까?
글쓴이: IDNed / 작성시간: 토, 2006/02/11 - 12:14오전
유니코드... 코드페이지 949... UTF-8...
혹시 KLDP 유저분들은 유니코드에 대한 의문을 가지지 않으십니까?
제 개인적 생각으로는 유니코드의 호환성이랑, 여러 포맷의 종류를 혼용해서 쓰느라 혼란이 일어나는 것에 대한 의문이 생기는군요...
더구나 유니코드는 현재 표준이 16bit입니다. 65536개까지 문자가 가능한데...
모 중국 한자 사전에 의하면 한자 갯수만 해도 80000개가 된다고 합니다.(근거없을지는 모르지만 :roll: )
http://blog.naver.com/devil__man?Redirect=Log&logNo=150001676012
여기를 보고 문득 생각난 점입니다...
Forums:
Re: 여러분은 유니코드를 비롯한 문자셋들을 어떻게 생각하십니까?
어떤 의문 말씀이신지요?
유니코드가 아니면 동시에 다국어를 어떻게 표현할 수 있을까요?
그리고, 현재 16bit가 표준이라는 말은 정답이 아닙니다. wchar_t나 일부 C에서 wide char를 2바이트로 표시하는 것일 뿐, 유니코드는 다양한 인코딩 형식을 가지고 있습니다.
저는 어서 빨리 유니코드로 컴퓨터 문자 세상이 통일됐으면 좋겠군요 :lol:
...
어쨌든 어떤 표준안(유니코드)이 하루속히... 통일시키면 좋겠네요...
어쨌든 어떤 표준안(유니코드)이 하루속히... 통일시키면 좋겠네요...
어떻게 생각하는게 문제가 아니고, 빨리 UTF-8로 다들 전환이 되어야.
어떻게 생각하는게 문제가 아니고, 빨리 UTF-8로 다들 전환이 되어야... ^^
언급하신 블로그 글 가운데
UTF-8 인코딩이 적어도 아스키 문자에 대해서는 하위 호환성을 제공했기 때문에 다른 유니코드 인코딩 방식을 제치고 실제 표준적으로 자리잡고 있는게 아닌가 합니다.
인코딩 설정좀 안하고 사는 날이 언능 좀 왔으면 합니다...
조엘 온 소프트웨어 책에서 알기 쉽게 설명된 유니코드 관련 글이 있는데 한글 번역은 아쉽게도 못찾겠군요. 원문 링크 합니다.
http://www.joelonsoftware.com/articles/Unicode.html
이 글도 좋습니다.
http://www.jinsuk.pe.kr/Unicode/Unicode_intro-kr.html
--
마잇
하루빨리 유니코드 세상이 됐으면 좋겠습니다.--feanor
하루빨리 유니코드 세상이 됐으면 좋겠습니다.
--feanor
그러게요UTF-8이든, UTF-16이든 통일됐으면 좋겠습니다;
그러게요
UTF-8이든, UTF-16이든 통일됐으면 좋겠습니다;
UTF-16은 3bytes까지 사용하는 걸로 알고 있습니다.
UTF-16은 3bytes까지 사용하는 걸로 알고 있습니다.
<- 이거면 안 되는 게 없어~
정품 소프트웨어 사용 캠패인
UTF-8도 한글은 3바이트 사용합니다 :)
UTF-8도 한글은 3바이트 사용합니다 :)
대부분의 사람들이 wchar_t 를 유니코드로 알고있습니다만,위에도
대부분의 사람들이 wchar_t 를 유니코드로 알고있습니다만,
위에도 언급된
http://www.jinsuk.pe.kr/Unicode/Unicode_intro-kr.html
를 먼저 보시기를 권해드립니다.
UTF-8에서 한글을 2바이트만 쓰도록 했으면 좋았을텐데 -,.-a그
UTF-8에서 한글을 2바이트만 쓰도록 했으면 좋았을텐데 -,.-a
그래도 UTF-8은 바이트 순서(endian)에 신경을 쓰지 않아도 되고, 아스키와 하위 호환성을 유지하기 때문에 제가 보기엔 제일 나은것 같네요.
제가 의문인건 정작 문자열 코드에 대해서 시원하게 설명해 놓은곳이 없더군
제가 의문인건 정작 문자열 코드에 대해서 시원하게 설명해 놓은곳이 없더군요.
정작 프로그램하는 사람들도 문자열 코드에 대해서는 소홀히 여김니다.
나중에 string 연산이 필요할때 잠깐 보는 수준이고 어디 시원하게 통합해서 비교 및 설명 해 놓은곳이 없더군요.
제가볼땐 이게 더 시급한거 갔습니다.
[quote="Anonymous"]제가 의문인건 정작 문자열 코드에 대해
사실 cjkv information processing 이란 책을 보면 관련해서 대부분의 내용이 정리되어 있습니다 (한국어 비중이 좀 적긴 하지만요)
그리고 컴퓨터 속의 한글이란 절판된 책도....
오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...
http://mytears.org ~(~_~)~
나 한줄기 바람처럼..
UCS 말입니까, UTF-8 말입니까?
UCS의 구성에 대해서라면 유니코드 컨소시움의 PDF 자료를 받아다 보면 될 것이고, UTF-8로 구성하는 방법에 대해서라면 온라인에도 많이 있습니다.
제가 집에 갖고 있는 책은 예전 조합형과 완성형도 설명하면서 유니코드의 한글 영역에 대해 코드북까지 제시합니다. 덕분에 꽤 두껍죠.
댓글 달기