여러분은 유니코드를 비롯한 문자셋들을 어떻게 생각하십니까?

IDNed의 이미지

유니코드... 코드페이지 949... UTF-8...

혹시 KLDP 유저분들은 유니코드에 대한 의문을 가지지 않으십니까?

제 개인적 생각으로는 유니코드의 호환성이랑, 여러 포맷의 종류를 혼용해서 쓰느라 혼란이 일어나는 것에 대한 의문이 생기는군요...
더구나 유니코드는 현재 표준이 16bit입니다. 65536개까지 문자가 가능한데...
모 중국 한자 사전에 의하면 한자 갯수만 해도 80000개가 된다고 합니다.(근거없을지는 모르지만 :roll: )

http://blog.naver.com/devil__man?Redirect=Log&logNo=150001676012
여기를 보고 문득 생각난 점입니다...

leigh의 이미지

어떤 의문 말씀이신지요?

유니코드가 아니면 동시에 다국어를 어떻게 표현할 수 있을까요?

그리고, 현재 16bit가 표준이라는 말은 정답이 아닙니다. wchar_t나 일부 C에서 wide char를 2바이트로 표시하는 것일 뿐, 유니코드는 다양한 인코딩 형식을 가지고 있습니다.

저는 어서 빨리 유니코드로 컴퓨터 문자 세상이 통일됐으면 좋겠군요 :lol:

...

IDNed의 이미지

어쨌든 어떤 표준안(유니코드)이 하루속히... 통일시키면 좋겠네요...

마잇의 이미지

어떻게 생각하는게 문제가 아니고, 빨리 UTF-8로 다들 전환이 되어야... ^^

언급하신 블로그 글 가운데

Quote:
고전적인 미국 아스키 문자 (0 에서 0x7f) 는 자신으로 인코드되는데 따라서 단지 7 비트 아스키 문자들을 포함한 파일 및 문자열은 아스키와 UTF-8 하에서 동일한 인코딩을 갖는다. 이는 많은 기존 미국 프로그램과 데이타 파일에 대해 역행 호환성을 제공하기 때문에 놀라운 것이다.

UTF-8 인코딩이 적어도 아스키 문자에 대해서는 하위 호환성을 제공했기 때문에 다른 유니코드 인코딩 방식을 제치고 실제 표준적으로 자리잡고 있는게 아닌가 합니다.

인코딩 설정좀 안하고 사는 날이 언능 좀 왔으면 합니다...

조엘 온 소프트웨어 책에서 알기 쉽게 설명된 유니코드 관련 글이 있는데 한글 번역은 아쉽게도 못찾겠군요. 원문 링크 합니다.
http://www.joelonsoftware.com/articles/Unicode.html
이 글도 좋습니다.
http://www.jinsuk.pe.kr/Unicode/Unicode_intro-kr.html


--
마잇

feanor의 이미지

하루빨리 유니코드 세상이 됐으면 좋겠습니다.

--feanor

superwtk의 이미지

그러게요

UTF-8이든, UTF-16이든 통일됐으면 좋겠습니다;

moonhyunjin의 이미지

UTF-16은 3bytes까지 사용하는 걸로 알고 있습니다.

<- 이거면 안 되는 게 없어~
정품 소프트웨어 사용 캠패인

superwtk의 이미지

UTF-8도 한글은 3바이트 사용합니다 :)

hyperhidrosis의 이미지

대부분의 사람들이 wchar_t 를 유니코드로 알고있습니다만,
위에도 언급된
http://www.jinsuk.pe.kr/Unicode/Unicode_intro-kr.html
를 먼저 보시기를 권해드립니다.

superwtk의 이미지

UTF-8에서 한글을 2바이트만 쓰도록 했으면 좋았을텐데 -,.-a
그래도 UTF-8은 바이트 순서(endian)에 신경을 쓰지 않아도 되고, 아스키와 하위 호환성을 유지하기 때문에 제가 보기엔 제일 나은것 같네요.

익명 사용자의 이미지

제가 의문인건 정작 문자열 코드에 대해서 시원하게 설명해 놓은곳이 없더군요.

정작 프로그램하는 사람들도 문자열 코드에 대해서는 소홀히 여김니다.

나중에 string 연산이 필요할때 잠깐 보는 수준이고 어디 시원하게 통합해서 비교 및 설명 해 놓은곳이 없더군요.
제가볼땐 이게 더 시급한거 갔습니다.

정태영의 이미지

Anonymous wrote:
제가 의문인건 정작 문자열 코드에 대해서 시원하게 설명해 놓은곳이 없더군요.

정작 프로그램하는 사람들도 문자열 코드에 대해서는 소홀히 여김니다.

나중에 string 연산이 필요할때 잠깐 보는 수준이고 어디 시원하게 통합해서 비교 및 설명 해 놓은곳이 없더군요.
제가볼땐 이게 더 시급한거 갔습니다.

사실 cjkv information processing 이란 책을 보면 관련해서 대부분의 내용이 정리되어 있습니다 (한국어 비중이 좀 적긴 하지만요)

그리고 컴퓨터 속의 한글이란 절판된 책도....

오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...

http://mytears.org ~(~_~)~
나 한줄기 바람처럼..

keizie의 이미지

UCS의 구성에 대해서라면 유니코드 컨소시움의 PDF 자료를 받아다 보면 될 것이고, UTF-8로 구성하는 방법에 대해서라면 온라인에도 많이 있습니다.

제가 집에 갖고 있는 책은 예전 조합형과 완성형도 설명하면서 유니코드의 한글 영역에 대해 코드북까지 제시합니다. 덕분에 꽤 두껍죠.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.