utf-8, utf-16, utf-32 이렇게 표시된 것은 ? (숫자는 처리될 비트인가요?)

뻐꾸기의 이미지

개인적으로 초보자 입니다.
utf-8, utf-16, utf-32 이렇게 표시된 방식을 보았는데요..

뒤에 숫자는 처리될(?) 비트 단위 인가요? 동작 모드가 궁금합니다..

bootmeta의 이미지

utf8은 한글자 표현이 가변입니다. 영문일 때는 1바이트, 한글은 3바이트 입니다.
unix쪽이나 web에서 일반적으로 지원됩니다.

utf16은 2바이트 기준입니다. 특수하게 4바이트가 한글자를 표현하는 경우가 있기는 하나 일반적인 처리 기준은 2바이트 입니다. 바이트 순서(endian)에 따라 UTF16LE, UTF16BE로 구분됩니다. 자바에서 기본으로 제공하는 문자 단위입니다.
한글이나 영문 구별없이 2바이트가 한문자를 나타냅니다.

utf32는 4바이트가 한문자를 나타냅니다. 역시 UTF32LE, UTF32BE로 구분됩니다.

ps)쓰고나서 보니 숫자는 bit단위군요.. ^^;

Necromancer의 이미지

인코딩방식의 차이죠.
처음 유니코드는 2바이트 체제로 출발했었는데, 나중에 각국 언어들이 추가되다 보니
2바이트로는 모자라게 되어서 4바이트로 확장되었습니다.

UTF32가 4바이트=1문자가 되는 인코딩이고, (UCS4라고도 부릅니다.)
UTF16은 2바이트=1문자이긴 한데 꼭 그렇지는 않습니다.
상위대행코드와 하위대행코드 조합으로 올 경우 2바이트 2개가 1문자를 나타냅니다.

그리고 UTF8은 기존 문자열처리 소프트웨어나 라이브러리를 아무 수정없이 쓰기 위해서
유니코드를 인코딩하는 방법을 개발하면서 나온 것입니다.
UTF8은 길이가 가변입니다. 그리고 인코딩 방법도 공개되어 있고요. 궁금하시면 구글링 하시길.
코드값이 0~7F까지는 1바이트(ascii코드와 같음), 80~3FF까지는 2바이트, 그 위는 3바이트로 인코딩되고,
4바이트까지 있습니다. 한글이 위치하는 코드번호는 UTF8에서는 3바이트단위로 인코딩되는 영역이죠.

Written By the Black Knight of Destruction

Written By the Black Knight of Destruction

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.