인터넷 특수 문자

macros의 이미지


첨부한 그림과 같은 문자들을 게시판이나 URL 창에 올리면 자동적으로 한글로 변환 되는데..
이런 특수 문자들을 무엇이라하며 또 어떻게 만드는지요?

.

File attachments: 
첨부파일 크기
Image icon 33.jpg6.63 KB
cinsk의 이미지

10진수를 쓴 &#D; 형태와 16진수를 쓴 &#xH; 형태가 있습니다. 각각 D와 H 자리에 수치가 들어갑니다. 이 수치는 UCS (unicode라 생각하면 됨) 문자 index입니다.

참고: http://www.w3.org/TR/html4/charset.html#entities

--
C FAQ: http://www.eskimo.com/~scs/C-faq/top.html
Korean Ver: http://www.cinsk.org/cfaqs/

cleol의 이미지

만드는 방법은 .... 언어마다 제공하는 함수 또는 라이브러리가 있습니다. 예를 들어 자바스크립트라면 encodeURI 함수를 사용하시면 되구요, 자바라면 URLEncoder 클래스를 사용하시면 됩니다.

cinsk의 이미지

Shell에서도 쉽게 알 수 있습니다.

x86과 같이 little endian을 쓰는 시스템에서는:


$ echo "안녕" | iconv -t UCS-4LE | od -t xL
0000000 0000c548 0000b155 0000000a
0000014

따라서 "안녕"을 "안녕"로 쓸 수 있습니다.

big endian을 쓰는 시스템에서는 UCS-4LE 대신 UCS-4BE를 쓰면 됩니다.

전체 목록을 다 살펴보는 것은 따로 책을 주문해야 하지만, online으로 보려면

Unicode Charts

에 가 보시기 바랍니다.

--
C FAQ: http://www.eskimo.com/~scs/C-faq/top.html
Korean Ver: http://www.cinsk.org/cfaqs/

Prentice의 이미지

cinsk님이 말씀해주신 링크에도 나와있듯, HTML에서는 &같은 것들은 character entity라고 부르고, å나 å 같은 것들은 numeric character reference라고 부르는 것 같습니다. Numeric character reference들은 그냥 유니코드 번호로 문자를 쓰기 위한(?) 거죠.

gucharmap을 실행하셔도 보실 수 있습니다.

Prentice의 이미지

다음 내용 전체를 주소창에 넣고 실행해보세요. 즐겨찾기에 등록하시거나 툴바에 등록하시면 원하실 때 클릭하셔서 변환해보실 수 있습니다.

superwtk의 이미지

우와~~~ 이거 정말 좋군요 :D
(검은해님이 써주신 변환 스크립트 코드)

http://blog.superwtk.com/

민수의 이미지

매번 한 글자 한 글자 코드표에서 찾을 수가 없어서
문자 <-> Numeric HTML entity
자동변환기가 없을까해서 찾고 있었습니다.
스크립트로 간편하게 구현이 되는군요.
만드신 수고에 감사드립니다.

민수의 이미지

스크립트를 만들어 주셔서 감사합니다
간단하게 구현되어 무척 용이하군요

그런데 위의 스크립트에서는 Numeric Character 00128번(?)에서부터 변환이 되고
그 이전의 문자는 변환이 안되더군요 (예:키보드내의 특수문자나 알파벳, 숫자 등)
일부러 영문과 숫자 및 키보드 내의 문자는 그대로 남아있도록 만드신 듯한데
(HTML 태그 및 스크립트 소스 등은 그대로 남게 하는 역할이겠죠?)

이런 것들도 변환되도록 바꾸어봤습니다.
키보드 내의 영문,숫자,특수문자,스페이스 바 공백까지 다 변환이 됩니다.
(j==38 과 j<128 을 j==0 과 j<1 로 바꾸었습니다)

아래와 같습니다

javascript:p=(document.all)?document.selection.createRange().text:((window.getSelection)?%20window:document).getSelection().toString();if(!p)void(p=prompt('Text...',''));%20while(p){q='';for(i=0;i

*참고
HTML Numeric Character Entity 목록이 나와있는 다음의 사이트도 있습니다
http://awcfamily.com/awc/htmlchar.php

민수의 이미지

javascript:p=(document.all)?document.selection.createRange().text:((window.getSelection)?%20window:document).getSelection().toString();if(!p)void(p=prompt('Text...',''));%20while(p){q='';for(i=0;i<p.length;i++){j=p.charCodeAt(i);q+=(j==0)?'&':%20(j<1)?p.charAt(i):'&#'+j+';';}void(p=prompt(p,q));}

이렇게 넣어주면 되네요

Prentice의 이미지

원래 버젼은 제가 만든 것이 아니라 Orkut에서 퍼온 것이였습니다.

&#xACE0; 형식도 있으면 좋겠다 싶어서, 원래 버젼에다가 헥스 변환을 결합한 버젼을 올려봅니다.

Prentice의 이미지

파폭3에서는 안되는 것 같은데 누가 개조해주시면 감사하겠습니다.. ^^;

---

3.6에서 북마크를 업데이트(?)했더니 잘 되네요.

Prentice의 이미지

아참, 파이어폭스에서만 해봤지만.. HTML 렌더링 결과물을 긁어서 선택하신 후 툴바에 등록된 버튼을 누르면 선택 부위를 통째로 변환해줍니다.

민수의 이미지

긁어 주기만 해도 바로 변환되는지는 몰랐습니다
아주 편리하네요
Explorer 6.0 에서 문제없이 작동합니다

Prentice의 이미지

javascript:var%20hD=%220123456789ABCDEF%22;function%20d2h(d){var%20h=hD.substr(d&15,1);while(d>15){d>>=4;h=hD.substr(d&15,1)+h;}return%20h;}p=(document.all)?document.selection.createRange().text:((window.getSelection)?window:document).getSelection().toString();if(!p)void(p=prompt('Text...',''));while(p){q='';for(i=0;i<p.length;i++){j=p.charCodeAt(i);q+=(j==38)?'&':(j<128)?p.charAt(i):'U+'+d2h(j)+'%20';}q=q.replace(/\s+$/,%20'');void(p=prompt(p,q));}

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.