cinsk님이 말씀해주신 링크에도 나와있듯, HTML에서는 &같은 것들은 character entity라고 부르고, å나 å 같은 것들은 numeric character reference라고 부르는 것 같습니다. Numeric character reference들은 그냥 유니코드 번호로 문자를 쓰기 위한(?) 거죠.
그런데 위의 스크립트에서는 Numeric Character 00128번(?)에서부터 변환이 되고
그 이전의 문자는 변환이 안되더군요 (예:키보드내의 특수문자나 알파벳, 숫자 등)
일부러 영문과 숫자 및 키보드 내의 문자는 그대로 남아있도록 만드신 듯한데
(HTML 태그 및 스크립트 소스 등은 그대로 남게 하는 역할이겠죠?)
이런 것들도 변환되도록 바꾸어봤습니다.
키보드 내의 영문,숫자,특수문자,스페이스 바 공백까지 다 변환이 됩니다.
(j==38 과 j<128 을 j==0 과 j<1 로 바꾸었습니다)
10진수를 쓴 &#D;
10진수를 쓴 &#D; 형태와 16진수를 쓴 &#xH; 형태가 있습니다. 각각 D와 H 자리에 수치가 들어갑니다. 이 수치는 UCS (unicode라 생각하면 됨) 문자 index입니다.
참고: http://www.w3.org/TR/html4/charset.html#entities
--
C FAQ: http://www.eskimo.com/~scs/C-faq/top.html
Korean Ver: http://www.cinsk.org/cfaqs/
C FAQ: http://www.eskimo.com/~scs/C-faq/top.html
Korean Ver: http://cinsk.github.io/cfaqs/
만드는 방법은 ....
만드는 방법은 .... 언어마다 제공하는 함수 또는 라이브러리가 있습니다. 예를 들어 자바스크립트라면 encodeURI 함수를 사용하시면 되구요, 자바라면 URLEncoder 클래스를 사용하시면 됩니다.
Shell에서도 쉽게 알
Shell에서도 쉽게 알 수 있습니다.
x86과 같이 little endian을 쓰는 시스템에서는:
$ echo "안녕" | iconv -t UCS-4LE | od -t xL
0000000 0000c548 0000b155 0000000a
0000014
따라서 "안녕"을 "안녕"로 쓸 수 있습니다.
big endian을 쓰는 시스템에서는 UCS-4LE 대신 UCS-4BE를 쓰면 됩니다.
전체 목록을 다 살펴보는 것은 따로 책을 주문해야 하지만, online으로 보려면
Unicode Charts
에 가 보시기 바랍니다.
--
C FAQ: http://www.eskimo.com/~scs/C-faq/top.html
Korean Ver: http://www.cinsk.org/cfaqs/
C FAQ: http://www.eskimo.com/~scs/C-faq/top.html
Korean Ver: http://cinsk.github.io/cfaqs/
gucharmap을 실행하셔도 보실 수 있습니다.
cinsk님이 말씀해주신 링크에도 나와있듯, HTML에서는 &같은 것들은 character entity라고 부르고, å나 å 같은 것들은 numeric character reference라고 부르는 것 같습니다. Numeric character reference들은 그냥 유니코드 번호로 문자를 쓰기 위한(?) 거죠.
gucharmap을 실행하셔도 보실 수 있습니다.
변환 스크립트
다음 내용 전체를 주소창에 넣고 실행해보세요. 즐겨찾기에 등록하시거나 툴바에 등록하시면 원하실 때 클릭하셔서 변환해보실 수 있습니다.
우와~~~ 이거 정말
우와~~~ 이거 정말 좋군요 :D
(검은해님이 써주신 변환 스크립트 코드)
http://blog.superwtk.com/
변환 스크립트 감사합니다!
매번 한 글자 한 글자 코드표에서 찾을 수가 없어서
문자 <-> Numeric HTML entity
자동변환기가 없을까해서 찾고 있었습니다.
스크립트로 간편하게 구현이 되는군요.
만드신 수고에 감사드립니다.
조금 수정해보았습니다
스크립트를 만들어 주셔서 감사합니다
간단하게 구현되어 무척 용이하군요
그런데 위의 스크립트에서는 Numeric Character 00128번(?)에서부터 변환이 되고
그 이전의 문자는 변환이 안되더군요 (예:키보드내의 특수문자나 알파벳, 숫자 등)
일부러 영문과 숫자 및 키보드 내의 문자는 그대로 남아있도록 만드신 듯한데
(HTML 태그 및 스크립트 소스 등은 그대로 남게 하는 역할이겠죠?)
이런 것들도 변환되도록 바꾸어봤습니다.
키보드 내의 영문,숫자,특수문자,스페이스 바 공백까지 다 변환이 됩니다.
(j==38 과 j<128 을 j==0 과 j<1 로 바꾸었습니다)
아래와 같습니다
javascript:p=(document.all)?document.selection.createRange().text:((window.getSelection)?%20window:document).getSelection().toString();if(!p)void(p=prompt('Text...',''));%20while(p){q='';for(i=0;i
*참고
HTML Numeric Character Entity 목록이 나와있는 다음의 사이트도 있습니다
http://awcfamily.com/awc/htmlchar.php
조금 수정해보았습니다
javascript:p=(document.all)?document.selection.createRange().text:((window.getSelection)?%20window:document).getSelection().toString();if(!p)void(p=prompt('Text...',''));%20while(p){q='';for(i=0;i<p.length;i++){j=p.charCodeAt(i);q+=(j==0)?'&':%20(j<1)?p.charAt(i):'&#'+j+';';}void(p=prompt(p,q));}
이렇게 넣어주면 되네요
헥스 버젼
원래 버젼은 제가 만든 것이 아니라 Orkut에서 퍼온 것이였습니다.
고 형식도 있으면 좋겠다 싶어서, 원래 버젼에다가 헥스 변환을 결합한 버젼을 올려봅니다.
(수정) 파폭3에서도 되네요.
파폭3에서는 안되는 것 같은데 누가 개조해주시면 감사하겠습니다.. ^^;
---
3.6에서 북마크를 업데이트(?)했더니 잘 되네요.
아참,
아참, 파이어폭스에서만 해봤지만.. HTML 렌더링 결과물을 긁어서 선택하신 후 툴바에 등록된 버튼을 누르면 선택 부위를 통째로 변환해줍니다.
그런 기능이 있었군요
긁어 주기만 해도 바로 변환되는지는 몰랐습니다
아주 편리하네요
Explorer 6.0 에서 문제없이 작동합니다
Unicode notation
댓글 달기