유니코드 5.1에서는 첫가끝 낱자가 더 추가됩니다.

익명 사용자의 이미지

http://www.unicode.org/alloc/Pipeline.html 페이지에 따르면,

115A..115E: 옛한글 초성 5자
11A3..11A7: 옛한글 중성 5자
11FA..11FF: 옛한글 종성 6자
A960..A97C: 옛한글 초성 29자 (한글 자모 확장-A 영역: A960..A97F)
D7B0..D7C6: 옛한글 중성 23자 (한글 자모 확장-B 영역: D7B0..D7FF)
D7CB..D7FB: 옛한글 종성 49자

모두: 옛한글 초성 34자, 옛한글 중성 28자, 옛한글 종성 55자

가 더해진다고 합니다. 한양 PUA에만 있고 첫가끝에는 없는 낱자도 유니코드 다음 버전에선 거의 모두 공식적으로 추가될 것 같습니다.
날개셋 한글 입력기도 저 체계를 따를 것이라고 합니다.

그런데 저걸 보니 참 안습이군요. 한글 낱자도 확장 로마자나 한자, 마소의 확장 완성형처럼 누더기가 된다니.

onion의 이미지

그냥 나오기만 하면.. 이정도면 괜찮지않나...정도..-.-;

-----새벽녘의 흡혈양파-----

-----새벽녘의 흡혈양파-----

경의 이미지

s/11A3..11A7: 옛한글 중성 6자/11A3..11A7: 옛한글 중성 5자/
아래 합계도요.

Quote:
그런데 저걸 보니 참 안습이군요. 한글 낱자도 확장 로마자나 한자, 마소의 확장 완성형처럼 누더기가 된다니.

이건 무슨 뜻이죠?
에멜무지로의 이미지

오류 정정했습니다.

한자는 뭐 유니코드에서 이미 난장판 누더기가 다 됐고, 로마자도 확장 A, 확장 B 식으로 따로따로 흩어져 있으니 걔들도 한자처럼 누더기 상태고, 확장 완성형은 뭐 말할 것도 없지요.
한글 낱자도 저런 식으로 누더기로 변해 버린다는 게 안타깝다는 뜻입니다.

neocoin의 이미지

현재 unicode 는 가나다순으로 빼곡히 잘 정렬되어 있고, 이후 발견된 옛한글을 예약된 빈 코드 페이지 뒷부분에
끼워넣으려고 하니 누더기가 된다는 의미 아닐까요?

아니라면 정정해주세요. 저도 궁금합니다. :)

현대어의 unicode는 그냥 이진 정렬만하면 가나다 정렬이 되는 반면 저렇게 되어버리면 정렬을 위한 오토마타가 따로 필요합니다.

에멜무지로의 이미지

맞습니다. 저렇게 하면 정렬할 때 테이블을 만들어야 하죠.
그리고 한글 낱자가 1992년 이후 15년만에, 너무 늦게 추가되는 거죠.

덧붙임: 아직 저 제안의 ISO 상태는 현재 4입니다. 적어도 6, 7 정도는 돼야 유니코드 5.1에 등록될 것입니다.

masoris의 이미지

어차피 지금도 한글 정렬을 위해, 데이터베이스와 알고리즘을 사용하고 있지 않나요? 한글 자체만 해도 완성형, 조합형, 호환자모, 반각자모 네 종류가 있고, 거기에 한자를 가나다 순으로 정리 해야 한다는 것을 생각하면 데이터베이스와 알고리즘은 필수 이지요.

____
The limits of my language mean the limits of my world. - Ludwig Wittgenstein


____
The limits of my language mean the limits of my world. - Ludwig Wittgenstein

MasterQ의 이미지

유니코드 옛한글을 맨처음에 넣을때 로비만 2년을 했다고 합니다. 그리고 새로운 안이 채택되려면 다른 나라에서도 다 동의를 해야하는데 이 일도 장난이 아니라고 합니다. 그나마 새로 발견된 옛한글들이 이렇게라도 들어가게 된것도 다행이라고 생각하고, 누더기가 되었다고 비판하기 전에 왜 그렇게 밖에 될 수 밖에 없었는지 생각해 보고 얼마나 힘든 노력끝에 옛글이 들어가는지, 그리고 unicode usergroup에서 활발하게 참여하는게 훨씬 더 발전적이라고 생각합니다.

참고로 정렬부분은 이미 예전부터 1100 - 1112 (ㄱ 부터 ㅎ까지)뒤에 ᄓ(1113) 나올때부터 어긋나 있었고, 이것들을 위한 처리는 어차피 따로 할수 밖에 없었으므로 지금 들어가는 것들이 누더기라는 표현에는 동의하기 어렵군요..

남십자성의 이미지

한글영역의 남는곳에 새로운 문자를 넣은 폰트를 만들려고 했는데 망했네요.

남십자성의 이미지

왜 안하는지 어차피 안되겠지만

남십자성의 이미지

유한회사의 약자로 사용되고 있는데 왜 추가안되는지

남십자성의 이미지

한글 인코딩에 추가해야 되는데