옛한글/발음기호 인코딩?

pjm0616의 이미지

돌아다니는 사전이 좀 마음에 안 들고, 종류도 적어서
디지털큐브사의 아이스테이션 V43이라는 PMP의 사전을 RE해서 사전 프로그램을 만들고 있습니다.
일단 디코딩은 거의 다 했습니다. 모든 사전이 utf-8로 저장되어 있었습니다.
그런데 옛말 사전의 옛한글과
영어사전의 발음기호,
그리고 [명], [부], [동] 같은 글자가 깨집니다.
PMP의 사전 프로그램에서 쓰는 T43*.qpf을 쓰면 잘 나옵니다.
검색도 좀 해 봤는데 안 나오네요.
인코딩이 다른 건지 아니면
유니코드에서 안쓰이는 부분을 사용한 후에
T43*.qpf에 넣은 것 같기도 하고 잘 모르겠네요.

일일히 알아려보다 너무 많아서 포기했습니다.
{"\xee\x82\x9a", "[기]"},
{"\xee\x82\x8e", "[동]"},
{"\xee\x82\x90", "{타}"},
{"\xee\x82\x95", "[형]"},

{"\xe6\x94\x1a", "[명]"},
{"\xe6\x94\x0a", "[형]"},
{"\xe6\x94\xe3", "[부]"},

이 파일은 영영, 영한, 한영, 국어, 부수, 한자, 사자성어, it, 옛한글 사전 중 몇 가지 항목을 뽑은 것입니다.
그 중(\x2d, - )등은 hex덤프입니다.
테스트하느라 좀 지저분합니다.

아시는 분 계시면 좀 도와주세요.

perky의 이미지

언급하신 글자들은 유니코드의 Private Use Area (E000-F8FF)로
표준이 없고 글꼴이나 프로그램이 사적으로 마음대로 쓰는 영역입니다.
따라서 직접 보시는 환경 외에서는 전혀 호환되지 않을 가능성이 높아서
다른 분께 도움을 요청하셔도 별로 도움이 되지 않을 것 같네요.

You need Python

Prentice의 이미지

영어 발음기호는 IPA 기반이 보통입니다. PUA를 쓰지 않고 공식(?) IPA 문자를 사용한 것이라면 Doulos SIL, Charis SIL, Gentium, DejaVu Sans등의 글꼴에서 보실 수 있습니다.

pjm0616의 이미지

옛한글은 한양 PUA로 돼 있었습니다.
ktug의 한양PUA -> 첫가끝 코드 변환기를 쓰니 되네요.
libcairo 문제때문에 굴림을 지워서 몰랐는데, 다시 설치하니 보이는군요.

문제는 발음기호인데
발음기호도 PUA에 있습니다.
이건 찾아봐도 안 보이네요.
이건 대조를 해 봐야 할 것 같습니다.