[완료] 파이썬에서 유니코드 처리, 한자한글변환기

masoris의 이미지

안녕하세요. 전번에 한자한글변환기를 만들려고 파이썬을 배운 사람입니다.
kldp.org에 혼자서 프로젝트(http://kldp.net/projects/hanja/) 만들고, 혼자서 프로그래밍하고, 혼자서 쓰고, 혼자서 버그수정하고 있습니다. -_-
가끔씩 생각날 때마다 조금씩 조금씩 만들어 가고 있는데, 언제쯤 OOo에 매크로로 추가 가능할 정도로 완성될 지 모르겠습니다.

지금까지 만든것을 파일로 첨부 하였습니다.
이 때까지 문제가 발생하면 혼자 문서 찾아 가면서 해결했는데, 이제 좀 질문을 할 때가 온것 같습니다.

1.
윈도우에서 글자가 깨져 나와서, 내부 문자 형식을 모두 unicode로 바꾸었습니다. 다른것은 모두 잘 되는데, 이것은 어떻게 해야 할지 모르겠습니다. (참고로 제가 사용하는 파이썬 버전은 2.4.4입니다.)

convert(unicode(raw_input('\n入'+str(times)+'> '), sys.getfilesystemencoding()))
#str형태를 아래처럼 unicode로 바꾸었더니,

convert(unicode(raw_input(u'\n入'+unicode(times)+u'> '), sys.getfilesystemencoding()))
#실행과 동시에, 인코딩 오류가 발생합니다.

제가 생각할 때에는 raw_input이 parameter로 unicode 타입을 받지 않는것 같습니다. 저는 '入'글자가 정상적으로 출력되게 하고 싶은데, 어떻게 해결해야 할까요?

2.
if type(mode) is not type(unicode()):mode = unicode(mode, defaultencoding)
위의 문장을 깔끔하게 줄일 수 없을까요?

File attachments: 
첨부파일 크기
Binary Data hanja.tar.gz871.21 KB
hongminhee의 이미지

1.

http://boodebr.org/main/python/all-about-python-and-unicode#WHYNOPRINT
http://personalpages.tds.net/~kent37/blog/stories/14.html#understanding-the-console-encoding

2.

아래와 같이 줄일 수 있습니다.

if type(mode) is not unicode:
    mode = mode.decode(defaultencoding)

단순히 mode is-a unicode 관계를 확인하는 것이라면, isinstance를 쓰면 됩니다.

if not isinstance(mode, unicode):
    mode = mode.decode(defaultencoding)
masoris의 이미지

감사합니다. 해결하였습니다 :)


____
The limits of my language mean the limits of my world. - Ludwig Wittgenstein

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.