문자열변환(CP949 --> CP932)

글쓴이: rokmn3309 / 작성시간: 수, 2006/11/08 - 8:06오후

안녕하세요...
텍스트 데이터를 변환해볼려고 합니다.
원본은 CP932(일본어)인데 DB에 들어가 있는 형태는 CP949로 들어가 있습니다.
어떻게 해서 들어갔는지는 모르겠지만은.. 이 내용을 원래 CP932로 변환할려고 하는데 안되고 있습니다.
예를 들어서 설명드리면은

현재 나오는게 릐 (&# 47504;) 로 나옵니다.
이것이 CP949에서는 906C이고요, UTF는 U+B990입니다.
CP932에서 906C로 찾아보면 값은 人 (&# 20154;) 이고 U+4EBA입니다. 글자는 人로 원래 입력했던 글자입니다.

데이터를 읽어와서 CP949에서의 위치를 확인후, CP932에서 그 위치에 있는 값을 읽어와서 바꿀려고 하는데
어떻게 진행을 해야할지 모르겠군요...참고될만한 자료가 있다면 부탁드리겠습니다.

Forums:

프로그래밍 QnA

댓글 달기

원본이 CP932로 들어가 있는 것 같습니다.

글쓴이: suapapa / 작성시간: 목, 2006/11/09 - 9:51오전

이미 CP932(일본어)로 원본이 들어가 있는 것으로 보입니다.

이를 CP949인 한글 윈도(맞나요?)에서 보면,
데이타를 읽어올때 강제로 cp949로 디코딩 하기 때문에
'릐'같은 글자가 보이게 되는 것 입니다.

원본 파일을 cp932로 디코딩 하면 원래의 일본어가 잘 보일 것 입니다.
파이썬에서는 아래와 같이 하실 수 있습니다.

>>> s_cp949 = '\x90\x6c'#'릐'
>>> s_ucs2 = s_cp949.decode('cp932')
>>> print s_ucs2
人

'\x90\x6c'의 값을
'cp949'로 decode하면 '릐'(U+B990)가 되며,
'cp932'로 decode하면 '人'(U+4EBA)입니다. :)

답글

댓글 달기

이름

제목

댓글 *

텍스트 포맷에 대한 자세한 정보

텍스트 양식

Filtered HTML

텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
You can use Textile markup to format text.
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
Quick Tips:
- Two or more spaces at a line's end = Line break
- Double returns = Paragraph
- *Single asterisks* or _single underscores_ = Emphasis
- **Double** or __double__ = Strong
- This is [a link](http://the.link.example.com "The optional title text")
For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

HTML 태그를 사용할 수 없습니다.
web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
줄과 단락은 자동으로 분리됩니다.

CAPTCHA

이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.

부 메뉴

문자열변환(CP949 --> CP932)

원본이 CP932로 들어가 있는 것 같습니다.

댓글 달기

Filtered HTML

BBCode

Textile

Markdown

Plain text

주 메뉴

둘러보기

부 메뉴

현재 위치

문자열변환(CP949 --> CP932)

원본이 CP932로 들어가 있는 것 같습니다.

댓글 달기

Filtered HTML

BBCode

Textile

Markdown

Plain text

주 메뉴

검색 폼

둘러보기

사용자 로그인

Oauth2 Login :