iconv 이용해서 파일 인코딩 변환 질문있습니다..

bao의 이미지

euc-kr 에서 utf-8 형식으로 파일 인코딩을 변환하였는데

파일 내용중에 한글이 다 꺠져서 보이더라구요...

이거 파일 내용까지 인코딩 해주는 방법이 있을까요???

세벌의 이미지

iconv -f euckr -t utf8 sourcefile.txt > targetfile.txt
bao의 이미지

이렇게 변경 하니까 기존에 작성되어 있던 한글이 깨져서 보이는데

그게 안깨지게 변경하는 방법이 있을까요?

세벌의 이미지

원본 파일이 euckr , 변환 후 파일이 utf-8 형식 맞나요?
깨져 보인다는 게 vi에서 볼 때 그렇다는 건가요? cat 으로 볼 때 그런 건가요?

김정균 님의 답글 읽어보시면 도움이 될 것 같습니다.

bao의 이미지

원본이 euckr이구요 변환파일이 utf-8입니다.
확인해보니 vi에서도 깨지고....cat에서도 깨져서 보입니다...

세벌의 이미지

vi sourcefile.txt

vi targetfile.txt

어느 파일이 깨져보이나요?
김정균의 이미지

vim 을 사용하시면, /etc/vimrc 의 처음에 보면 fileencoding 설정이 있습니다. 이 부분을 다음과 같이 수정해 보세요. 이렇게 하면 굳이 변경하지 않아도 깨지지 않게 볼 수 있습니다.

if v:lang =~ "utf8$" || v:lang =~ "UTF-8$"
   if v:lang =~ "^ko"
       set fileencodings=ucs-bom,utf-8,cp949
   else
       set fileencodings=ucs-bom,utf-8,latin1
   endif
else
   if v:lang =~ "^ko"
       set fileencodings=cp949,utf-8,ucs-bom
   else
       set fileencodings=latin1,utf-8,ucs-bom
   endif
endif

만약 root 권한이 없다면 홈디렉토리에 .vimrc 를 만들어 넣으셔도 됩니다.

단순히 파일 내용의 문자셋을 변경 하고 싶은 거라면, 먼저 답변 주신 분이 제시한 방법으로 하시면 됩니다.

bushi의 이미지

$ echo $LANG
ko_KR.UTF-8
 
$ cat sourcefile.txt
안녕하세요.
 
$ iconv -f utf8 -t euckr sourcefile.txt > targetfile.txt
 
$ cat targetfile.txt | iconv -f euckr -t utf8
안녕하세요.
 
$ echo "import chardet; raw=open('sourcefile.txt', 'rb').read(); print chardet.detect(raw)" | python2 -
{'confidence': 0.9690625, 'encoding': 'utf-8'}
 
$ echo "import chardet; raw=open('targetfile.txt', 'rb').read(); print chardet.detect(raw)" | python2 -
{'confidence': 0.6666666666666666, 'encoding': 'EUC-KR'}

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.