euc-kr 에서 utf-8 형식으로 파일 인코딩을 변환하였는데
파일 내용중에 한글이 다 꺠져서 보이더라구요...
이거 파일 내용까지 인코딩 해주는 방법이 있을까요???
iconv -f euckr -t utf8 sourcefile.txt > targetfile.txt
세벌 https://sebuls.blogspot.kr/
이렇게 변경 하니까 기존에 작성되어 있던 한글이 깨져서 보이는데
그게 안깨지게 변경하는 방법이 있을까요?
원본 파일이 euckr , 변환 후 파일이 utf-8 형식 맞나요? 깨져 보인다는 게 vi에서 볼 때 그렇다는 건가요? cat 으로 볼 때 그런 건가요?
김정균 님의 답글 읽어보시면 도움이 될 것 같습니다.
원본이 euckr이구요 변환파일이 utf-8입니다. 확인해보니 vi에서도 깨지고....cat에서도 깨져서 보입니다...
vi sourcefile.txt
vi targetfile.txt
vim 을 사용하시면, /etc/vimrc 의 처음에 보면 fileencoding 설정이 있습니다. 이 부분을 다음과 같이 수정해 보세요. 이렇게 하면 굳이 변경하지 않아도 깨지지 않게 볼 수 있습니다.
if v:lang =~ "utf8$" || v:lang =~ "UTF-8$" if v:lang =~ "^ko" set fileencodings=ucs-bom,utf-8,cp949 else set fileencodings=ucs-bom,utf-8,latin1 endif else if v:lang =~ "^ko" set fileencodings=cp949,utf-8,ucs-bom else set fileencodings=latin1,utf-8,ucs-bom endif endif
만약 root 권한이 없다면 홈디렉토리에 .vimrc 를 만들어 넣으셔도 됩니다.
단순히 파일 내용의 문자셋을 변경 하고 싶은 거라면, 먼저 답변 주신 분이 제시한 방법으로 하시면 됩니다.
$ echo $LANG ko_KR.UTF-8 $ cat sourcefile.txt 안녕하세요. $ iconv -f utf8 -t euckr sourcefile.txt > targetfile.txt $ cat targetfile.txt | iconv -f euckr -t utf8 안녕하세요. $ echo "import chardet; raw=open('sourcefile.txt', 'rb').read(); print chardet.detect(raw)" | python2 - {'confidence': 0.9690625, 'encoding': 'utf-8'} $ echo "import chardet; raw=open('targetfile.txt', 'rb').read(); print chardet.detect(raw)" | python2 - {'confidence': 0.6666666666666666, 'encoding': 'EUC-KR'}
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
iconv -f euckr -t utf8
세벌 https://sebuls.blogspot.kr/
이렇게 변경 하니까...
이렇게 변경 하니까 기존에 작성되어 있던 한글이 깨져서 보이는데
그게 안깨지게 변경하는 방법이 있을까요?
원본 파일이 euckr , 변환 후 파일이 utf-8
원본 파일이 euckr , 변환 후 파일이 utf-8 형식 맞나요?
깨져 보인다는 게 vi에서 볼 때 그렇다는 건가요? cat 으로 볼 때 그런 건가요?
김정균 님의 답글 읽어보시면 도움이 될 것 같습니다.
세벌 https://sebuls.blogspot.kr/
원본이 euckr이구요 변환파일이 utf-8입니다.
원본이 euckr이구요 변환파일이 utf-8입니다.
확인해보니 vi에서도 깨지고....cat에서도 깨져서 보입니다...
두 파일 다 깨져 보이나요?
어느 파일이 깨져보이나요?
세벌 https://sebuls.blogspot.kr/
vim 을 사용하시면, /etc/vimrc 의 처음에
vim 을 사용하시면, /etc/vimrc 의 처음에 보면 fileencoding 설정이 있습니다. 이 부분을 다음과 같이 수정해 보세요. 이렇게 하면 굳이 변경하지 않아도 깨지지 않게 볼 수 있습니다.
만약 root 권한이 없다면 홈디렉토리에 .vimrc 를 만들어 넣으셔도 됩니다.
단순히 파일 내용의 문자셋을 변경 하고 싶은 거라면, 먼저 답변 주신 분이 제시한 방법으로 하시면 됩니다.
$ echo $LANG
댓글 달기