UTF-8로 가야할지 아니면 계속 EUCKR을 고집해야 할지..

ertos12의 이미지

지금까지 아무 고민없이 EUC KR을 사용해 왔고, 직장에서도 집에서도 EUC KR로 사용했었는데..
Fedora Core가 나오면서 부터는 UTF-8이 기본이라서 영 불편하네요..
최근에 집에서 쓰던 PC를 새로이 설치하느라고 Fedora Core 5를 설치하고 보니, 점점 Euc-KR에 대한 부분들이 점점 더 없어지는것 같아서.. 하지만 직장에서 작업하는 source code들이나 기타 문서들이 모두 EucKR로 되어 있어서..
그런데.. 최근에 거의 모든 배포본들이 UTF-8을 기본으로 출시되던데.. 고민이네요..
이번 기회에 모든것을 UTF-8로 가져가야 할지.. 아니면 EUC KR로 계속 고집해야 할지요..

다른 분들은 어떠신지.. UTF-8이 대세이니 따라야 할까요?

아니면 EUC-KR을 계속 고집해야 할까요?

둘은 같이 사용할 방법은 없을까요? (^^ 희망 사항이네요..)

lacovnk의 이미지

vi 같은 경우 인코딩을 자동으로 잡아줍니다.

대부분의 잘 쓰이는 편집기들은 인코딩을 잘 처리해주지 않나요?

저는 그런 것 보다... MS윈도우에서의 금칙 문자 때문에 좀 불편합니다. 다운 받으면 저장할 수 없는 현상이 발생하더군요 -o-;

http://home.lacovnk.net/

마잇의 이미지

일반적인 텍스트 파일들은 iconv로 일괄적으로 변환해주면 되긴 합니다. 파일명은 convmv로 해주고...
변환하지 않고 그냥 쓰시겠다면 저는 vim을 편집기로 쓰는데 자동으로 변환해서 읽어들여 줍니다.
set fencs=ucs-bom,utf-8,cp949
utf-8파일은 utf8로 읽어서 저장도 그렇게 하고 EUC-KR(CP949)도 그렇고...
어지간한 편집기는 이런 기능 지원될겁니다.

저는 그외에 불편한 점이라면 zip파일 풀었을때 안에 한글 파일들 깨져보이는 점, 이건 unzip을 패치해서 해결되더군요.

mp3파일 id3tag 깨져보이는거, 이건 해결하다 짱나서 포기했습니다. 제가 easytag를 제대로 못쓰는건지 제대로 지원이 안되는건지... 인코딩 관련 옵션이 있기는 있는데 기대대로 작동이 안되더군요. mp3 잘 듣는 편은 아니라 팽개쳐두고 있습니다. 이것도 bmp를 쓰면 인코딩 설정이 있어서 상관은 없지만 리듬박스에서 제대로 나오게 할려고 시도한 것이었습니다. 결국 리듬박스도 bmp처럼 설정할 수 있게 패치가 되었습니다.

저는 이 정도 경험이네요.

온세상 데이터가 얼른 UTF-8로 변해서 인코딩 어쩌구 이런 설정좀 안만지고 살았으면 해서 UTF-8 사용중입니다.
10년은 더 걸릴려나요 -_-

--
마잇


--
마잇

랜덤여신의 이미지

전 UTF-8 씁니다. 제 경우에는 unzip 패치하고 각종 프로그램에서 euc-kr 을 쓰도록 설정 한두 개만 바꿔줘도 거의 문제가 없던데요.

어떤 점에서 불편함을 겪으셨다는 것인지 더 자세히 말씀해 주세요.
문서가 EUC-KR 로 되어 있다고 말씀하셨는데, 대부분의 에디터는 UTF-8 환경에서도 EUC-KR 문서를 읽을 수 있습니다.

저는 음악 플레이어로 리눅스에서는 amaroK 을 쓰고, 윈도에서는 foobar2000 을 쓰는데, id3 태그가 잘 보입니다.
----
블로그 / 리눅스 스크린샷 갤러리 / 듣는 음악 통계
지금 듣는 곡:

nahs777의 이미지

저도 모두 UTF-8 입니다. 제 경우에는 unzip 패치는 뭔지 몰라서 안쓰고. kldp.net 에 junzip 을 쓰고 있고, 나머지는 거의 기본으로 쓰고있는데 문제가 없습니다. kate 를 주로 쓰기 때문에, 텍스트 인코딩 신경쓸필요도 없는것같고, 윈도우에서는 emeditor 가 notepad 등을 완전히 대체했기 떄문에 불편함이 없습니다..

처음엔 mp3 태그가 좀 문제였지만, id3v2 로 다 옮기고 itunes , amarok 로 들으니 문제가 없습니다..

아직까지 문제는 웹서버문제가 있긴하네요..ㅠㅠ

작은상자의 이미지

저도 UTF8로 써요.
원래는 euckr로 바꾸어서 썼었는데..
설정 바꾸는게 귀차나서 그냥 쓰고 있어요.
어자피 대세는 utf8이라서.
원도구쪽만 넘어오면 좋을듯 한데.. 아직 안넘어오는군요.
그래도 언젠간 오겠죠.

아치리눅스 한국 사용자 모임 : http://arch.korea.com/

galien의 이미지

저도 mp3파일들의 id태그 외에는 아무 문제없이
UTF-8로 잘 쓰고 있습니다.

좀 작고 가벼운 mp3을 선호하는 터라 amarok은 설치만 하고 안쓰고 있는데..

id3v2를 더 디벼봐야겠습니다.

병맛의 이미지

뷁, 셺, 이런 글자 쓰면서 사세요.

lifthrasiir의 이미지

무달 님, euc-kr에서 표현 못 하는 글자는 뷁, 섊 외에도 무지 많습니다. 대표적으로 일본어 제목이 달린 곡들은 심심할 때마다 깨지죠.

- 토끼군

danskesb의 이미지

러시아어 제목과 한글 제목 같이 섞어도 심심하면 꺠지죠.

블로그 주소 바꿨어요
http://ubuntu.ksa.hs.kr

Prentice의 이미지

MP3 말고 Ogg Vorbis 사용하시면 인코딩이 UTF-8로 고정돼있어서 편합니다. :)

lacovnk의 이미지

저도 이 이유로 새로 뜨는 파일은 그냥 모두 ogg로...

ogg지원 mp3p들이 태그도 잘 지원하려나 걱정이 되긴 합니다 -o-

http://home.lacovnk.net/

Anonymous1의 이미지

mp3를 안들으면 됩니다. ^^

superkkt의 이미지

vi에서 기본으로 변환을 해주나요? utf-8 환경에서 euc-kr 문서를 읽어서 편집하고 저장하려고 하니 변환 에러 어쩌고 하면서 안되더라구요. 혹시 다른 설정을 해줘야 하나요?

======================
BLOG : http://superkkt.com

======================
BLOG : http://superkkt.com

송효진의 이미지

euckr 에서 지원하지 않는 글자를 적으면 그렇더군요.
vim 에서 읽어들일때는 utf8 로 변환되었으니 다 적어지는데,
저장할 때 euckr 로 변환하다가 에러가 나버리면 저장이 안됩니다. -_-;

emerge money

랜덤여신의 이미지

euc-kr 말고 cp949 를 쓰면 될 것 같습니다. 최소한 한국어는 완벽하게 표현이 가능하겠지요. 물론 일본어 약자 등 다국어 문자들은 깨지겠지만...
----
블로그 / 리눅스 스크린샷 갤러리 / 듣는 음악 통계
지금 듣는 곡:

Prentice의 이미지

set encoding=utf-8
set fileencodings=utf-8,euc-kr

Vim의 경우 위와 비슷하게 설정해주시면 됩니다.

superkkt의 이미지

여기서 논의된 방법을 사용하면 본인이 사용하기에는 충분합니다만 문제가 다른 사람에게 문서나 소스코드를 넘겨줬을때 상대방이 볼 수 없다는거네요. 바꾸기가 쉽지 않군요..

======================
BLOG : http://superkkt.com

======================
BLOG : http://superkkt.com

Prentice의 이미지

남한테 소스코드를 받을 만한 정도의 사람이라면 UTF-8을 다룰 수 있을 것입니다. ;)

문서라면.. 윈도 2000서부터는 메모장도 UTF-8을 지원합니다.

ratmhun의 이미지

윈도우에서 FTP로 파일을 전송하는데 한글 파일명이 와장창 깨집니다. 이것도 utf-8문제 아니던가요? 이 문제를 해결하려고 검색해보니 utf-8을 지원하는 ftp 프로그램을 쓰면 된다는데 그래서 찾은게 저 filezila나 스마트 ftp였습니다.
하지만 filezila나 스마트ftp 역시 파일을 업로드하면 업로드한 프로그램 안에서는 한글 파일명이 제대로 보이거든요? 그런데 리눅스로 돌아와서 업로드된 파일을 확인해보면 한글 파일명이 깨져 있습니다.

해결 방법은 없나요? 아니면 utf-8을 쓰는 리눅스에서는 이 문제를 해결할 수 있는 방법 자체가 없나요?

snu21의 이미지

저도 ratmhun님 처럼 윈도우와 파일 전송 문제 때문에
어쩔수 없이 euckr을 사용하고 있습니다.
리눅스를 주로 백업용으로 사용해와서 그간 저장해놓은
윈도우 자료를 다 손 볼 수가 없던구요.
윈도우도 얼른 utf-8으로 되야할텐데요. 쩝.
리눅스를 마음대로 할때까지

----------------
리눅스를 마음대로 할때까지

Prentice의 이미지

filezilla에서 정말 UTF-8 기반(?) 파일 시스템에 UTF-8로 파일 명을 업로드시키신 게 맞나요? 캐릭터셋 설정이나 마운트 옵션 조절로 해결 가능할 것 같은데요..

ratmhun의 이미지

검은해님, 윈도우에서 만든 파일명은 기본적으로 UTF-8이 아니지 않나요? 반면에 파일을 올리려는 FTP 서버는 페도라5니까 UTF-8이구요.
그러면 업로드해도 파일이름이 깨지는게 맞는거 아닌가요?
파일 질라에서 찾아봤는데 올리는 파일 이름을 변환하는 기능 같은 건 못찾겠던데요?

mach의 이미지

utf-8 씁니다.

------------------ P.S. --------------
지식은 오픈해서 검증받아야 산지식이된다고 동네 아저씨가 그러더라.

------------------ P.S. --------------
지식은 오픈해서 검증받아야 산지식이된다고 동네 아저씨가 그러더라.

lunatine의 이미지

아마 우분투 대퍼로 옮겼을 작년 말로 기억합니다.
그 때 파일명을 전부 UTF-8로 바꾸는 대대적인 공사를 했습니다.

그리고 삼바 설정은 외부 euc-kr 내부 utf-8로 설정을하고
FTP클라이언트는 FileZilla로 UTF-8로 접속해서 쓰고
그래서 지금은 큰 불편이 없습니다.

최근에 MP3파일의 ID3Tag를 유니코드로 바꾸는게 문제였는데..
Tag&Rename이란 윈도우 어플을 이용해서 (트라이얼버전)
상당히 손쉽게 변환하였습니다.

개인적인 생각이지만 리눅스를 사용할 때는 UTF-8을 쓰는게
더 편리한것 같습니다.

================
Lunatine
================

Prentice의 이미지

ratmhun님, 잘 찾아보시면 있는 것으로 알고 있습니다. 다른 프로그램에는 잘 없는 기능이지만요.

[질문]유니코드 지원 ftp 클라이언트?

위 링크에 나온 내용으로 해결이 안된다면 bbs.kldp.org에서 filezilla로 검색해보시면 아마 답이 나올 것 같습니다.

advck1123의 이미지

FILEZILLA 유저인데요..
사이트 관리자에서 사이트 추가시 나오는 옵션 중에 고급 설정인가(?)가 있는데... 그쪽 어딘가에서 UTF-8 항목을 본것같긴 한데..
PS - 윈에서의 설정 방법이에요.. 이 방법이 맞았으면 (..~하는~~))

ratmhun의 이미지

결국 알아냈습니다. 그런데 옵션 찾기가 정말 힘드네요;;

flux의 이미지

미래를 위해서라도 UTF-8로 전환하는게 바람직 할듯 보입니다.

편리함을 추구할지, 익숙함을 추구할지 선택은 자유지만...

slashdot의 이미지

윈도에서 파일 업로드시 utf-8 지정..
Secure CRT 에서도 utf-8 지정..

메일 보낼때도 euc-kr 로 받고 .. 흠 많이 불편해요..utf-8..

netj의 이미지

bash에선
export LC_ALL=ko_KR.UTF-8
export LANG=$LANG

vim에선
set encoding=utf-8
set fileencodings=ucs-bom,utf-8,korea

mutt에선
set assumed_charset=utf-8:cp949
set strict_mime=no
set config_charset = cp949 # 아쉽게도 설정 파일 자체는 cp949입니다 :(
set file_charset=utf-8:cp949
set send_charset=utf-8:cp949

charset-hook windows-949 cp949
charset-hook ks_x_1001-1997 cp949
charset-hook ks_c_5601-1987 cp949
charset-hook 5601 cp949

터미널은 gnome-terminal이나 PuTTY에서 UTF-8으로 놓고 씁니다.

Cygwin에서 Windows의 UTF-8 파일이름에 접근하지 못해서 rsync 따위를 쓰기가 어렵다는 문제를 빼고는 다 괜찮은 것 같습니다. 물론 이 문제도 윈도우즈에서 공유시켜놓고 Linux 등에서 smbfs로 utf-8으로 mount하면 접근하면 그나마 위로는 가능하고요..

mp3는, iTunes를 쓰는 관계로 이미 다 UTF-8을 쓰고 있군요.

Cygwin에서면 모를까,
아직도 ko_KR.eucKR을 쓰시는 분들이 계셨군요! ;)

--
The Devil is in the Details.

ertos12의 이미지

결국은 US-ASCII와의 호환성에 중심을 두고.. 0x7F 이후의 character 즉, 7bit US-ASCII 문자 Table에서 0x7F까지의 문자는 ASCII나 UTF-8이나 동일하게 표현되고 그 이상의 값을 가지는 문자들에 대해서는 결국 Multibyte로 표현하는 방법인데..

아무튼, UTF-8로 쉽게 결정하지 못하는 것은 CVS로 관리되고 있는 많은 Project Source Code들(한글 comment가 되어있는 몇몇 File들..)과 한글 File명으로 되어있는 File들,.. 한글로 작성된 문서들.. 이런 것들때문에.. 쉽게.. eucKR에서 UTF-8로 전환을 결정하지 못하고 있네요..
아~ 그냥 UTF-8, eucKR 구분없이 모두 사용하는 방법은 없을까? ^^(넋두리..)

마잇의 이미지

Quote:
여러가지 이유가 있겠지만, 엄연히 2byte 문자권까지 고려하여 국제적으로 정한 UTF-16이나 UTF-32가 있는데도 불구하고, 1byte 문자권을 기준으로 UTF-8로 몰고 가는것은 좀 문제가 있지 않나요?
물론, 전체 Data Size라든가.. 뭐.. 이런거 고려된다면.. UTF-16이나 32가 1 Byte 문자권에게는 낭비처럼 생각되겠지만..
쩝~ 뭐.. Stream상에서나 Data 통신상에서 Multi-Language 지원하도록 프로그래밍 하시는 분들은 UTF-8로 Multi-Language 처리하는게, 특히나 2Byte 문자권 Language와 1Byte 문자권 Language가 섞여 있는 경우 어떤지 아실테지요..

암튼, 아직도.. 뭐.. 이 이유하고는 상관없이 망설이고 있는것은 사실입니다... CVS에 있는 모든 File(한글로 Comment되어있는..)들, Document들, 한글 파일명의 file들을 전부 어떻게 해야할지.. 에구~

유니코드의 인코딩 방법으로 UTF-8이 많이 사용된 이유가 적어도 ascii(iso-8859-1?) 인코딩과는 호환이 되었기 때문이라고 들어서 그런가 보다 했는데, 프로그래밍적인 관점에서는 다른 유니코드 인코딩 방식보다 불편한 점이 있나 보군요.
표현에 있어서는 문제가 없다고 알고 있는데 또 다시 헷갈리기 시작하는군요.

데이터 변환 문제는 iconv와 convmv로 해결되지 않습니까? UTF-8을 지원하지 않는 툴을 쓰시는 분들과 협업작업중이라면 힘들겠군요.

--
마잇


--
마잇

nohmad의 이미지

UTF-8의 특징은, 엄밀히 말하면, '1byte 문자권'(?)이라기보다는 ASCII(7비트)와의 호환성을 고려한 것입니다. 완전한 국문 텍스트라면 UTF-8이 낭비일 수 있겠지만, 영문이나 마크업 등이 혼재된 텍스트에서는 UTF-8이 더 효율적입니다. 다만 가변 길이이기 때문에 스트림 디코딩시에 약간의 성능 저하는 있을 수 있습니다.

$ruby.is_a?(Object){|oriented| language} #=> true
http://rubykr.org

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.