웹사이트에서 UTF-8은 아직 이르다.

digitie의 이미지
digitie의 이미지

얼마전 비교적 큰 사이트를 마무리하게 되었는데 그때 잠시 회까닥했었는지 사이트를 UTF-8로 만들었습니다. 지금까지 별 문제 없이 쓰고 있긴 하지만 국내에서 UTF-8을 쓰는 곳이 없어서 그런지 지금에 와서 지금에 와서 좀 불안해집니다. 혹시나 클레임이 들어오면 정말 큰일인데...; 방금 VMWARE로 윈도 98se로 테스트 해보았는데 다행히도 별 문제 없이 읽고 쓰기가 가능하네요.

그래서 드리는 질문입니다만 웹사이트에서 UTF-8은 시기상조일까요? 여기 계신 분들은 어떻게 생각하시는지 궁금합니다.

showmethemoney

cdpark의 이미지

전혀 이르지 않습니다. UTF-8이 이르다면 구글은 벌써 망했게요? (구글은 검색 결과를 UTF-8으로 돌려줍니다.)

가능하다면 새로 구축하는 사이트는 UTF-8으로 만드는게 어떨까요?
단, 파일이름이나 URL에 절대 한글은 넣지 마세요. 그것만 주의하면 됩니다.

jedi의 이미지

첨부파일을 FTP로 올릴때 파일이름을 어떻게 UTF8로 바꿔서 보내는 방법이 가장 큰 문제더군요.
나모에서 UTF8을 지원하나요?

페이지를 자주 고치는 사람이 윈도우에 나모를 쓰고 게시판 프로그램도 euc-kr이라서 ....

언젠가는 바꿔보려고 생각중입니다..

+++ 여기부터는 서명입니다. +++
국가 기구의 존속을 위한 최소한의 세금만을 내고, 전체 인민들이 균등한 삶을
영위할 수 있는 착취가 없는 혁명의 그날은 언제나 올 것인가!
-- 조정래, <태백산맥> 중에서, 1986년

jachin의 이미지

정말 UTF8... 써야 하는데,

예전에 학과 서버의 OS를 다시 설치해야 할 일이 있어서 설치 후에,

아파치2를 설치하면서 기본 언어를 UTF-8로 맞춰놨더니,

게시판에 글을 입력하고 보면 글자가 이상하게 깨져서 나온다고 클래임이... -_-;;;

UTF-8을 만방에 널리 알리려다가, 교수님의 지시로 어쩔 수 없이 EUC-KR로 맞추게 되었습니다. T-T 흑흑...

digitie의 이미지

UTF-8을 사용하면서 가장 걱정이 되는 것이 오래된 OS, 특히 윈도 9x 계열에서 잘 읽고 쓸 수 있느냐 하는 것인데요. 특히나 윈도와 익스플로러에 대해 너그러운 우리나라 환경에서는 끝까지 마음에 걸리는군요. 윈도 + 익스플로러 이외의 환경에서 안되는 것에 대해서는 별로 신경을 안쓰면서 익스플로러 쓰면서 IME 설치 창 뜨는 것은 굉장히 쓰는 분위기에서 여러모로 걱정이 됩니다.

윈도 9x 계열에서만 문제없이 된다면 크게 신경쓰지 않고 써도 될텐데 말이죠.

ps. 마무리 하고나서 엄청 마음 졸이고 있었는데 여기 계신 분들 말씀 들어보니 잘했다는 생각이 듭니다. :)

showmethemoney

markboy의 이미지

MS의 확장 완성형으로 된 내용들을 완벽하게 UTF-8보 바꿀 수 있는 방법이 있나요? iconv 에서는 변환하다가 중지해 버려서요. :(

정태영의 이미지

markboy wrote:
MS의 확장 완성형으로 된 내용들을 완벽하게 UTF-8보 바꿀 수 있는 방법이 있나요? iconv 에서는 변환하다가 중지해 버려서요. :(

-f cp949
로 하세요 :D

오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...

http://mytears.org ~(~_~)~
나 한줄기 바람처럼..

랜덤여신의 이미지

제가 쓰는 대부분의 프로그램은 UTF-8 을 지원하기에...

뭐, 별 문제 없다면, UTF-8 쓰는게 좋을 듯 싶습니다.

Necromancer의 이미지

utf-8...

tex돌릴때와

ftp서버 돌릴 때(특히 윈도에 알ftp 쓰는 주위 사람들하고 파일 교환할때)와

문제가 되더군요.

전자는 변환이 가능하지만 후자는 대책이 없더군요.

Written By the Black Knight of Destruction

dhunter의 이미지

UTF-8 도입 자체는 별 문제가 없는데...

나중에 iPuTTY 로 에디트 들어간다거나 할때 vi 열어서 글자가 안 보이면 난감하더군요.

그래서 요즘은 출력 값을 변수로 처리하고 나중에 iconv($intcharset,$outcharset,$errmsg) 식으로 해버립니다. PHP의 iconv 는 신뢰할만 하더군요. 그걸로 뭘 할건지는 문제이지만서도... :)

from bzImage
It's blue paper

welkin의 이미지

웹사이트는 괜찮다고 봅니다.
다만 메일 코딩은 좀 생각해 봐야 할 듯...

다른데는 괜찮은거 같은데, hanmail이 지원을 좀...

외국어가 포함된 메일 어쩌구 저쩌구....

~~~언제나 인터넷은 흥미진진~~~

chunsj의 이미지

문제가 될 것이 없지 않나요? 터머널도 잘 되고(윈도는 모르겠습니다.) 파일 이름을 한글로 써도 문제가 없고(URL표준이 UTF-8로 알고 있습니다. 당연히 잘되는 거죠. IE6이전의 엉터리들은 문제가 될 수도 있겠습니다만, 우리 회사의 윈도 사용자들이 다 되는 것으로 봐서는 현재는 문제가 없는 듯), 메일도 당연히 UTF-8이 되야 다른 나라 말하고 섞여도 되는 거고, 안되는 웹메일은 그 놈들이 잘못 짠거고, 뭐, 제 환경에서는 문제가 된 적이 없는데요?

ganadist의 이미지

아웃룩이 UTF-8로 된 Subject를 못알아 먹는 것으로 알고 있습니다.

----
데스크탑 프로그래머를 꿈꾸는 임베디드 삽질러

다콘의 이미지

ganadist wrote:
아웃룩이 UTF-8로 된 Subject를 못알아 먹는 것으로 알고 있습니다.

gmail에서 보낸 메일을 아웃룩에서 보면 잘 보입니다.
메일 헤더를 보면 UTF-8로 인코딩되어 있습니다.

Quote:
Subject: =?UTF-8?B?7KeA66mU7J28IO2FjOyKpO2KuA==?=

실제로 아웃룩에서 보면 '지메일 테스트'라고 잘 보입니다.
lacovnk의 이미지

dhunter wrote:
UTF-8 도입 자체는 별 문제가 없는데...
나중에 iPuTTY 로 에디트 들어간다거나 할때 vi 열어서 글자가 안 보이면 난감하더군요.

인코딩 지정해서 사용하면 되지 않을까요~ 다만 접속 내에서 서버 바꿔가면서 작업하면 좀 곤란하더군요 -_-; 다른 세션으로 저장해서 사용하면 해결 될 것 같고..

언제 시간나면 제 홈페이지도 모두 UTF-8로 바꿔버리고,서버도 바꿔버릴 참입니다만.. 파일이름 문제가 좀 걸리는군요 ㅎㅎ

Darkcircle의 이미지

뭐라 말하기가 좀 거시기 하군요 ㅡㅛㅡ

한메일 같은데선 UTF-8 이 깨져나옵니다.
거기다가 이걸 외국어로 인식해버리니 참 -_-;;
어이가 없더군요 . . .

제 연구실 교수님은 메일을 가끔 UTF-8로 보내십니다.
물론 코드값만 맞으면 읽는덴 전혀 문제가 없는데 말이죠
이놈의 말아먹을 서버가 좀 문제가 많습니다 . . . -_- . . .

근데 아주 가관인것은 이 사이트에 메일을 보내면
UTF-8이 외국어 메일로 인식하고 깨져나오는게 정상이라나 -_- . . .
서버 관리하는데 기본도 안되어 있는것 같더군요 . . .
인코딩 정보좀 제대로 인식해주지 -_-;

---------------------------------------------------------------
폐인이 되자 (/ㅂ/)

sanaenom의 이미지

UTF-8 인코딩은 IE4,5 버전부터 기본 제공 되어지고 있습니다.
걱정안하셔도 될것입니다.

digitie wrote:
UTF-8을 사용하면서 가장 걱정이 되는 것이 오래된 OS, 특히 윈도 9x 계열에서 잘 읽고 쓸 수 있느냐 하는 것인데요. 특히나 윈도와 익스플로러에 대해 너그러운 우리나라 환경에서는 끝까지 마음에 걸리는군요. 윈도 + 익스플로러 이외의 환경에서 안되는 것에 대해서는 별로 신경을 안쓰면서 익스플로러 쓰면서 IME 설치 창 뜨는 것은 굉장히 쓰는 분위기에서 여러모로 걱정이 됩니다.

윈도 9x 계열에서만 문제없이 된다면 크게 신경쓰지 않고 써도 될텐데 말이죠.

ps. 마무리 하고나서 엄청 마음 졸이고 있었는데 여기 계신 분들 말씀 들어보니 잘했다는 생각이 듭니다. :)

iolo의 이미지

다콘 wrote:
ganadist wrote:
아웃룩이 UTF-8로 된 Subject를 못알아 먹는 것으로 알고 있습니다.

gmail에서 보낸 메일을 아웃룩에서 보면 잘 보입니다.
메일 헤더를 보면 UTF-8로 인코딩되어 있습니다.

Quote:
Subject: =?UTF-8?B?7KeA66mU7J28IO2FjOyKpO2KuA==?=

실제로 아웃룩에서 보면 '지메일 테스트'라고 잘 보입니다.

base64하지 않고 그대로 8비트로 UTF8을 사용하면 못알아먹습니다.
근데... 그건 사실 인코딩하는쪽 잘못입니다.
헤더에는 분명히 US-ASCII의 7비트 문자들만 사용할수있다고 RFC에 명시되어 있으니까요.

본문의 경우엔 Content-Type헤더에 charset=UTF-8을 명시해주고
Content-Transfer-Encoding: 8bit정도 해주면 base64나 qp하지 않고 써도 됩니다만... 이렇게 해도 파싱못하는 메일클라이언트/웹메일들도 꽤 있습니다.

----
the smile has left your eyes...

정태영의 이미지

Necromancer wrote:
utf-8...

tex돌릴때와

ftp서버 돌릴 때(특히 윈도에 알ftp 쓰는 주위 사람들하고 파일 교환할때)와

문제가 되더군요.

전자는 변환이 가능하지만 후자는 대책이 없더군요.

상당히 오래된 글이긴 하지만...

tex 은 hlatex 1.0 이상을 사용하고 lambda 로 컴파일을 하면 해결이 되는 듯 싶습니다 ... ftp 는... proftpd 같은 경우엔 패치가 존재합니다...

다만 directory 나 ftpoverride 에서 설정하는게 안되길래 제가 패치를 한 게 있습니다 :)

관련해서 제가 블로그에 써놨던 글을 링크합니다
http://b.mytears.org/2005/08/13/proftpd-codeconv-module/

오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...

http://mytears.org ~(~_~)~
나 한줄기 바람처럼..

송효진의 이미지

UTF-8 개발환경
윈도
에디터 : EmEditor (한국어 외의 문자를 사용한다면 필수. UltraEdit 는 미흡)
웹에디터 : Dreamweaver MX 2004 (파일 맨 위에 메타 헤더 반드시 필요.<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">)

리눅스
vim 설정 http://www.gentoo.or.kr/wiki/moin.cgi/VIM#head-31c6c5166bf1c3e2cdfc39841649b33aa8284aa4
외에 없음.
리눅스 천하무적.

욱성군의 이미지

주제에서는 빗나갔지만 윈도 xp 에서 로케일을 utf-8 로 변경할 수 있나요?

tinywolf의 이미지

제가 지금 UTF-8로 게시판을 작성하고 있는데..
첨부되는 파일의 이름은 따로 저장하고 파일명을 해당 글번호로 변경해서 저장하려고 합니다.
그리고 다운 받을 때는 다시 원래의 이름으로 다운로드되는 식으로..
기술적으로 가능할까요?

ㅡ_ㅡ;

정태영의 이미지

tinywolf wrote:
제가 지금 UTF-8로 게시판을 작성하고 있는데..
첨부되는 파일의 이름은 따로 저장하고 파일명을 해당 글번호로 변경해서 저장하려고 합니다.
그리고 다운 받을 때는 다시 원래의 이름으로 다운로드되는 식으로..
기술적으로 가능할까요?

예 가능합니다...

오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...

http://mytears.org ~(~_~)~
나 한줄기 바람처럼..

OoOoOo의 이미지

일본홈페이지 만든다고 죄다 utf-8로 만들어 버렸는데요..

잘만 돌아가던데요..

일본에 편집기가 없어서리 utf-8 외에는 방법이 없어요.. :evil:

죠커의 이미지

tinywolf wrote:
제가 지금 UTF-8로 게시판을 작성하고 있는데..
첨부되는 파일의 이름은 따로 저장하고 파일명을 해당 글번호로 변경해서 저장하려고 합니다.
그리고 다운 받을 때는 다시 원래의 이름으로 다운로드되는 식으로..
기술적으로 가능할까요?

첨부파일을 스크립터에서 뿌려주는 것이라면 헤더의 내용만 바꾸어도 다른 이름으로 전송이 가능합니다.

songgun의 이미지

VS .NET 을 사용해서 ASP .NET 을 작성하면 기본적으로 인코딩이 모조리 UTF-8 입니다.

물론 많은 분들이 이걸 다시 EUC-KR 로 변경하시지만 대부분의 MS 기반의 웹 개발자들이 기본 설정에 손을 안대는 풍토 :wink: 를 감안해본다면 머지않아 UTF-8 이 주변에 흔해지는 시기가 올 거라고 생각합니다. 이래서 시장 주도 기업의 책임론이 더 부각되나 봅니다. MS 가 기본값을 뭘로 결정하느냐에 따라서 시장의 % 가 확 바뀌어 버리니까요.

개인적으로 웹 개발자라면 UTF-8 에 부담이 없을 정도로 훈련을 해두는 것이 좋다고 생각합니다. 예전에 싱가폴의 한국 S 회사의 법인에서 일한 적이 있는데, 하나의 사이트에서 다루어야 하는 언어가 한글, 영어, 중국어까지 해서 최소한 3 가지 이상의 언어를 사용해야 되었습니다.

그리고 재미있는 건 싱가폴에서는 모든 관공서나 공식적인 문장에 세, 네 가지 언어로 병기하더군요. 인구 자체가 그렇게 구성되어있으니까요. 즉, 영어, 한자, 말레이지아어(? 암튼 이상한 꼬부랑 글씨), 그리고 추가로 인도어(? 이걸 뭐라고 하던데)인가 까지 말입니다. 게다가 우리나람 사람이 거기에 가서 살려면 또 한글을 무시할 수 없으니 이런 나라에서는 둘 중의 하나를 선택하게 되더군요. 다시 말해서 완전히 영어로 통일하던가, 모든 언어를 다 지원하던가 말이죠.

국제화 시대에 발 맞추어나가는 센스! 정도로 생각한다면 결코 이르지 않다는게 제 의견입니다.

이한길의 이미지

cdpark wrote:
단, 파일이름이나 URL에 절대 한글은 넣지 마세요. 그것만 주의하면 됩니다.

딴지 걸려는건 아니지만 꼭 안되는건 아닙니다...
저는 귀찮아서 그냥 사용합니다.

첨에 윈도우즈에서 사이트가 제대로 작동하지 않아서..
놀라긴 했지만 php에서 urlencoding해서 보내면..
문제가 없던걸로 기억합니다..

----
먼저 알게 된 것을 알려주는 것은 즐거운 일이다!
http://hangulee.springnote.com
http://hangulee.egloos.com

alee의 이미지

UTF-8로 만들면 좋은 점이 하나 더 있습니다.
영문 윈도우에서 한글 언어팩을 깔지 않아도 사이트가 보인다는 점입니다.
물론 글꼴은 있어야 합니다만···, 한글이 들어 있는 웹폰트를 사용해서 만들면,
글꼴마저 없어도 한글이 문제 없이 나옵니다.

투표 항목에 “지금이 바로 넘어갈 때다” 항목이 빠졌네요.

랜덤여신의 이미지

sanaenom wrote:
UTF-8 인코딩은 IE4,5 버전부터 기본 제공 되어지고 있습니다.
걱정안하셔도 될것입니다.
digitie wrote:
UTF-8을 사용하면서 가장 걱정이 되는 것이 오래된 OS, 특히 윈도 9x 계열에서 잘 읽고 쓸 수 있느냐 하는 것인데요. 특히나 윈도와 익스플로러에 대해 너그러운 우리나라 환경에서는 끝까지 마음에 걸리는군요. 윈도 + 익스플로러 이외의 환경에서 안되는 것에 대해서는 별로 신경을 안쓰면서 익스플로러 쓰면서 IME 설치 창 뜨는 것은 굉장히 쓰는 분위기에서 여러모로 걱정이 됩니다.

윈도 9x 계열에서만 문제없이 된다면 크게 신경쓰지 않고 써도 될텐데 말이죠.

ps. 마무리 하고나서 엄청 마음 졸이고 있었는데 여기 계신 분들 말씀 들어보니 잘했다는 생각이 듭니다. :)


즉, 윈도우 98 에서 기본으로 깔리는 브라우저도 UTF-8 을 지원합니다. 신경쓰지 않으셔도 될 것 같습니다. :-)

cdpark wrote:
단, 파일이름이나 URL에 절대 한글은 넣지 마세요. 그것만 주의하면 됩니다.

항상 urlencode 를 해 주면 파일 이름을 한글로 해도 괜찮을 것 같군요. 위키백과의 각 국가별 사이트들의 경우에도 항상 자국어로 되어 있는 페이지 이름을 쓰거든요. urlencode 를 한 URL 을 사용해서 말이죠.
noname_nobody의 이미지

중간부터 약 1년치를 타임 슬립했는데 원글 쓰신 분은 그 후로 클레임 안받았는지 궁금하군요. 아마 별 문제 없었을 것 같지만.. ^^

2001년에 익스 5.5 에서 테스트한 UTF-8 전용 사이트를 만들었는데 별 문제 없었습니다. 당시엔 jamondo 라고 일본어 IME 관련의 파일을 안깔거나 윈도 98 에선 좀 문제가 있었습니다만 익스 6 으로 오면서 UTF-8 은 문제가 없게된 듯 하더군요. 98 에선 글씨가 좀 거칠게 나오는 현상이 있었던걸로.. 가끔 98에서 아무리해도 글이 안보인다는 증상을 얘기하시는 분도 있더군요. 하지만 그건 다 지난 얘기입니다.

저는 오히려 UTF-8 도입이 국내는 너무 늦었다고 봅니다. 꼭 이런 자료는 적은게 국내 사이트의 현실이죠. 다들 먹고 살기 바쁘기 때문인지 한 사람 삽질하고 넘어가면 뒤따라 오는 사람들 그대로 또 삽질하고.. BOM 이 뭔지 몰라서 똑같이 헤매는 경우 종종 봤습니다. 아무도 한 군데 모아서 정리할려고 하지 않으니까요. 자료는 거의 외국에 있고... 그나마 요즘 들어 UTF-8 이 대세니 어쩌고 하는데 막상 자료 찾으면 국내는 썰렁해서 결국 쓰는 사람만 쓰는 실정입니다. 조금씩 늘고는 있지만요.

voljin의 이미지

UTF-8로 하면 코드페이지를 클라이언트의 환경에 의존하는 물건들과 연동할때 말썽이 생기더군요.

viewcvs 설정을 utf-8로 했다가 tortoisecvs에서 날아오는 커밋코멘트가 euc-kr이라 어쩔까..하다가 여기서 억지로 수정하면 업그레이드 관리가 귀찮으니 그냥 아파치를 euc-kr로 바꾼게 최근 일이네요. ftp서버도 utf-8로 하면 클라이언트들이 상당히 제약을 받는 문제도 있고...

우수한의 이미지

첫 글이 씌어진지 1년이 넘었고, 그 당시로서도 "시기상조는 아니"라고 답했을텐데....
아직도 상당수의 웹개발자,
이를테면 온라인 결제사 같은데서는 아예 UTF-8이 뭔지조차 모르는 듯 합니다.
그래서 전 최근에도 UTF-8 때문에 "왜 남들 다 쓰는 EUC-KR 안쓰고 이상한거 쓰냐"는둥 하는 소릴 들으며
분노(!)를 참고 있습니다.

우수하지 않아요. '우수한'은 옛날 만화 CityHunter에서 따와서 쓰던 별명. ;-)