UTF-8 vs EUC-KR

DefaultX의 이미지

아직은 페도라를 깔았다가 지우기만 반복하는 리눅스 초보입니다

아파치에서는 기본 언어를 EUC-KR 로 설정 해 두고,
gEdit와 KATE 등에서 웹 문서를 만들어 봤는데

FC-4 gnome 설치시, 사용언어를 [한국어] 로 하니,
FC-4 하의 모든 응용프로그램 에서는 모두 디폴트값이 UTF-8 로 자동 지정되는군요

도대체 EUC-KR 과 UTF-8 과의 차이점은 무엇이고
시스템의 디폴트 언어값을 EUC-KR 로 하려면 어떻게 해야하는지요?

그리고, 여러분들께서는 아파치의 언어설정을 어떻게 하고계신지요?
(대부분 EUC-KR 로 하는줄로 압니다만..)

감사합니다

lacovnk의 이미지

아파치에서 특별히 euc-kr를 해야 할 이유가 있나요?

전 defaultcharset 주지 않고 씁니다. 명시를 하던가, 브라우져가 알아서 보든가.. (생 txt에게는 좀 미안하지만)

EUC-KR과 UTF-8은 인코딩이 다릅니다. 한글을 어떤 코드, 어떤 방식으로 저장할지가 다른 거죠.

gentoo라면 /etc/env.d/02useretc 같은데다가 LANG="ko_KR.euckr"... 페도라는 모르겠네요; (후 env-update;; )

사랑천사의 이미지

우리나라의 경우...
EUC-KR이 맞을지도 모르겠네요.. EUC-KR이 UTF-8보다 좋은 점이 있다면 아직은 UTF-8보다 EUC-KR 문자세트만을 지원 하는 기기나 SW마 많아서 거기 맞다는 거고요. 뭐 차이점은 UTF-8은 지금 제가 알기로 세계 표준 규격이라는 겁니다. 아니 유니코드가 그런 거죠 음. 음... 그러나 EUC-KR은 유닉스상 표준 문자셋으로서의 한글 문자세트입니다. 아직은 EUC-KR를 많은 곳에서 지원 하고 대신 유니코드 지원이 불확실한 SW들이 많은 터라 대부분 아직은 설정에 EUC-KR를 쓰는 경우가 많고요. 텔넷 같은걸 많이 이용하는 서버라면 (그러니까 텔넷 서버가 설치 되는 경우.) 그 클라이언트들이 일반적으로 EUC-KR을 지향하기 때문에 시스템 문자세트를 EUC-KR로 설정 하는 경우가 많습니다.(저도 그렇게 했고요.) 그러나 전세계적인 범용성을 따지면 UTF-8을 스는게 옳은 길일지도 모르겠네요. 그리고 한국 현실에 맞게 많은 사람들은 EUC-KR로 HTTPD를 설정 해 놓는것 같습니다. 아직은요. 그렇다고 해서 이게 대세나.. 그건 잘 모르겠습니다. 저같은 경우는 EUC-KR입니다.

그리고 그걸 시스템에서 설정 하는 방법에 대해선 쉘 환경 파일들을 뒤져 보시면 좋을것 같습니다. 그리고 여의치 않으시면 (KDE의 경우.) KDE 제어판을 활용 하십시요. 그 안에 지역 설정, 언어 설정(여기서 EUC-KR 설정 할 수 잇나 기억은 잘 안 나지만.) 있습니다 음. 그리고 VI/VIM의 경우 /usr/share/vim<버젼)/에서 설정 파일들을 (vimrc등이겠죠. 설정 파일이라고 하긴 좀 그런가요?) 열어서 조정 하시면 되고요.

자세한 답변 못 드려 죄송합니다. NLS에 대해서 아는게 별로 없어서요. 그냥 만들어 놓은 프로그램 NLS 대충 마춰서 쓰는게 고작이니 음...

그럼...
이여송 사도요한 드림.

사람천사

tinywolf의 이미지

http://www.jinsuk.pe.kr/Unicode/Unicode_intro-kr.html

예전에 여기서 소개되었던 곳인데요.
이걸 읽어보니 좀 알겠더군요..

ㅡ_ㅡ;

랜덤여신의 이미지

UTF-8 은 EUC-KR 보다 표현 가능한 문자 수가 많습니다. EUC-KR 에는 기껏해야 한글과 한자, 조금의 일본어 문자가 포함되어 있는 것에 비해, UTF-8 은 현재 유니코드로 나타낼 수 있는 거의 모든 언어의 문자가 존재합니다. 또한, EUC-KR 에 없는 옛한글도 UTF-8 에 있어서, 한글을 잘 사용하는데도 UTF-8 이 필수입니다.

리눅스 세계에서 UTF-8 은 큰 대세입니다. UTF-8 에서 잘 동작하고 EUC-KR 에서는 오동작을 하는 프로그램이 차츰차츰 늘어나고 있습니다. 대부분의 프로그램이 UTF-8 기준으로 만들어지고 있는 것입니다. UTF-8 이 국제화에도 조금 더 쉽기 때문이죠.

DefaultX의 이미지

랜덤여신 wrote:
UTF-8 은 EUC-KR 보다 표현 가능한 문자 수가 많습니다. EUC-KR 에는 기껏해야 한글과 한자, 조금의 일본어 문자가 포함되어 있는 것에 비해, UTF-8 은 현재 유니코드로 나타낼 수 있는 거의 모든 언어의 문자가 존재합니다. 또한, EUC-KR 에 없는 옛한글도 UTF-8 에 있어서, 한글을 잘 사용하는데도 UTF-8 이 필수입니다.

리눅스 세계에서 UTF-8 은 큰 대세입니다. UTF-8 에서 잘 동작하고 EUC-KR 에서는 오동작을 하는 프로그램이 차츰차츰 늘어나고 있습니다. 대부분의 프로그램이 UTF-8 기준으로 만들어지고 있는 것입니다. UTF-8 이 국제화에도 조금 더 쉽기 때문이죠.

질문을 드린 후 몇몇 사이트들을 둘러보았는데 아직 국내 대부분이 포털에서도 EUC-KR 로 인코딩 되어있나봅니다
mysql 사이트는 UTF-8 이군요

그런데, 브라우저에서 자동으로 인식하는 인코딩은 해당 서버의 아파치 설정을 우선하나요?
아파치에서 설정이 특별히 안되어있으면 해당 문서에서 인식하고... 그런걸까요?

Now Starting ....

coalash의 이미지

무심 wrote:
브라우저에서 자동으로 인식하는 인코딩은 해당 서버의 아파치 설정을 우선하나요?
아파치에서 설정이 특별히 안되어있으면 해당 문서에서 인식하고... 그런걸까요?

HTML일 때, 서버에서 브라우저로 인코딩 정보가 넘어오는 경우는 2가지입니다.

1. http response header 의 Content-Type 의 값

Content-Type: text/html; charset=UTF-8

apache 의 httpd.conf 에 AddDefaultEncoding 값을 쓰면 charset 에 이 값이 들어가죠.

2. html 의 메타 태그

<meta http-equiv="Content-Type" content="text/html; charset=euc-kr">

인코딩 정보는 response header 가 meta 태그보다 우선합니다. 이건 웹서버에서 정하는건 아니고, 브라우저에서 판단하죠. RFC에 명시되어 있는지는 모르겠습니다만, 이 순서는 바꿀 수 없는 것으로 알고 있구요.

이 외에도 txt 파일의 경우는 유니코드의 BOM 이란 게 있는데 브라우저에서는 어떻게 처리하나 모르겠네요. =^^=

lacovnk의 이미지

제가 웹서버의 defaultcharset을 설정하지 않는 이유는, 문서 작성자가 인코딩을 책임져라.. 입니다. 시스템과는 별개죠. 굳이 설정하지 않고 써도 되지 않나요? 문서에 인코딩 정보를 적지 않은 경우 예전에 브라우져가 잘못 인식하던 걸로 기억합니다. (사실 죄는 없지만..)

태터 1.0 베타에서 BOM 관련 뭐도 있던 것 같은데, 자세히 봐서 모르겠습니다. 패치 내용이 스킨파일의 BOM을 떼는 것....으로 기억합니다 :)

bh의 이미지

세상에서 가장 아름다운 태그...

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

--
이 아이디는 이제 쓰이지 않습니다.

hongminhee의 이미지

coalash wrote:
HTML일 때, 서버에서 브라우저로 인코딩 정보가 넘어오는 경우는 2가지입니다.

XHTML일 경우에는 이것도 포함될 수 있죠.
<?xml version="1.0" encoding="UTF-8"?>
근데 없어도 제대로 보이긴 하더군요.

coalash wrote:
인코딩 정보는 response header 가 meta 태그보다 우선합니다. 이건 웹서버에서 정하는건 아니고, 브라우저에서 판단하죠. RFC에 명시되어 있는지는 모르겠습니다만, 이 순서는 바꿀 수 없는 것으로 알고 있구요.

IE에서는 meta 태그부터 본다고 알고 있습니다. 출처가 기억나지는 않네요. CDK에서 본 내용 같은데…

아, 상관 없는 이야기일 수도 있지만, UTF-8은 대문자로 중간에 대시를 넣어서 "UTF-8"이라고 표기하는 게 맞다고 합니다. 어쩔 수 없는 경우도 있겠지만, 일단은 그렇다는 거죠.

ptmono의 이미지

X-window 상의 encoding을 설정하는 파일은

/etc/sysconfig/i18n입니다.

------------------------------------------
emacs user

DefaultX의 이미지

감사합니다
좋은 정보를 알았습니다

ptmono wrote:
X-window 상의 encoding을 설정하는 파일은

/etc/sysconfig/i18n입니다.

Now Starting ....

cppig1995의 이미지

bh wrote:
세상에서 가장 아름다운 태그...
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

XHTML 에서는...

<meta http-equiv="Content-Type" content="application/xhtml+xml; charset=utf-8" />

application/xhtml+xml 이 MIME 타입입니다.

Real programmers /* don't */ comment their code.
If it was hard to write, it should be /* hard to */ read.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.