[질문] 글자코딩에대해 궁금합니다.
글쓴이: myth0312 / 작성시간: 일, 2004/11/14 - 4:46오후
리눅스를 깔아보니 글자코딩이라는것을 알게ㅤㄷㅚㅆ는데...
윈도우에서 쓰던하드를 달아서 마운트하니깐 한글로된 파일이 그놈에서 "????" <- 이렇게 나와버립니다.
그놈터미널에선 글자코딩을 "EUC-KR"로 하니 한글파일이 보이구요
그런데 EUC-KR이나, UTF-8이나 보이는 한글이 있고 안보이는 한글이 있는듯합니다(안보이는 한글은 "???" 이렇다던가 네모네모네모 이렇다던가...).
윈도우는 무슨글자코딩을 쓰는지, 그리고 왜이리 글자코딩의 종류가 제각각인지
그리고.. 글자코딩의 종류의 특성은 어떤것인지등등 알고싶습니다.
그럼 좋은하루 되세요
Forums:
윈도우는 EUC-KR(정확히는 CP949) 인코딩을 사용하고 있습니다.
윈도우는 EUC-KR(정확히는 CP949) 인코딩을 사용하고 있습니다.
다른 질문에 대해서는 대답을 정확히 못하겠네요. :oops:
글자코딩이 많은 이유는 각 나라마다 자기나라말을 표현하기 위해 각자 만든
글자코딩이 많은 이유는 각 나라마다 자기나라말을 표현하기 위해 각자 만든 표준이 있기 때문이죠. 우리나라 한글의 경우에도 조합형, 완성형 논란이 있었고, M$에서 일방적으로 발표한 통합형 논란이 있었습니다.
(참조: http://sparcs.kaist.ac.kr/~jwjung/seminar/hangul-i18n/ko-code.html )
이 문자집합들은 각 나라에서는 각자 쓰이거나 Unicode로 통합되는 분위기로 가고 있습니다.
한글 Windows의 경우에는 EUC-KR (ASCII + KS-X-1001 완성형)을 포함하는 M$의 일방적인 문자집합 CP949( ASCII + M$ 통합형) 이 쓰이고 있습니다. 표현이 안되는 한글은 KSC-5601에서 표현이 안되는 한글 (ㅤㄷㅚㅆ, ㅤㅂㅞㄺ, ㅤㄸㅗㅁ)등이나 KSC-5601에 포함되지 않는 한자인 경우가 많습니다.
도움되시길
-산오리
UTF-8 은 유니코드를 구현하는 인코딩 중 하나입니다...euc-k
UTF-8 은 유니코드를 구현하는 인코딩 중 하나입니다...
euc-kr 이나 cp949, euc-jp 등등이 하나의 언어만 사용할 수 있는 것에 비해(윈도우에서 파일명으로 일본어, 중국어가 지원되는 것은 약간의 편법을 쓴겁니다...) UTF-8 은 모든 언어를 다 사용할 수 있습니다.
그래서, 앞으로는 UTF-8 을 사용한는 곳이 많아질 가능성이 높습니다.
귀찮지 않으시다면, 리눅스를 UTF-8 로 유지하시고 윈도우와 파일 교환할 때에 변환 기능을 사용하시는 것이 좋을 것입니다... (조금 복잡합니다)
----
블로그 / 위키 / 리눅스 스크린샷 갤러리
댓글 달기