nkf로 euc-kr 문서를 조회해보면 euc-jp로 나오는데요.

mywin의 이미지

euc-kr을 한글과 한문을 표기하기 위한 한글 전용 인코딩인 것으로 압니다. 아닌가요?

nkf -g euckrfile

이라고 조회하면 euk-kr로 나와야 하는데 euc-jp로 나옵니다. 한글은 자랑스러운 조선의 세종대왕님이 만드신 문자인데 감히 일본 jp가 왜 끼어드는것인지 모르겠네요. 이거 능력자님들께서 고치셔야 하는 것 아닐까요? 아님 이것이 정상적으로 처리되는 것인지요? 좀 발끈하게 만듭니다. 독도도 지네 땅이라고 하더니 이제 한글도 지네 문자라고 우기려 하려는 속셈인지. nkf 일본 사람이 만든 건가요? 도대체 왜 그러는걸까요?

김정균의 이미지

nkf 코드를 보니 euc-kr table을 가지고 있지 않는데요. 당연히 detect 하지 못하는 것이 맞을 것 같습니다. :-)

단순하게 해당 파일이 euc-kr이냐 utf-8이냐를 확인하는 것이라면 nkf를 이용해서 처리가 가능하지만, euc-kr임을 확인해야 한다면 nkf는 마땅한 솔류션이 아닌 듯 싶습니다. 이 경우는 해당 파일이 euc-kr임이 정확해야 한다면

shell> iconv -f euc-kr -t utf-8 file_name >& /dev/null; echo $?

로 확인이 가능 합니다. $? 값이 0이면 euc-kr이고 0이 아니면 euc-kr이 아닌 것이죠. 그 외에서 chardet library를 이용할 수도 있을 것 같네요.

mywin의 이미지

>이 리다이렉션인 것은 알겠는데요. 그 다음부터가 이해가 안되는데요. 저게 도대체 무슨 뜻인가요? 저런 구문이 이해도지 않으면 무엇을 알아야할까요?

안개 걷히고 구름 걷히면 빛이 내려 않는다.

김정균의 이미지

shell script에 대해서 공부 하시면 됩니다. man bash 에 다 있는 내용입니다. :-)

shell> iconv -f euc-kr -t utf-8 file_name >& /dev/null; echo $?

1. ">& /dev/null" 의 의미는 stderr과 stdout 모두 /dev/null 로 redirect 하라는 의미입니다. 이 표현은 다음과 같이 사용이 가능합니다.

shell> command > /dev/null 2>&1
shell> command &> /dev/null
shell> command >& /dev/null

2. ";" 는 두개의 명령을 한줄에 사용한 것을 말합니다.
3. "$?" 는 바로 직전에 실행한 명령의 exit 값을 말합니다. 즉, $?가 0이면 성공, 0이 아니면 실패했다는 의미입니다.

raymundo의 이미지

... >& /dev/null

이것도 리다이렉션입니다. 표준 출력과 표준 에러 둘 다를 /dev/null 파일로 리다이렉션하는 기호입니다.
(man bash 하셔서 "Redirecting Standard Output and Standard Error" 절을 검색하시면 나옵니다)

그리고 /dev/null 은 장치 파일이라서 들어온 모든 것을 먹어버리니까, 결과적으로 화면이 불필요한 출력이 나오지 않게 치워버리는거죠.

P.S. 쓰고 나니 뒷북이 되었군요 ^^;

좋은 하루 되세요!

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.