특정 utf-8 택스트 문서를 euc-kr로 바꾸고 싶습니다.

qkeko의 이미지

특정 utf-8 택스트 문서(한영혼용)를 euc-kr로 바꾸고 싶습니다.
iconv 를 사용하면 "xxxxx 위치에 잘못된 입력 순서열이 있음" 이라는 메시지를 뱉어내고 멈춥니다.

한 두 단어나 행이 무시되더라도 나머지 변환 작업을 계속할 수 있는 법이나, iconv 외 다른 방법은 없는지 알고 싶습니다.

소리의 이미지

전 무시하고 변환하는 방법은 잘 모르겠습니다만, EUC-KR 대신 CP949로 해 보시면 어떨까요? (CP949가 EUC-KR에서 표현할 수 없는 한글 문자들을 표현하기 위해 만들어진 확장이라고 합니다.)
한글 문서는 CP949로 하면 대부분의 경우 성공하더군요.

익명 사용자의 이미지

-c 옵션을 붙이면 되지않나요?

송효진의 이미지

iconv -f UTF-8 -t UHC//IGNORE

qkeko의 이미지

-c 는 안 먹더라구요.

cp949랑 euc-kr은 같은 위치서 멈췄구요.

UHC//IGNONE 는 좀 더 가는 군요. 하지만 끝까지는 아니네요.

에러 나는 부분까지만 변환하고 원본에서 변환된 부분과 에러나는 부분을 삭제하고 재변환, 재변환해서 붙였습니다.

신경 써 주셔서 감사합니다.

송효진의 이미지

IGNORE 에요 ㅠㅠ

익명 사용자의 이미지

익명 사용자의 이미지

제발...
저건 못쓴다고요...
'한글' 만 바뀌면 뭐하냐고요...

mirr의 이미지

저도 한영혼용 소스(대부분이 그렇겠지만 ㅡ,.ㅡ::)를 Euc-kr에서 작성된것을
페도라에서 수정하다가 utf-8로 바껴버렸었거든요..
iconv를 사용해 봤지만 아무래도 한글로 처리돼있는 주석부분에선
자꾸 멈추는 듯 했구요....

저는 그래서 윈도우 울트라 에디터로 파일을 연뒤, 유니코드를 아스키로
바꿔주는 명령을 실행하고 저장했답니다....제일 간편하고 깔끔하더라구요 ㅜ.,ㅜ

내 마음속의 악마가 자꾸만 나를 부추겨.
늘 해왔던 것에 만족하지 말고 뭔가 불가능해 보이는 것을 하라고 말야.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.