(완료)perl의 open 함수에 한글파일이름을 인자로 주면 에러가 납니다.(win32 strawberry perl)

sephiron의 이미지

#!/usr/bin/perl.exe
use warnings;
use encoding 'cp949', STDIN => 'cp949', STDOUT=>'cp949', STDERR=>'cp949';
use Encode;
 
open(FH, "<:encoding(cp949)", "$ARGV[0]") or die("file open error"); #첫번째
my $fn = decode("cp949", $ARGV[0]); #테스트
 
$fn =~ s/(\.txt)$/_ch$1/;
open(WT, ">:encoding(cp949)", "$fn" ) or die "Can't write file : $!"; #두번째
...
...
...

$ARGV[0]은 윈도우즈 환경의 한글파일이름입니다.

위와 같은 코드에서 첫 번째 open은 읽기 모드로 파일을 문제없이 읽습니다.
하지만 두번째 open은 쓰기모드로 $fn(받은 파일의 이름을 살짝변경)을 열었는데

Can't write file : Invalid argument at bin/chomptxt.pl line 10.

에러가 납니다.

인코딩 문제인가해서 $fn을 cp949로 인코딩해주었는데도 마찬가지네요. 무엇이 잘못된 것인가요?

par로 패키징에서 배포할 예정입니다.

sephiron의 이미지

$ARGV[0]에는 띄어쓰기와 절대경로가 포함되어있습니다.

aero의 이미지

Perl에서 유니코드를 사용할 때 기본적인 개념만 확실히 이해하고 있으면 헷갈릴 일이 없습니다.
우선 http://www.perlmania.or.kr:8949/bbs/bbs.html?mode=read&table=free&article=6691&page=1
읽어 보시고 Perl 유니코드 처리에 대한 기본개념을 먼저 확실히 하심이.

위 코드를 보니
use encoding 'cp949', STDIN => 'cp949', STDOUT=>'cp949', STDERR=>'cp949';

my $fn = decode("cp949", $ARGV[0]);

이 두줄을 빼면 원하는대로 동작할 것 같네요.

use encoding 프래그마는 원 제작자도 설계의 잘못을 인정하며 deprecate 시키고 싶다고
한 것입니다. 따라서 안 쓰는게 좋습니다. 특히 binary 데이터를 다룰 경우 치명적입니다.
(이유는 위 링크를 따라가며 읽어보시면 나옴)

운영체제의 파일이름은 운영체제가 인식하는 그대로 놔두어야 합니다. 그런데
my $fn = decode("cp949", $ARGV[0]); 에서 decode함수로 Perl unicode 포멧(내부적으로 utf8인코딩)
으로 변경한 후 이것을 가지고 파일을 열려고 하면 운영체제는 이미 인식하지 못합니다.
Perl 내부 유니코드 포멧으로 변환해서 정규식으로 이름을 약간 수정하시려고 하는 것 같은데
정규식에서 유니코드를 사용하지 않을 것이면 굳이 decode의 과정이 필요없습니다.
위 코드에서는 그런 과정이 필요없어보이지만 어떻게든 파일이름을 decode 했으면
open에서 사용전에
$fn = encode( 'cp949', $fn );
로 Perl 내부 유니코드 포멧을 운영체제가 인식하는 cp949 인코딩 바이트 시퀀스로 변환해야합니다.

sephiron의 이미지

항상 큰 도움 받고 갑니다. 감사합니다.^^

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.