(완료)perl의 open 함수에 한글파일이름을 인자로 주면 에러가 납니다.(win32 strawberry perl)
글쓴이: sephiron / 작성시간: 일, 2009/11/01 - 1:01오후
#!/usr/bin/perl.exe use warnings; use encoding 'cp949', STDIN => 'cp949', STDOUT=>'cp949', STDERR=>'cp949'; use Encode; open(FH, "<:encoding(cp949)", "$ARGV[0]") or die("file open error"); #첫번째 my $fn = decode("cp949", $ARGV[0]); #테스트 $fn =~ s/(\.txt)$/_ch$1/; open(WT, ">:encoding(cp949)", "$fn" ) or die "Can't write file : $!"; #두번째 ... ... ...
$ARGV[0]은 윈도우즈 환경의 한글파일이름입니다.
위와 같은 코드에서 첫 번째 open은 읽기 모드로 파일을 문제없이 읽습니다.
하지만 두번째 open은 쓰기모드로 $fn(받은 파일의 이름을 살짝변경)을 열었는데
Can't write file : Invalid argument at bin/chomptxt.pl line 10.
에러가 납니다.
인코딩 문제인가해서 $fn을 cp949로 인코딩해주었는데도 마찬가지네요. 무엇이 잘못된 것인가요?
par로 패키징에서 배포할 예정입니다.
Forums:
$ARGV[0]에는
$ARGV[0]에는 띄어쓰기와 절대경로가 포함되어있습니다.
Perl에서 유니코드를 사용할 때 필요한 개념
Perl에서 유니코드를 사용할 때 기본적인 개념만 확실히 이해하고 있으면 헷갈릴 일이 없습니다.
우선 http://www.perlmania.or.kr:8949/bbs/bbs.html?mode=read&table=free&article=6691&page=1 을
읽어 보시고 Perl 유니코드 처리에 대한 기본개념을 먼저 확실히 하심이.
위 코드를 보니
use encoding 'cp949', STDIN => 'cp949', STDOUT=>'cp949', STDERR=>'cp949';
와
my $fn = decode("cp949", $ARGV[0]);
이 두줄을 빼면 원하는대로 동작할 것 같네요.
use encoding 프래그마는 원 제작자도 설계의 잘못을 인정하며 deprecate 시키고 싶다고
한 것입니다. 따라서 안 쓰는게 좋습니다. 특히 binary 데이터를 다룰 경우 치명적입니다.
(이유는 위 링크를 따라가며 읽어보시면 나옴)
운영체제의 파일이름은 운영체제가 인식하는 그대로 놔두어야 합니다. 그런데
my $fn = decode("cp949", $ARGV[0]); 에서 decode함수로 Perl unicode 포멧(내부적으로 utf8인코딩)
으로 변경한 후 이것을 가지고 파일을 열려고 하면 운영체제는 이미 인식하지 못합니다.
Perl 내부 유니코드 포멧으로 변환해서 정규식으로 이름을 약간 수정하시려고 하는 것 같은데
정규식에서 유니코드를 사용하지 않을 것이면 굳이 decode의 과정이 필요없습니다.
위 코드에서는 그런 과정이 필요없어보이지만 어떻게든 파일이름을 decode 했으면
open에서 사용전에
$fn = encode( 'cp949', $fn );
로 Perl 내부 유니코드 포멧을 운영체제가 인식하는 cp949 인코딩 바이트 시퀀스로 변환해야합니다.
자세한 설명 감사합니다.
항상 큰 도움 받고 갑니다. 감사합니다.^^
댓글 달기