#!/usr/bin/env perl
use strict;
use warnings;
use Encode qw/encode/;
open my $fh, '<:encoding(UTF-8)', $ARGV[0];
while ( my $line = <$fh> ) {
$line =~ s/([\x{AC00}-\x{D7A3}])/$1 /g;
print encode('utf8',$line);
}
utf8 pragma를 사용하여
( 소스코드안에 utf8문자 리터럴이 오면 자동으로 Perl내부에서 쓰이는 유니코드 포멧으로 변환하라는 뜻 )
#!/usr/bin/env perl
use strict;
use warnings;
use utf8;
use Encode qw/encode/;
open my $fh, '<:encoding(UTF-8)', $ARGV[0];
while ( my $line = <$fh> ) {
$line =~ s/([가-힣])/$1 /g;
print encode('utf8',$line);
}
Perl로
문서가 utf8 인코딩으로 저장되어있고
터미널 환경이 utf8 이라는 가정하에
라고 명령을 내리면 다음과 같이 나옵니다.
위에서 AC00,D7A3은 각각 한글 "가","힣"의 유니코드 코드포인트입니다.
답글감사합니다.. 그
답글감사합니다..
그런데 저는 vi 안에서 테스트 중인데,
또는
라고하면 Invalid range라고 나옵니다..
one liner 가 아닌 스크립트 파일로 만들면
one liner 가 아닌 스크립트 파일로 만들면
ex.pl
실행
정규식에서 한글을 그대로 사용하려면
utf8 pragma를 사용하여
( 소스코드안에 utf8문자 리터럴이 오면 자동으로 Perl내부에서 쓰이는 유니코드 포멧으로 변환하라는 뜻 )
[\x{AC00}-\x{D7A3}] 는
[\x{AC00}-\x{D7A3}]
는 Perl에서만 적용되는 정규식입니다.
댓글 달기