sed 또는 perl 정규식 이용관련 문의
a파일이 다음과 같이 필드구분이 ":"으로 구분되어 있습니다.
1:5102::당아래고개:::::0:0:0:58429898:17281562:::::
여기서 두번째 필드 "5102" 위치가 8800이하 와 9000이상 ([1] < 8000 || [1] >= 9000)으로 되어있는
행을 뽑아 새로 파일을 만들려고하는데..
제가 해본것이..
1. sed 쪽으로는(이것도 예전에 질문해서 답변얻은거 응용한겁니다.)
sed -r "s|^(.*):88..:(.*)|\1\:DELETE_THIS|" [파일명] > [파일명]_2
sed -r "s|^(.*):89..:(.*)|\1\:DELETE_THIS|" [파일명]_2 > [파일명]_3
grep -v "DELETE_THIS" [파일명]_3 | cut -f1 > [파일명]
여기서 좀 모자란부분이...|^(.*):88..:(.*)| 요 부분인데여...
이부분 해석이 ^(처음부터) :으로나뉘었으니..3개필드비교하는데.. 2번째필드가 88..으로 88로시작하는 4자리로 같으면
이라고 알고..해보았더니...두번째필드말고..다른 필드에 88으로 두자리만 있는것도 지워지고..이래서..일단포기..ㅠㅠ
%%% 더궁금한 부분은 두번째필드 및 네번째필드 동시에 만족하는걸 지우는것..이런거여..
2. 그래서 예전 답변중 또 perl 올려주신걸 응용..perl은 처음 접합니다..ㅡㅜ
#!/usr/bin/perl
use strict;
use warnings;
open my $a, '<', '[파일명]';
open my $ao, '>', '[파일명]_2';
while (<$a>) {
if ( (split /:/,$_) [1] < 8800 || ([1] >= 9000)) {
print {$ao} $_;
}
}
이렇게했더니...9000번 이상되는 넘도 지워지네여~ ㅠㅠ
1번2번 둘다 답변좀 부탁드립니다..
2. #!/usr/bin/perl use
2.
꺽쇠가 날라가서 코드 일부가 이상하게 보인 것 수정했습니다 ^^;;
--
말할 수 있는 것은 분명하게 말해질 수 있다;
말해질 수 없는 것에 대해서는 침묵해야한다.
논리철학논고 - 루드비히 비트겐슈타인
--
말할 수 있는 것은 분명하게 말해질 수 있다;
말해질 수 없는 것에 대해서는 침묵해야한다.
논리철학논고 - 루드비히 비트겐슈타인
2번만 답을드리면
2번만 답을 드리면
는
로 바꾸시든지
처럼 쓰셔야 합니다.
(split /:/,$_)[1] 는 Perl의 리스트슬라이스라는 문법으로
(리스트)[리스트] 형식을 띄며
split /:/,$_ 는 :를 기준으로 자른 값들의 리스트를 넘겨주고
그중에서 1번째의 인덱스값을 뽑아내는거지요.
따라서 [1]이 따로 쓰이는 건 있을 수 없습니다.
어떤 snippet을 보고 대충 감으로 베껴 쓰기전에
문법의 의미를 이해하시는게 좋습니다.
그러면 저런 실수는 하지 않겠죠.
추가 one-liner 버젼
awk를 이용한 간단
awk를 이용한 간단 버전 ^^
a
a
댓글 달기