sed 또는 perl 정규식 이용관련 문의

shwezarl의 이미지

a파일이 다음과 같이 필드구분이 ":"으로 구분되어 있습니다.
1:5102::당아래고개:::::0:0:0:58429898:17281562:::::

여기서 두번째 필드 "5102" 위치가 8800이하 와 9000이상 ([1] < 8000 || [1] >= 9000)으로 되어있는
행을 뽑아 새로 파일을 만들려고하는데..

제가 해본것이..
1. sed 쪽으로는(이것도 예전에 질문해서 답변얻은거 응용한겁니다.)
sed -r "s|^(.*):88..:(.*)|\1\:DELETE_THIS|" [파일명] > [파일명]_2
sed -r "s|^(.*):89..:(.*)|\1\:DELETE_THIS|" [파일명]_2 > [파일명]_3
grep -v "DELETE_THIS" [파일명]_3 | cut -f1 > [파일명]

여기서 좀 모자란부분이...|^(.*):88..:(.*)| 요 부분인데여...
이부분 해석이 ^(처음부터) :으로나뉘었으니..3개필드비교하는데.. 2번째필드가 88..으로 88로시작하는 4자리로 같으면

이라고 알고..해보았더니...두번째필드말고..다른 필드에 88으로 두자리만 있는것도 지워지고..이래서..일단포기..ㅠㅠ

%%% 더궁금한 부분은 두번째필드 및 네번째필드 동시에 만족하는걸 지우는것..이런거여..

2. 그래서 예전 답변중 또 perl 올려주신걸 응용..perl은 처음 접합니다..ㅡㅜ

#!/usr/bin/perl

use strict;
use warnings;

open my $a, '<', '[파일명]';
open my $ao, '>', '[파일명]_2';

while (<$a>) {
if ( (split /:/,$_) [1] < 8800 || ([1] >= 9000)) {
print {$ao} $_;
}
}

이렇게했더니...9000번 이상되는 넘도 지워지네여~ ㅠㅠ

1번2번 둘다 답변좀 부탁드립니다..

endofhope의 이미지

2.

#!/usr/bin/perl
 
use strict;
use warnings;
 
open(OLD, "&lt; old.txt");
open(NEO, "&gt; neo.txt");
 
while(<OLD>){
    my @fields = split(/:/);
    my $criterion = $fields[1];
 
    if( ($criterion < 8000) || ($criterion >= 9000) ){
        print NEO;
    }
}
 
close(OLD);
close(NEO);

꺽쇠가 날라가서 코드 일부가 이상하게 보인 것 수정했습니다 ^^;;

--
말할 수 있는 것은 분명하게 말해질 수 있다;
말해질 수 없는 것에 대해서는 침묵해야한다.
논리철학논고 - 루드비히 비트겐슈타인

--
말할 수 있는 것은 분명하게 말해질 수 있다;
말해질 수 없는 것에 대해서는 침묵해야한다.
논리철학논고 - 루드비히 비트겐슈타인

aero의 이미지

2번만 답을 드리면

if ( (split /:/,$_) [1] < 8800 || ([1] >= 9000)) {


if ( (split /:/,$_)[1] < 8800 || (split /:/,$_)[1] >= 9000 ) {

로 바꾸시든지

my $var = (split /:/,$_)[1];
if ( $var < 8800 || $var >= 9000) {

처럼 쓰셔야 합니다.

(split /:/,$_)[1] 는 Perl의 리스트슬라이스라는 문법으로
(리스트)[리스트] 형식을 띄며
split /:/,$_ 는 :를 기준으로 자른 값들의 리스트를 넘겨주고
그중에서 1번째의 인덱스값을 뽑아내는거지요.

따라서 [1]이 따로 쓰이는 건 있을 수 없습니다.
어떤 snippet을 보고 대충 감으로 베껴 쓰기전에
문법의 의미를 이해하시는게 좋습니다.
그러면 저런 실수는 하지 않겠죠.

추가 one-liner 버젼

perl -F: -ane 'print if $F[1]<8800 || $F[1]>=9000' old.txt > new.txt

woonuk의 이미지

awk를 이용한 간단 버전 ^^

awk -F: '{if ( $2 < 8800 || $2 >= 9000 ) print $0 }' 파일명 > 새파일명
익명 사용자의 이미지

a

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.