perl 치환 질문(해결됨)

doodoo의 이미지

에구 '없음' 포럼에 올렸군요... 다시올립니다.

파일이 여러게 있습니다.
그래서 이름을 한꺼번에 변경하게 위해 아래와 같이 하려하는데...시험 결과가 이상하네요...
ps 1. 20200201 은 나중에 $1 으로 많은 파일 이름중 지우려는 문자열이며 bash에서 따로 받을겁니다.
ps 2. 경우의 수가 많습니다

 ' - aaa' or '_aaa' or ')aaa' or ') - aaa' or '.aaa'

echo '20200201 - 2020aaa' | perl -nle 'system "echo mv \"$_\" ".do{s/^[( ]*'20200201'[) -_\.]*/\"/g;s/$/\"/;$_}'

원했던것 : 2020aaa
결과 : aaa

echo '20200201 - 2020aaa' | perl -nle 'system "echo mv \"$_\" ".do{s/^[( ]*'20200201'[) -\._]*/\"/g;s/$/\"/;$_}'

원했던것 : 2020aaa
결과 : 2020aaa

[ ] 블럭 안의 것은 순서에 상관없는것 아닌가요?

김정균의 이미지

혹시 이런걸 원하시는 건가요?

#!/bin/bash
 
pattern=(
    '20200201 - 2020aaa'
    '20200201_2020aaa'
    '(20200201)2020aaa'
    '(20200201) - 2020aaa'
    '20200201.2020aaa'
)
 
for i in "${pattern[@]}"
do
    cat <<- EOL
        echo "$i" | sed -r 's/.*(- |[_).])(.+)$/mv \"\0\" \"\2\"/g'
    EOL
    echo -n "  => "
    echo "$i" | sed -r 's/.*(- |[_).])(.+)$/mv \"\0\" \"\2\"/g'
    echo
done

결과:


echo "20200201 - 2020aaa" | sed -r 's/.*(- |[_).])(.+)$/mv \"\0\" \"\2\"/g'
=> mv "20200201 - 2020aaa" "2020aaa"

echo "20200201_2020aaa" | sed -r 's/.*(- |[_).])(.+)$/mv \"\0\" \"\2\"/g'
=> mv "20200201_2020aaa" "2020aaa"

echo "(20200201)2020aaa" | sed -r 's/.*(- |[_).])(.+)$/mv \"\0\" \"\2\"/g'
=> mv "(20200201)2020aaa" "2020aaa"

echo "(20200201) - 2020aaa" | sed -r 's/.*(- |[_).])(.+)$/mv \"\0\" \"\2\"/g'
=> mv "(20200201) - 2020aaa" "2020aaa"

echo "20200201.2020aaa" | sed -r 's/.*(- |[_).])(.+)$/mv \"\0\" \"\2\"/g'
=> mv "20200201.2020aaa" "2020aaa"

doodoo의 이미지

아 죄송합니다. '20200201 - 2020aaa' '20200201 - 2020aaa' 도 있을수 있습니다. ㅠ
제가 생성하는 파일이 아니어서 ㅠ.

두개의 공백을 처리하기 위해 s/.*(- |[_).])*(.+)$ 해 봤는데...안되는군요...

어쨓든 제 질문의 요지는 [) -_\.] 은 2020aaa 중 2020을 지워버리는 문제가 있고
[) -\._] 는 안지우는데...[ ] 안에는 원래 순서가 상관없는것 아니냐 하는겁니다.

질문2. (- |[_).]) 이 부분 왜 데쉬,공백 부분과 _.) 두개로 나누셨어요?

김정균의 이미지

공백이 여러개 일 수 있다면

echo "$i" | sed -r 's/.*(- +|[_).])(.+)$/mv \"\0\" \"\2\"/g'

로 처리가 가능 합니다.

어쨓든 제 질문의 요지는 [) -_\.] 은 2020aaa 중 2020을 지워버리는 문제가 있고 [) -\._] 는 안지우는데...[ ] 안에는 원래 순서가 상관없는것 아니냐 하는겁니다.

순서 상관 없습니다. 다만 '-' 는 A-Z 와 같이 범위 지정자로 사용될 수 있으므로 가장 마지막에 넣어 주는 것이 좋습니다.

질문2. (- |[_).]) 이 부분 왜 데쉬,공백 부분과 _.) 두개로 나누셨어요?

정규식은 잘 만들면(?) 암호같이 만들 수 있으므로, 직관성이 있게 하려고 나누었습니다.

"[_).-] +" 으로 해도 처리는 가능 합니다만.. 이런 경우에는 "asdfasdf . 2020aaa" 도 거를 수가 있겠죠. 즉 의도한 바가 아니게 동작할 수 있거나 또는 생각지도 못했던 예외를 처리해 줄 수도 있게 됩니다. 하지만 의도하지 않은바는 명확하겠죠 좋은 쪽이든 그렇지 않든..

swish95의 이미지

이걸 perl 로 해야 되는 이유라도 있나요?

rename 's/20200201[) -_\.]//' 파일패턴

------------------------------------------------------------
ProgrammingHolic

doodoo의 이미지

rename 's/20200201[) -_\.]//' 파일이름 이라는 거죠? 맞나요?

touch '20200201  -  2020aaa' '20200201-2020aaa' '(20200201)2020aaa'
rename 's/20200201[) -_\.]//' *  <--- 안됨.
for i in *;do 's/20200201[) -_\.]//' "$i";done <--- 에러나요.

테스트는 시그윈64에서 했습니다.

swish95의 이미지

[] 안에 문자는 당연히 순서는 의미가 없습니다만 님이 쓴 정규 표현식은 - 가 쓰이므로 원하는 결과가 안나올겁니다.
- 은 범위를 나타내므로 이스케이프로 바꿔야 됩니다.

>touch '20200201  -  2020aaa' '20200201-2020aaa' '(20200201)2020aaa'
>rename 's/\(?20200201[) \-_\.]*//' *
'20200201  -  2020aaa' not renamed: '2020aaa' already exists
'20200201-2020aaa' not renamed: '2020aaa' already exists

이렇게 하면 2020aaa 가 중복되는거 보니 제대로 된거 같네요

그리고 do 문에 ; 도 없고 rename 도 없네요 ^^

for i in *;do;rename 's/\(?20200201[) \-_\.]*//' "$i";done

근데 이런식이면 for 문은 필요 없어지겠군요

------------------------------------------------------------
ProgrammingHolic

doodoo의 이미지

감사합니다....

모든 비밀은 범위 연산자(?) 였군요....

김정균의 이미지

[] 안의 - 는 escape 을 하는 것은 별로 좋지 않습니다. 정규식의 종류에 따라 [] 안에서 \ 를 escape 을 취급하지 않는 경우도 있기 때문 입니다. 즉 escape 의도로 넣었으나, '/' 문자를 인식하게 되는 의도하지 않은 경우가 발생할 수 있습니다. 그러므로 [] 안에서 - 를 범위 연산자로 사용하지 않으려면 escape 보다는 가장 마지막에 위치 시키는 것이 좋습니다.

[user@host ~]$ echo "\\" | grep -E "[\]"   -> escape 가 되지 않고 '\' character detact
\
[user@host ~]$ echo "\\" | grep -E "[\-]"  -> escape 가 되지 않고 '\' character detact
\
[user@host ~]$ echo "\\" | awk '/[\-]/ { print $0; }'   -> awk 의 경우에는 '\' 가 escape 로 사용 됨
[user@host ~]$ echo "\\" | awk '/[\\-]/ { print $0; }'
\

아래와 같이 - 를 마지막에 놓으면 escape 을 해야 하느니 마느니 고민할 필요가 없습니다.

[user@host ~]$ echo "-" | grep "[A-Z-]"
-
[user@host ~]$ echo "-" | awk '/[A-Z-]/ { print $0; }'
-
김정균의 이미지

do 다음에는 ';' 가 없는 것이 문법적으로 맞습니다.

[user@host ~]$ for i in {1..3}; do echo $i; done
1
2
3
[user@host ~]$ for i in {1..3}; do; echo $i; done
bash: syntax error near unexpected token `;'
swish95의 이미지

아.. 그렇군요 ^^

------------------------------------------------------------
ProgrammingHolic

bushi의 이미지

#!/bin/bash
 
pattern=(
    '20200201 - 2020aaa'
    '20200201_2020aaa'
    '(20200201)2020aaa'
    '(20200201) - 2020aaa'
    '20200201.2020aaa'
    '202002012020aaa'
    'blah'
)
 
key="20200201"
regex='[^[:alnum:]]{0,}'"$key"'[^[:alnum:]]{0,}(.*)'
 
for x in "${pattern[@]}"
do
   if [[ $x =~ $regex ]]
   then
        printf "%25s => %s\n" "$x" "${BASH_REMATCH[1]}"
   fi
done

$ sh m.sh
       20200201 - 2020aaa => 2020aaa
         20200201_2020aaa => 2020aaa
        (20200201)2020aaa => 2020aaa
     (20200201) - 2020aaa => 2020aaa
         20200201.2020aaa => 2020aaa
          202002012020aaa => 2020aaa
doodoo의 이미지

bash가 저렇게 까지 되는군요...
다시 배워야 하남....

저 위에서 ${1..3} 보고 놀랬는데..여기서 정규식까지 보게 되네요..-00-;

doodoo의 이미지

앞뒤로 따옴표등에 스트레스가 있어서 결국 이렇게 바꾸었어요

perl -e '@f=glob("*");map{$a=$_;$a=~s/^[( ]'$1'[) \._-]*//;rename $_, $a}@f'

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.