[질문]sed를 이용한 문자열 처리 질문 드립니다.
글쓴이: divi / 작성시간: 월, 2014/04/28 - 5:13오후
본문은 아래와 같습니다.
<img src="http://domain.com/common/iasdasdp.gif" alt="????" width="14" height="14" onclick="onHelpClick();" style="cursor:pointer"> <img src='http://domain3.com/com/43sa4/34asdfp.jpg?test' alt="????" width="14" height="14" onclick="onHelpClick();> <img src="http://domain2.com/common/43sa4/34234/asdf/34a222sdfp.png?sort=order"> <img aadsfasdf src="http://domain123.com/43sa4/34234/asdf/34a222sd333fp.png?ݱ?"> <img '스타일="border:2px"' src='http://domain123.com/43sa4/34234/asdf/34a222sd333fp.PNG?231' /> <img style='margin:2px' src="http://xweqr.net/test/ico_file.JPEG?asd">
아래와 같이 디렉토리명과 파일만 남기도 싶습니다.
http://domain.com/common/iasdasdp.gif http://domain3.com/com/43sa4/34asdfp.jpg http://domain2.com/common/43sa4/34234/asdf/34a222sdfp.png http://domain123.com/43sa4/34234/asdf/34a222sd333fp.png http://domain123.com/43sa4/34234/asdf/34a222sd333fp.PNG http://xweqr.net/nblog/mylog/post/ico_file.JPEG
#ymir님의 도움으로 많은 부분 해결되었는데요.
언듯 sed -n 's/.*<img.*src="\([^"]*\)".*/\1/p'
로 하면 될 것 같은데 안되네요..
다시 고수님의 도움 부탁드립니다.
감사합니다.
Forums:
음 ..
html 파일에서 url 을 뽑아낼 수 있는 방법이 많이 있는데.. 왜 굳이 sed 를 쓰려하시는지..?
sed 는 BRE 를 완전히 지원하는 것도 아니고, extended 는 optional 이라 정교하게 regex 짜려면 공을 많이 들여야 합니다.
패턴이 확실하면 그에 맞춰 뽑아 낼 수는 있어도, 모든 경우에 쓸 수 있는 건 아니죠.
grep 이라면 pcre 까지 지원하기 때문에 regex 를 rfc 수준으로 가져갈 수 있지만 sed 로는 좀 힘들겁니다.
되면 한다! / feel no sorrow, feel no pain, feel no hurt, there's nothing gained.. only love will then remain.. 『 Mizz 』
댓글 달기