php snoopy 크롤링 링크값 질문 드립니다.
글쓴이: chl66 / 작성시간: 수, 2018/09/19 - 11:20오전
제목,일자,작성자 같이 태그 사이에 있는 글들은 불러와지는데
a태그의 href의 값이 구해지지 않아서 질문드립니다.
<div class="l_title"><a href="/v3/index.php?wbb=md:view;page:;q:;search:;uid:306&sid=23&" title="뷰 페이지로 이동"><b>9월 7일-8일</b></a></div>
이런 식의 태그가 있는데 패턴을 '/a href="(.+)"/i' 요렇게 잡으면 다른 a태그들까지 가져와버리고,
/<div class=\"l_title\"><a[^>]*href=[\"']?([^>\"']+)[\"']?[^>]*>/is
이렇게하면 아무것도 뜨질 않고,
/<div class="l_title"><a href=(.*?)<\/div>/i
요렇게 작성하면 href값이 아닌 그냥 제목이 출력되네요...
저 태그의 링크값이 구해지는 정규식이나,
정규식이 아니더라도 snoopy로 링크값 추출해서 출력시킬수 있는 방법 부탁드립니다ㅜㅜ!!
Forums:
참고해보세요.
php href 추출 - 구글 검색하면 많이 나오네요.
https://www.phpschool.com/gnuboard4/bbs/board.php?bo_table=qna_function&wr_id=196562
http://okkks.tistory.com/1078
http://banasun.tistory.com/entry/php-a-href-tag에서-url만-추출하고-a-tag-제거
https://stackoverrun.com/ko/q/3425696
https://stackoverrun.com/ko/q/3524656
http://yz.usb.kr/18
http://mins01.nayana.kr/mh/tech/read/367?type=read&b_id=tech&sh=titleOrText&sw=오라클&cat=&page=41&b_idx=810&tq=&q=&ct=
https://m.blog.naver.com/PostView.nhn?blogId=choiye84&logNo=130096144808&proxyReferer=https%3A%2F%2Fwww.google.com%2F
https://kldp.org/node/158096
https://okky.kr/article/407685
https://hiseon.me/2018/03/18/php-html-parser/
----------------------------------------------------------------------------
젊음'은 모든것을 가능하게 만든다.
매일 1억명이 사용하는 프로그램을 함께 만들어보고 싶습니다.
정규 근로 시간을 지키는. 야근 없는 회사와 거래합니다.
각 분야별. 좋은 책'이나 사이트' 블로그' 링크 소개 받습니다. shintx@naver.com
댓글 달기