안녕하세요 얼마전에 어떤 사이트를 크롤러로 긁었는데요 개인적으로 옵션이 많은 HTTRACK을 애용하는 편인데 얼마전에 웹집으로 긁어지되 HTTRACK으로는 안 긁어지는 사이트가 있었어요
HTTRACk에서는 mirror is empty 라고 뜨더라고요 그런데 webzip에서는 정상적으로 Htm으로 긁어집니다..
제가 지식이 짧아서.. 왜일까요?
HTTRACK과 webzip의 소스코드를 봐야 알 것 같습니다.
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
HTTRACK과 webzip의 소스코드를 봐야 알 것
HTTRACK과 webzip의 소스코드를 봐야 알 것 같습니다.
댓글 달기