웹사이트 변경 감시 프로그램를 구하고 싶습니다.

aniseeker의 이미지

설치 및 활용 게시판에 올렸는데, 프로그래밍 게시판에도 올리게 되어 죄송합니다. (-_-)

특정 웹사이트 또는 웹페이지를 주기적으로 감시하여, 변경사항을 발견하면

변경된 컨텐츠를 자동으로 다운 받거나 알려주는 프로그램을 찾고 있습니다.

플랫폼은 MS Windows 또는 Linux 어느쪽이라도 좋습니다.

lkjt의 이미지

음,,,만드세요

쿠크다스의 이미지

wget,
diff
잘 지지고 볶으면 될지도...

흠, HTTP프로토콜에 파일 생성,변경 날짜에 대한 명세가 있고,
해당 서버가 그걸 충실히 구현했다면...
다른 방법이 있을지도...

과자가 아닙니다.
cuckoo dozen, 즉.12마리의 뻐꾸기란 뜻입니다.

gang의 이미지

저는 지금 KLDP.net에서 RSS feed 생성 script 프로젝트를 진행하고 있습니다.
http://web2rss.kldp.net/

아직 완성되지는 않았지만, 요즘 일반 HTML 페이지에 대한 RSS 생성 script를 만드는 작업을 하고 있습니다. 이게 만들어지면, 이를 이용하여 웹페이지 갱신 여부도 어느정도 RSS를 통하여 알수 있을 것 같습니다.

하지만, 시간이 촉박하거나, 좀더 customized된 환경을 원한다면 직접 프로그램을 작성하시는게 좋겠군요. 다른 언어들에 대한 HTTP 라이브러리들도 있겠지만, 저는 RSS feed를 만들기 위해 Perl의 LWP 모듈을 사용하고 있습니다. 이를 이용하면 HTTP client를 쉽게 구현할 수 있죠.
http://search.cpan.org/ 에서 검색해보세요.

대상 웹사이트가 .html 과 같은 특정 파일인 경우, GET 명령으로 해당 웹페이지를 모두 읽어올 필요 없이, HEAD 명령만으로 파일 정보를 가져올 수 있는 경우가 많습니다. 그러면, 파일 갱신 시간을 확인할 수 있습니다. 그런데, CGI나 PHP와 같은 dynamic한 웹페이지의 경우에는 이러한 갱신 시간 정보를 이용할 수 없는 경우가 많습니다. 그런 경우에는 GET 명령으로 내용을 모두 가져와서, 이전에 가져와서 저장하였던 내용과 비교하는 수 밖에 없지 않나 하는 생각이 듭니다.

medjay의 이미지

상용입니다만...
사용해보지는 않아서 원하시는 기능이 있는지는 모르겠습니다.

WebSite-Watcher
http://www.aignes.com/

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.