웹사이트를 통째로 복사해 올려면...

yuni의 이미지

웹을 타고 놀다가 보면 가끔 요긴한 정보를 발견할 경우가 많습니다.
무슨 강좌노트나 이런 개인 홈페이지의 경우 그 학기가 마치고 나면 웹사이트 자체가 없어지는 경우도 많군요.
다 출력을 해서 볼려면 상당히 부담스럽고, 간편하게 파일로 저장을 하고 싶습니다. 문제는 링크된 문서들인데, 어떻게 하면 통째로 다 가져와서 저의 하드에 보관을 해 둘 수 있을까요?
각각 링크된 곳을 열어서 다시 다른 이름으로 저장 이렇게 하면 번거롭기도 하지만 나중에 링크가 된 곳을 저의 하드에서 찾지 않고 결국 기존의 웹을 찾는군요. 나중에 웹사이트 정보가 없어지고 나면 링크 따라 하드안에 저장된 파일을 찾는 것도 상당히 번거롭군요.
무슨 좋은 방법 없을까요?

웹에서 얻은 좋은 정보를 체계적으로 잘 정리해서 나중에 쉽게 보는 방법도 환영입니다.

ssif의 이미지

심파일 혹은 하나포스 같은 자료실에 가시면
웹싸이트 긁어오는 프로그램들이있습니다.
알아서(?) 하위디렉토리의 모든 내용을 가져옵니다.

혹은 아크로벳(리더가 아닌)을 사용하시면 pdf로 저장 가능합니다.
5.0버전에서는 만들어진 파일의 품질이 그다지 좋지않았습니다.
한글지원을 원하실 경우는 플러그인 설치하시면 됩니다.
p.s.
불법적인 행위이기에 알아서 판단하시기 바랍니다.
접근금지 당하시는 경우도 있을것입니다.

봄들판에서다

랜덤여신의 이미지

정확히 말하면, 하위 페이지가 아니라 웹 페이지에 있는 모든 링크를 전부 클릭해 보는 것처럼 동작합니다.
그래서, 자바스크립트로 페이지 이동을 한 경우에는 인식률이 높지 않지요...

랜덤여신의 이미지

ssif wrote:
불법적인 행위이기에 알아서 판단하시기 바랍니다.
접근금지 당하시는 경우도 있을것입니다.

웹 페이지를 보관하는 것이 불법적인 행위인가요?
:shock:

ssif의 이미지

인클루드 wrote:

웹 페이지를 보관하는 것이 불법적인 행위인가요?
:shock:

저작권에 위촉되는 것으로 알고 있습니다.
보는 것은 자유롭지만 회사 혹은 개인이 만든 문서,이미지등을
허락없이 가저가는것이 문제가 되는 것으로 알고 있습니다.

제가 잘못 알고 있는 부분이 있을수 있기때문에
틀린부분 있으면 지적 바랍니다.

그런데 여담이지만 저또한 그렇게 저장한 문서들이 상당히 많군요.
프로그램을 사용해서가 아닌 순수한 노가다로.....-_-;

봄들판에서다

lafi-R의 이미지

윈도우 사용할땐 아래의 다모아라는 프로그램을 사용했었습니다..
http://phpschool.com/bbs2/inc_view.html?id=1456&code=down2&start=0&mode=search&field=title&search_name=&operator=and&period=all&category_id=&s_que=%B4%D9%B8%F0%BE%C6

아니면...스크린 캡쳐도 어떨런지는... :shock:

나? 내 인생의 주인공

Necromancer의 이미지

pdf 변한프로그램 (distiller나 pdfwriter)은 상용입니다. 어둠의 경로에서
구했다면 당연히 불법 되는 거고요. 긁어오는 툴도 상용이라면 걸리는거죠.

사이트 긁어오는 것 자체는 불법 아니지만,
저작권걸린 자료를 가져왔다거나 아니면 돈거래하는 사이트(쇼핑몰)에
해서 돈 관련 문제가 생긴 경우 등에는 곤란한 일이 벌어질 수 있습니다.

그리고 트래픽을 많이 유발하기 때문에 차단 당할 수도 있고요.

Written By the Black Knight of Destruction

supersky의 이미지

음..
합법적인 일이라곤 생각들지 않습니다.
저도 가끔 필요한 사이트를 복사해서 가끔 봅니다.

100%다 되는것은 아니구요.. 차단해놓은 사이트도 있습니다..

심파일 같은데 가서 webzip같은거 활용해 보시기 바랍니다.
webdown등등 그런 종류의 프로그램은 많이 있습니다.

법적인 문제는 본인이 판단해야할듯 하네요

void main()
{
printf("Hello World\n");
exit(0);
}
/* 초심으로 돌아가자~~~~~ */

fender의 이미지

----------------------------
[서명] 그놈 한국 사용자 모임 - 그놈에 대한 모든 것! - 게시판, IRC, 위키, 갤러리 등등...

yuni의 이미지

답변 감사 합니다.
저작권 문제가 좀 걸리는군요. 북마크만 딱 해 놓고 다시 가보면 없어진 자료들 때문에 그러는 것인데...
개인적인 용도로만 사용한다면 아무도 모르겠죠. 저작권 문제는 좀 더 생각을 해 봐야 겠습니다.

==========================
부양가족은 많은데, 시절은 왜 이리 꿀꿀할까요?
=====================
"지금하는 일을 꼭 완수하자."

angpoo의 이미지

개인적으로만 사용한다면 저작권 문제는 전혀 신경쓰지않아도 되죠.
그걸 자신의 홈페이지에 올린다면 문제가 될 수도 있겠지만...

근데 구글의 저장된 페이지의 경우는
싸이트 관리자의 요청이나 대응이 없으면 내용이 그대로 구글에 저장이 되는데
이건 문제가 없나요?

익명 사용자의 이미지

학습 용도로 연구하고 분석 한다면 문제 없지만 이미지 도용과 컨텐츠 저작물에 대한 보호법에
걸릴 수 있습니다.

cleansugar의 이미지

http://www.httrack.com

최근에도 하나 긁었습니다.

재벌 2세가 재벌이 될 확률과
금메달리스트 2세가 금메달을 딸 확률이 비슷해지도록
자유오픈소스 대안화폐를 씁시다.

아이디의 아이디어 무한도전
http://blog.aaidee.com

귀태닷컴
http://www.gwitae.com

익명 사용자의 이미지

와 정말 좋은 툴이군요.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.