http에 대해 조언을 구합니다.

글쓴이: 익명 사용자 / 작성시간: 수, 2002/01/30 - 1:11오전
제가 소켓을 이용하여 www서버의 메인 페이지를
받아서 어떤 일을 처리 하는 프로그램을 작성하고 있습니다.
근데 한가지 문제점이 있어서 이렇게 문의 드립니다
소켓에서 웹 서버의 ip를 입력하여 접속 한 후
GET /index.html HTTP/1.0
이라고 명령을 내리면 웹 서버의 메인 페이지가 전송이 됩니다. 물론 메인 페이지의 파일 명이
index.html일 경우만 그렇지요.....
하지만 메인 페이지의 파일명이 index.html이 아닌경우도 많이 있지요.(*.jsp, *.php등등)
여기에서 문제가 발생했습니다.
저는 이 메인 페이지의 파일명을 입력 하지 않고 메인 페이지를 받아 오고 싶습니다. 웹브라우저 처럼 말입니다.
C에서 이 메인 페이지의 파일명을 입력 하지 않고
메인 페이지를 받아오는 방법이 있는 지요?
관련 계념 만이라도 알려 주시면 감사 하겠습니다.
제발 부탁 드립니다.
Forums:
Re: http에 대해 조언을 구합니다.
일단 메인페이지를 얻기 위해서는 /index.html부분을 그냥 /로 하시면
됩니다.
이렇게 하면 거의 대부분의 사이트를 처리하실수 있습니다.
하지만, 페이지가 리다이렉션되는 경우는 의도하는 메인 페이지를 바로
얻으실수가 없습니다.
리다이렉션으로 페이지가 넘어가는 경우는 다음의 두가지 경우가 있습니
다.
1) 메타 태그를 이용한 리다이렉션 이 경우는 간단하게 메타 태그만을
분석하여 리다이렉션되는 URL을 가져와 다시 HTTP GET으로 요청하시면
됩니다.
2) 자바스크립트를 이용한 리다이렉션 자바스크립트를 이용하여 리다이
렉션을 구현한 경우입니다. 그렇게 많은 수는 아니지만 이렇게 메인 페
이지 리다이렉션을 구현한 사이트도 있습니다. 자바스크립트를 분석하
여 처리가 가능하지만, 워낙 경우의 수가 많아 쉬운편은 아닙니다. 이
와 같은 경우, 일반적인 WebBot이 아닌 웹스크래핑기반의 WebBot으로 해
결가능합니다.
Re^2: http에 대해 조언을 구합니다.
감사 합니다.
댓글 달기