Daum 만화 ㅤㄲㅡㄺ어 보기
글쓴이: FlOw / 작성시간: 금, 2005/08/05 - 8:15오후
daum 만화 중에서 위대한 캣츠비라는 만화의 url를 ㅤㄲㅡㄺ어오는 스크립트입니다
실행후에 catsbe.html 라는 파일로 저장됩니다.
python의 정규식을 공부하면서 작성한거라, 미흡하며 시간도 오래걸립니다 :oops:
# # # Daum Manhwa : Cats be # # # import urllib import re urlBase = "http://cartoon.media.daum.net" urlBase2 = "http://cartoon.media.daum.net/daumtoon/catsbe/list" pageList = [] urlList = [] imageList = [] subjectList = [] def findImage(url): print "Image Url Parsing...", fp = urllib.urlopen(url) for line in fp.readlines(): m = re.search("http:\/\/[\w\_\-\.]+\/daum\/(cartoon|news)(\/\d{6}\/\d{2}\/\w+\.jpg)", line) if m != None: print m.group(2) imageList.append(m.group()) fp.close() def findUrl(url): print "Page Url Parsing..." fp = urllib.urlopen(url) for line in fp.readlines(): m = re.search("\/uccmix\/daumtoon\/catsbe(\/\d{6}\/\d{2}/cartoon/v\d{7}\.html)", line) if m != None: print m.group(1), urlList.append(urlBase+m.group()) m = re.search("class=\"gv_\d{2}_\d{6}\">([^<]+)", line) if m != None: print m.group(1).rstrip() subjectList.append(m.group(1).rstrip()) fp.close() def findPage(url): print "Page List Parsing..." pageList.append(url) fp = urllib.urlopen(url) for line in fp.readlines(): m = re.search("\/index-\d+.html", line) if m != None: print m.group() pageList.append(urlBase2+m.group()) fp.close() if __name__ == "__main__": findPage("http://cartoon.media.daum.net/daumtoon/catsbe/list/index.html") for page in pageList: findUrl(page) for page in urlList: findImage(page) imageList.reverse() subjectList.reverse() filename = "catsbe.html" no = 0 fp = open(filename, "w") fp.write("<html>\n<body>\n<a href='"+urlBase2+"/index.html'><img src='http://img-media.hanmail.net/15/menu/cartoon/catsbe.gif' border='0'></a><br/>\n") for data in imageList: no += 1 fp.write(str(no)+". <a href='"+data+"'>"+subjectList[no-1]+"</a><br/>\n") fp.write("</body>\n</html>\n") fp.close() print "Saved ./" + filename, "..."
Forums:
뭐냐이게
만들려면 좀 성의있게 만들던가
뭐냐이게
프로그래밍 공부한다고 하지도 마라.
우하하 -> 그럼 당신이 만들어서 공개해 보시지?진짜 병X은 너
우하하 -> 그럼 당신이 만들어서 공개해 보시지?
진짜 병X은 너같은 인간이야 남이 만들어서 공개한거 깎아내리는 사람...
만드신분이 들인시간 백분에 일만큼만 생각하면 자신이 얼마나 찌질한지 알수 있을거야.
[quote][b]우하하[/b]만들려면 좀 성의있게 만들던가 뭐냐
손님으로 글쓰기에 뭔가 조치가 필요하지 않나요?
커피는 블랙이나 설탕만..
Re: 뭐냐이게
며칠전에 다음만화의 URL들이 바뀌었습니다.
그렇게 싸잡아 비난하지 말고 무엇이 성의없는지 먼저 말해주시죠. :evil:
-------------------- 절취선 --
행복하세요:)
BeautifulSoup
Python이면, BeautifulSoup을 강추. 저도 예제 삼아 해보았는데 참고가 될런지. :oops:
----
I paint objects as I think them, not as I see them.
atie's minipage
Re: 뭐냐이게
요즘엔 '성의'라는 말의 뜻을 잘 모르나 봅니다. 노력하고 정성을 쏟아 부어 만들어주신 소스에 '성의 없다'는 표현을 쓰다니, 뭔가 착각하는거 아닐까요? :evil:
댓글 달기