Daum 만화 ㅤㄲㅡㄺ어 보기
글쓴이: FlOw / 작성시간: 금, 2005/08/05 - 8:15오후
daum 만화 중에서 위대한 캣츠비라는 만화의 url를 ㅤㄲㅡㄺ어오는 스크립트입니다
실행후에 catsbe.html 라는 파일로 저장됩니다.
python의 정규식을 공부하면서 작성한거라, 미흡하며 시간도 오래걸립니다 :oops:
#
#
# Daum Manhwa : Cats be
#
#
#
import urllib
import re
urlBase = "http://cartoon.media.daum.net"
urlBase2 = "http://cartoon.media.daum.net/daumtoon/catsbe/list"
pageList = []
urlList = []
imageList = []
subjectList = []
def findImage(url):
print "Image Url Parsing...",
fp = urllib.urlopen(url)
for line in fp.readlines():
m = re.search("http:\/\/[\w\_\-\.]+\/daum\/(cartoon|news)(\/\d{6}\/\d{2}\/\w+\.jpg)", line)
if m != None:
print m.group(2)
imageList.append(m.group())
fp.close()
def findUrl(url):
print "Page Url Parsing..."
fp = urllib.urlopen(url)
for line in fp.readlines():
m = re.search("\/uccmix\/daumtoon\/catsbe(\/\d{6}\/\d{2}/cartoon/v\d{7}\.html)", line)
if m != None:
print m.group(1),
urlList.append(urlBase+m.group())
m = re.search("class=\"gv_\d{2}_\d{6}\">([^<]+)", line)
if m != None:
print m.group(1).rstrip()
subjectList.append(m.group(1).rstrip())
fp.close()
def findPage(url):
print "Page List Parsing..."
pageList.append(url)
fp = urllib.urlopen(url)
for line in fp.readlines():
m = re.search("\/index-\d+.html", line)
if m != None:
print m.group()
pageList.append(urlBase2+m.group())
fp.close()
if __name__ == "__main__":
findPage("http://cartoon.media.daum.net/daumtoon/catsbe/list/index.html")
for page in pageList:
findUrl(page)
for page in urlList:
findImage(page)
imageList.reverse()
subjectList.reverse()
filename = "catsbe.html"
no = 0
fp = open(filename, "w")
fp.write("<html>\n<body>\n<a href='"+urlBase2+"/index.html'><img src='http://img-media.hanmail.net/15/menu/cartoon/catsbe.gif' border='0'></a><br/>\n")
for data in imageList:
no += 1
fp.write(str(no)+". <a href='"+data+"'>"+subjectList[no-1]+"</a><br/>\n")
fp.write("</body>\n</html>\n")
fp.close()
print "Saved ./" + filename, "..."
Forums:


뭐냐이게
만들려면 좀 성의있게 만들던가
뭐냐이게
프로그래밍 공부한다고 하지도 마라.
우하하 -> 그럼 당신이 만들어서 공개해 보시지?진짜 병X은 너
우하하 -> 그럼 당신이 만들어서 공개해 보시지?
진짜 병X은 너같은 인간이야 남이 만들어서 공개한거 깎아내리는 사람...
만드신분이 들인시간 백분에 일만큼만 생각하면 자신이 얼마나 찌질한지 알수 있을거야.
[quote][b]우하하[/b]만들려면 좀 성의있게 만들던가 뭐냐
손님으로 글쓰기에 뭔가 조치가 필요하지 않나요?
커피는 블랙이나 설탕만..
Re: 뭐냐이게
며칠전에 다음만화의 URL들이 바뀌었습니다.
그렇게 싸잡아 비난하지 말고 무엇이 성의없는지 먼저 말해주시죠. :evil:
-------------------- 절취선 --
행복하세요:)
BeautifulSoup
Python이면, BeautifulSoup을 강추. 저도 예제 삼아 해보았는데 참고가 될런지. :oops:
#!/usr/bin/env python #ythumbs.py # -*- coding: utf-8 -*- import urllib from BeautifulSoup import BeautifulSoup # define variables thumbs = [] def get_thumbs(): URL = "http://kr.image.search.yahoo.com/search/images?b=" NAME = "&p=%B1%E8%C5%C2%C8%F1" TYPE = "&subtype=com&z=imgbox" n = 1 while n <= 201: PAGE = str(n) stream = urllib.urlopen(URL+PAGE+NAME+TYPE) soup = BeautifulSoup(stream) for link in soup('img'): thumb = link.get('src', '') if thumb: if "thumb" not in thumb: continue thumbs.append(thumb) print thumb n = n + 20 def save_to_file(): file = "ythumbs.html" fp = open(file, "w") fp.write("<html>\n<body>\n<br/>\n<table>\n<tr>\n") i = 1 for thumb in thumbs: if i < 9: fp.write("<td><img src='"+thumb+"'></td>\n") i = i + 1 else: fp.write("</tr>\n<tr><td><img src='"+thumb+"'></td>\n") i = 1 fp.write("</tr>\n</table></body>\n</html>\n") fp.close() print "Saved ./" + file, "..." if __name__ == '__main__': get_thumbs() save_to_file()----
I paint objects as I think them, not as I see them.
atie's minipage
Re: 뭐냐이게
요즘엔 '성의'라는 말의 뜻을 잘 모르나 봅니다. 노력하고 정성을 쏟아 부어 만들어주신 소스에 '성의 없다'는 표현을 쓰다니, 뭔가 착각하는거 아닐까요? :evil:
댓글 달기