파이썬으로 html 파싱하는 함수 만드는데 질문이요!
글쓴이: shutup / 작성시간: 일, 2015/11/29 - 9:14오후
만약에
<a href="주소">Content</a>
이런 태그가 있으면 주소부분을 따올수 있는 그런 함수가 필요하거든요.
이거 하나 쓰려고 파싱라이브러리 설치하기는 좀 귀찮아서 직접만들었습니다.
파이썬3으로 짠건데
def BuckAttr(page, tag, attr): whereS = page.find("<"+tag) #whereStart whereE = page[whereS:len(page)].find(">") #whereEnd fulltag = page[whereS:whereE] whereA = fulltag.find(attr) #whereAttribute whereAC = fulltag[whereA:whereE].find("\"") #whereAttributeContent return fulltag[whereAC+1:fulltag[whereAC+1:whereE].find("\"")]
코드가 대충 이렇거든요
page는 html내용이고
tag는 태그 (위의 예시에선 "a")
attr은 속성 (위의 예시에선 "href")
근데 이 코드가 아무래도 임시변수를 계속 만들다보니까 속도가 느린거같아요
최적화할 방법이 있을까요?
Forums:
참고해보세요.
.
----------------------------------------------------------------------------
젊음'은 모든것을 가능하게 만든다.
매일 1억명이 사용하는 프로그램을 함께 만들어보고 싶습니다.
정규 근로 시간을 지키는. 야근 없는 회사와 거래합니다.
각 분야별. 좋은 책'이나 사이트' 블로그' 링크 소개 받습니다. shintx@naver.com
갓쉰트니뮤ㅠ
감사합니다
Shut up, Malfoy.
댓글 달기