[파이썬] 특정 위치에 있는 문자만 뽑아 내려면?
글쓴이: masoris / 작성시간: 화, 2007/03/27 - 9:58오후
안녕하세요.
검색사이트에서 검색결과 숫자만 뽑아 내려고합니다.
예를들어 엠파스에서 "파이썬"을 검색하면
http://search.empas.com/search/web.html?qn=&s=p&f=&bd=&bw=&z=E&q=%C6%C4%C0%CC%BD%E3&x=16&y=16
페이지 상단에, "웹문서 (약 70,000개중 1 - 10)"이라고 나오는데, 이중에 "70000"을 뽑아내려고 합니다.
일단은 아래 코드로 내용을 가지고 올 수 있더군요. 엠파스 뿐만아니라, 다른 사이트의 검색 결과도 얻기위해 될 수 있는한 유니코드로 처리하려고 합니다.
url = u'http://search.empas.com/search/web.html?qn=&s=p&f=&bd=&bw=&z=E&q=파이썬' text = urllib.urlopen(url.encode('euc-kr')).read().decode('euc-kr')
그래서 가져온 내용을 보니 아래와 같이 나와 있었습니다.
(...) <div class='el_tr'><font style='color:#555555'>새롭게 태어난 웹문서검색</font><a href='http://help.empas.com/view_faq.html?csn=4&dsn=19&fsn=853' target='_new'><img src='http://img.empas.com/2006/search/ico_msg.gif' width=63 height=13 style='margin-bottom:-2px'></a></div><div class='sec_t'>웹문서 <span style='font-weight:normal'>(약 70,000개중 1 - 10)</span></div><div class="sbox"> (...)
이 중에서 "70,000"을 뽑아내려면 어떻게 해야 하나요?
Forums:
re.search('약 (.+?)개중',
re.search('약 (.+?)개중', text).group(1)
댓글 달기