파이썬에서 httplib로 html 읽어오면 읽을 수 없게 되있던데
1. 어떻게 하면 읽을 수 있게 바꿀 수 있나요? 인코딩해줘야 하나요? 그렇다면 어떻게 인코딩하나요?
2. print로 출력하면 읽을 수 있게 나오던데 print에서 인코딩 하고 출력하는건가요?
읽을 수 없다는 의미가 한글등이 깨진다는 의미겠지요? 문제해결을 하려면 우선 왜 한글이 깨져서 보일까 를 이해해야합니다.http://studyforus.tistory.com/167 윗링크를 참고하여 한글 인코딩을 이해(글씨가 깨지는 이유등)합니다. 그후 파이썬에서 제공하는 인코딩, 디코딩 메소드를 적절하게 사용하면 됩니다. str.encode, str.decode 등
그냥 BeautifulSoup로 파싱하니까 되네요 그래도 덕분에 인코딩에 대해 알아가네요 답변 감사합니다
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
.
읽을 수 없다는 의미가 한글등이 깨진다는 의미겠지요?
문제해결을 하려면 우선 왜 한글이 깨져서 보일까 를 이해해야합니다.
http://studyforus.tistory.com/167
윗링크를 참고하여 한글 인코딩을 이해(글씨가 깨지는 이유등)합니다.
그후 파이썬에서 제공하는 인코딩, 디코딩 메소드를 적절하게 사용하면 됩니다.
str.encode, str.decode 등
그냥 beautifulsoup로
그냥 BeautifulSoup로 파싱하니까 되네요
그래도 덕분에 인코딩에 대해 알아가네요 답변 감사합니다
댓글 달기