혹시 xml dom 파서로 html도 파싱되나요?
안된다면 c++ html dom 파서는 어떤게 있는지 좀 알고싶습니다. (__)
일반적인 xml파서로는 아마 안될겁니다. strict xhtml은 당연히 되겠습니다만, 우리가 흔히 인터넷에서 접하는 html은 종료 태그가 엉터리로 붙어있는 경우가 많습니다.
그렇군요. 1000개가 넘는 메일을 백업했는데 html로 받아놔서 그걸 xml로 변환하려고하거든요. "보낸이" "받는이" "xxxx@abcd.com" 형태의 패턴이 있으니 정규표현식을 써보는것도 고민해봐야겠네요 댓글감사~
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
일반적인 xml파서로는 아마 안될겁니다. strict
일반적인 xml파서로는 아마 안될겁니다.
strict xhtml은 당연히 되겠습니다만,
우리가 흔히 인터넷에서 접하는 html은 종료 태그가 엉터리로 붙어있는 경우가 많습니다.
음..
그렇군요.
1000개가 넘는 메일을 백업했는데 html로 받아놔서 그걸 xml로 변환하려고하거든요.
"보낸이" "받는이" "xxxx@abcd.com" 형태의 패턴이 있으니
정규표현식을 써보는것도 고민해봐야겠네요
댓글감사~
댓글 달기