XML 파서만들기.. 질문입니다. ㅜㅜ

jyinjc의 이미지

XML파서를 만들어야 하는데요 어떻게 만들어야 할 지 막막합니다. ㅜ

직접 파서를 만들어야 해서
파서가 텍스트를 해석한 후에 “스택” 또는 “트리“로 자료를 재구성해야 하는데
어떤 것을 어떻게 시작해야 할 지 막막하네요.. 여기저기 구글링을 통해 자료를 찾고 보고 있어요.ㅜ

또 XPath를 이용하라는데 이것을 이용해서 XML파서를 만들어야 하는 것인지..
영 감이 안오네용..ㅜㅜ

불쌍한 학생 건져주세용ㅜㅜ
고수님들의 디테일한 답변 기다려요..

cleansugar의 이미지

제일 많이 쓰이는 것은 libxml입니다.

XPath는 파서가 아닙니다.

XPath는 정규식처럼 XML의 노드를 필터링해서 검색하는 방법입니다.

파서가 다 만들어진 다음 XPath가 파서를 이용해 검색을 하는 것입니다.

___________________

http://blog.aaidee.com

재벌 2세가 재벌이 될 확률과
금메달리스트 2세가 금메달을 딸 확률이 비슷해지도록
자유오픈소스 대안화폐를 씁시다.

아이디의 아이디어 무한도전
http://blog.aaidee.com

귀태닷컴
http://www.gwitae.com

jyinjc의 이미지

libxml을 이용해서 xml파서를 만들 수 있다는 것인가요?
XPath를 알아보니

<body>
<script type="text/javascript">
function loadXMLDoc(dname)
{
if (window.XMLHttpRequest)
  {
  xhttp=new XMLHttpRequest();
  }
else
  {
  xhttp=new ActiveXObject("Microsoft.XMLHTTP");
  }
xhttp.open("GET",dname,false);
xhttp.send("");
return xhttp.responseXML;
}
 
xml=loadXMLDoc("books.xml");
path="/bookstore/book/title"
바로위의 코드와 같이 저런 식으로 XML데이터를 추출하더라구요
 
아아... 무슨 트리구조 트레버셜 막 뭐라고 하시는데
어렵네요.. 답글 써놓고 요지를 모르겠어요
XML파서를 어떻게 만들어야 할지.ㅜ
cleansugar의 이미지

윈도우 프로그래밍은 devpia가 더 잘 가르쳐줄겁니다.

libxml은 제일 많이 쓰이는 파서 이름이고 소스는 무척 복잡합니다.

위의 소스는 파서가 아니라 XML파일을 인터넷에서 불러오는 것입니다.

이렇게 불러온 XML을 파서에 연결시켜야되는 것이죠.

숙제가 정확하게 파서를 만드는 것인지 아니면 만들어진 파서라이브러리를 사용하는 것인지 모르겠네요.

파서는 더 복잡합니다만 만들어보지 않아서 모르겠네요.

트리를 트래버스한다는 건 XML트리를 하나씩 훓는다는 겁니다.

방법은 깊이 우선, 너비 우선이 있고요.

이렇게 탐색한 내용을 스택 구조 방식으로 메모리에 저장해놓습니다.

그래서 스택에서 하나씩 꺼내면서 출력을 하는 겁니다.

XML이나 HTML파서 예제 찾아보면 많을 거예요.

우선 XML책을 하나 보시고 기술 이해를 하세요.

특히 DOM방식을 보셔야 될 겁니다.

___________________

http://blog.aaidee.com

재벌 2세가 재벌이 될 확률과
금메달리스트 2세가 금메달을 딸 확률이 비슷해지도록
자유오픈소스 대안화폐를 씁시다.

아이디의 아이디어 무한도전
http://blog.aaidee.com

귀태닷컴
http://www.gwitae.com

jyinjc의 이미지

답변감사합니다. ^^

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.