Python을 이용한 프로그램 개발중에 막히는 XML문서처리에서 막히는 부분이 있어 질문을 올립니다.
파이선버전은 2.7.1버전입니다. 그리고 사용중인 파서는 from xml.etree import ElementTree 입니다.
XMLParser에서 한글이 포함된 문서를 처리하지 못하는 증상이 있습니다.
그래서 XML에서 읽어온 한글이 포함된 데이터를 아래와 같으느 코드로 EUC-KR로 인코딩하려고 하니
f = open('../XMLSpec/ObjectIssueTrackerSearch.xml', 'r')
data = f.read()
data = unicode(data, 'euc-kr')
UnicodeDecodeError: 'euc_kr' codec can't decode bytes in position 2-3: illegal multibyte sequence 이란 메세지가 뜹니다....
검색을 해봐도 답이 안나옵니다.
어떻게 해야 한글이 포함된 내용을 파싱할 수 있을까요?