파이썬에서 CSV 파일과 SVG 파일을 불러들일 때 한글 인코딩 문제에 대해서
글쓴이: grafika / 작성시간: 화, 2011/09/20 - 3:50오전
CSV 파일와 SVG 파일을 대조, 두 파일이 같은 값을 가진 부분이 발견되었을 때 특정한 작업을 시행하는 파이썬 스크립트를 짜고 있습니다.
그런데, 문제는 그 대조하는 값이 한글 단어입니다.
CSV 파일에 '가나다'라는 단어가 있고, SVG 파일에 '가나다'라는 단어가 있습니다.
두 파일 모두 UTF-8 인코딩으로 저장을 했습니다.
문제는, 파이썬에서 CSV 파일과 SVG 파일을 불어와 둘을 대조시키는 작업에서 벌어집니다.
아무래도 파일을 불어오는 과정에서 인코딩이 맞지 않아 두 파일의 한글 단어가 비교되지 않는 듯합니다.
파이썬 코드 맨 윗줄에
# -*- coding: utf-8 -*-
를 붙였는데도, 효과가 없습니다.
UTF-8로 인코딩된 CSV 파일과 SVG 파일을 어떻게 불어와야지 한글 단어가 정상적으로 서로 비교될 수 있을까요?
참고로, 한글 단어에 해당하는 부분을 영어로 치환해서 실행하면 원하는 작업이 정상적으로 이뤄집니다.
Forums:
파이썬 코드 상단의 인코딩 표시는 해당 소스가
파이썬 코드 상단의 인코딩 표시는 해당 소스가 utf8 로 작성되었다는 것을 의미하지 그 이상의 의미는 없습니다.
http://www.evanjones.ca/python-utf8.html
에서 Reading UTF-8 Files 보시면 좀 참고 될겁니다.
조언 감사합니다. 알려주신 링크의 문서도 참조해서
조언 감사합니다.
알려주신 링크의 문서도 참조해서 시도해 봤는데, 생각한 결과가 나오지 않아 고민하고 있습니다.
SVG 파일 속성에 한글이 들어갈 경우, 파이썬에서 인코딩은 어떻게 될까요?
방법이 제대로 되었는데도 원하는 값이 안나온다면 해당
방법이 제대로 되었는데도 원하는 값이 안나온다면 해당 문자열이 UTF-8이 아닌 경우도 고려해보시면 어떨까요. CP949라던가...
댓글 달기