cpu의 종류에 따라 문서의 BOM이 다른가요?
글쓴이: dltkddyd / 작성시간: 토, 2014/06/14 - 3:40오후
데이터를 어떤 순서로 기록하는지를 문서의 선두에 표시해둔 것을 BOM이라고 하던데요. 인텔계열은 cpu가 리틀 엔디언 방식으로 메모리에 배열하고 그 외의 cpu는 빅 엔디언 방식으로 메모리에 배열하는 것으로 알고 있습니다. 그런데 BOM은 오히려 빅 엔디언을 나타냅니다. 제가 인텔 cpu 컴퓨터에서 utf32 문서를 열어서 BOM을 읽어봤더니
0x 00 00 FE FF
입니다. 이런 값의 BOM은 빅엔디언이라고 하던데요. cpu는 리틀 엔디언이라고 하는데 BOM은 빅 엔디언으로 출력됩니다. 이 처리하는 방식이 서로(cpu와 문서에서) 같아야 되는 것 아닌가요? 다를 수 있다면 그 이유가 뭔지 궁금합니다.
Forums:
http://en.wikipedia.org/wiki/
http://en.wikipedia.org/wiki/Byte_order_mark
http://ko.wikipedia.org/wiki/%EB%B0%94%EC%9D%B4%ED%8A%B8_%EC%88%9C%EC%84%9C_%ED%91%9C%EC%8B%9D
읽어 보시고
구글님을 활용하셔요 :)
세벌 https://sebuls.blogspot.kr/
http://www.unicode.org/versio
http://www.unicode.org/versions/Unicode5.0.0/ch03.pdf
45쪽(인쇄 상으로는 107쪽)을 보세요. UTF-32라고만 돼있으면 big-endian일 수도 있습니다.
BOM값을 보고서 각각의 상황에 맞는 방법으로
BOM값을 보고서 각각의 상황에 맞는 방법으로 데이터를 해석하면 됩니다.
BOM은 문서에 저장된 데이터의 바이트 순서를 말하는 것일 뿐입니다. cpu가 리틀이라고 BOM 값이 빅에서 리틀로 바뀌는 마법이 일어나지는 않습니다. 굳이 이런 일이 일어난다면, BOM뿐 아니다 문서의 나머지 데이터의 바이트 순서도 모두 자동으로 바뀌어야 문제가 없겠지요. 실제로는 그렇지 않고 프로그램 상에서 상황에 맞게 일일이 다 바꾸어서 처리합니다.
문서와 cpu의 엔디안이 다를 경우 너무 비효율적이 아니냐 의문이 들 수 있겠습니다만, 거의 대부분의 경우에 있어 프로그램에서 바이트 순서를 스왑하는 정도는 극히 미미한 영향을 줄 뿐입니다.
댓글 달기