[완료]java byte[]-> string와 java 한글 1바이트에 관련된 질문있습니다.
글쓴이: anaud2 / 작성시간: 월, 2008/09/22 - 12:22오후
안녕하세요
java 클라이언트와 c서버간에 통신을 공부하고 있는 사람입니다.
java에서 byte[]을 string으로 만드는방법에서
new string(byte[])을 사용하지 않고 다른 방법으로 바꿀수 없나요? 밑에 경로의 글에서
new string(byte[])이방법이 버젼에따라 다르게 될수가 있다란말을 읽어서요
암호화와 여러가지를 해서 완벽하게 이해는 못했지만 버젼에 따라 달라진다면
그걸 사용해서 프로그램을 만들지 못할꺼 같아서요 다른함수가 있는건지 자료를 찾아봐도
모두 new string(byte[])방법만 사용해서 혹시나 해서 질문 드립니다. 다른함수가 있나요
http://www.javaservice.net/~java/bbs/read.cgi?m=devtip&b=javatip&c=r_p&n=1061499377
두번째 질문은 자바에서는 한글이 1바이트로 알고 있는데요 C와 통신을 하기위해선
문제가 되지 않을까요? c에서는 2바이트를 사용하는데 c에서 올바르게 인식이 안될거
같은데요 또 c가 한글2바이트를 전송한다면 클라이언트에서도 바이트를 string 변화에
문제가 될거 같구요~
이 문제는 어떻게 해결을 해야할까요?
Forums:
java는 유니코드
java는 유니코드 기반입니다. :)
-----
오늘 나의 취미는 끝없는, 끝없는 인내다. 1973 法頂
-----
오늘 나의 취미는 끝없는, 끝없는 인내다. 1973 法頂
윗분에 덧붙이면
byte를 encoding 또는 character라는 키워드와
같이 검색해 보세요.
java가 한글을 1byte로 처리한다는 의미에는
1byte != 8bit 이런 개념이 들어있을 수도 있습니다.
-------------
포탈이는 불사신
-------------
포탈이는 불사신
윗분에 덧붙이면 2
첫째, 이 문제는 자바의 문제(버그)가 아니라 해당 프로그램의 문제(버그)이므로 코드체계를 확실히 이해한다면 큰 문제가 아닙니다.
자바는 유니코드를 사용합니다. 그러나 이것을 바이트열로 표현하는데에는 여러가지 방법이 있으며 이것을 인코딩(캐릭터셋, 코드페이지 등 여러가지 표현이 있습니다)이라고 합니다. 자바는 실행환경에 따라 인코딩이 다를 수 있습니다. MS윈도는 MS949, 제 우분투는 UTF-8. 다시 말해 인코딩이 다르면 같은 글자라 하더라도 바이트 배열이 다를 수 있습니다. String(byte[] bytes) 생성자는 전달받는 바이트열을 자신(자바가 실행되는 환경)의 인코딩인 것으로 간주합니다. 이것은 대부분의 시스템에서 문제가 없습니다. 그런데 왜 생성자 String(byte[] bytes)이 문제가 되는가 하면 1)통신환경 같은 경우에서 자신의 인코딩은 UTF-8인데 전달받은 바이트열이 EUC_KR과 같은 경우 2)파일을 읽고 쓰는 어떤 프로그램이 지금의 인코딩과 다른 인코딩을 쓰는 시스템으로 이주하는 경우 등이 있기 때문입니다. 이 바이트열을 다른 인코딩으로 해석해버리므로 당연히 잘못된 결과물을 얻을 수 밖에 없습니다. 따라서 필요에 따라 String(byte[] bytes, Charset charset) 같은 생성자를 써서 프로그램을 작성하면 됩니다.
둘째, 자바는 유니코드를 사용합니다. 유니코드에서 하나의 글자는 하나의 글자일 뿐입니다. 한글로 하나의 글자라도 몇개의 바이트가 쓰일지는 인코딩에 따라 다릅니다. C 프로그램과 상호 운용이 필요하다면 인코딩만 적당히 맞춰주면 됩니다.
C에서 한글이 2바이트라고 하셨는데 인코딩을 정확히 알아 보셔야할 듯 합니다.
ㅇ 영어라 아쉽기는 하지만 자세하고 확실한 내용은 역시 API 문서가 최고입니다.
ㅇ www.javaservice.net, www.okjsp.pe.kr같은 사이트에 가보시면 자바에 관한 왠만한 답은 다 있으니 이쪽을 둘러보시는 것도 좋습니다.
댓글 달기