[완료] php(?) 한글 인코딩 문제
취미삼아 웹서버를 돌리고 있습니다. 이것저것 가능한지 테스트 해보는 용도로 쓰고있는데요.
구글 번역 기능을 옮겨와 활용할 수 있을까 싶어서 소스도 보고 하다가... 파이어폭스 웹 콘솔을 보니 구글 번역에서 번역 버튼을 누르는 순간
http://translate.google.co.kr/translate_a/t?client=t&text=번역할것&hl=ko&sl=ko&tl=en&multires=1&prev=btn&ssel=4&tsel=3&sc=1
이런게 왔다갔다 하는게 보였습니다.
그래서 그대로 주소창에 복사해보니 파일 다운로드 창이 뜨길래 다운받으니 t 라는 이름의 텍스트 파일입니다.
예를들어 '시험' 이라는 단어를 넣고 다운로드해서 내용을 보면
[[["Test","시험","","siheom"]],[["명사",["test","exam","examination","try","assay","tentative","probe","proof","probation"]]],"ko",,[["Test",[5],1,0,890,0,1,0]],[["시험",4,,,""],["시험",5,[["Test",890,1,0],["Exam",56,1,0],["Examination",53,1,0],["Testing",0,1,0],["Tests",0,1,0]],[[0,2]],"시험"]],,,[["ko"]],29]
앞부분처럼 [번역된 내용,번역할 내용,발음] 이런식으로 원하던 정보를 얻을 수 있다는걸 알았습니다.
그래서 이제 이걸 웹서버에서 사용할 수 있어야 하는데 아무리 해도 정상적인 데이터를 얻을 수가 없습니다.
처음 사용했던게 file_get_contents("URL"); 였는데 결과를 보니
[[["Sswotppurk","�험","","sswochppulg"]],,"ko",,[["Sswotppurk",[5],1,0,1000,0,1,0]],[["�험",5,[["Sswotppurk",1000,1,0]],[[0,2]],"�험"]],,,[["ko"]],3]
이렇게 이상하게 나옵니다. 물론 문자 인코딩은 utf-8로 봤을때구요. 한글 부분은 %EC%8B%9C%ED%97%98 이렇게 변환시켜서 사용했습니다.
그다음엔 file() 을 이용해서 표시했는데 역시 똑같습니다.
이걸로 이틀째 씨름하다가 오늘은 한번 저 url을 w3m 브라우저로 다운로드 해봤습니다. 결과가 똑같더라구요.
애초에 php랑 w3m 에서 다운로드 하는 방식이 파이어폭스와는 다른것 같습니다.
대체 어떤 과정으로 저 주소로 파일 다운로드가 이루어지는지를 모르니까 더이상 검색으로 알아낼 수준이 아닌것 같아 이렇게 질문드립니다.
왜 같은 URL을 사용하는데 결과가 차이가 나는지 알 수 있을까요?
&ie=utf-8&oe=utf-8 구글의 서비스는 위
&ie=utf-8&oe=utf-8
구글의 서비스는 위 인자를 붙이면 인자의 인코딩으로 처리됩니다.
https://xenosi.de/
와! 되네요. 감사합니다!
와! 되네요. 감사합니다!
댓글 달기