[완료] php(?) 한글 인코딩 문제

hardboiled65의 이미지

취미삼아 웹서버를 돌리고 있습니다. 이것저것 가능한지 테스트 해보는 용도로 쓰고있는데요.

구글 번역 기능을 옮겨와 활용할 수 있을까 싶어서 소스도 보고 하다가... 파이어폭스 웹 콘솔을 보니 구글 번역에서 번역 버튼을 누르는 순간
http://translate.google.co.kr/translate_a/t?client=t&text=번역할것&hl=ko&sl=ko&tl=en&multires=1&prev=btn&ssel=4&tsel=3&sc=1
이런게 왔다갔다 하는게 보였습니다.

그래서 그대로 주소창에 복사해보니 파일 다운로드 창이 뜨길래 다운받으니 t 라는 이름의 텍스트 파일입니다.

예를들어 '시험' 이라는 단어를 넣고 다운로드해서 내용을 보면
[[["Test","시험","","siheom"]],[["명사",["test","exam","examination","try","assay","tentative","probe","proof","probation"]]],"ko",,[["Test",[5],1,0,890,0,1,0]],[["시험",4,,,""],["시험",5,[["Test",890,1,0],["Exam",56,1,0],["Examination",53,1,0],["Testing",0,1,0],["Tests",0,1,0]],[[0,2]],"시험"]],,,[["ko"]],29]
앞부분처럼 [번역된 내용,번역할 내용,발음] 이런식으로 원하던 정보를 얻을 수 있다는걸 알았습니다.

그래서 이제 이걸 웹서버에서 사용할 수 있어야 하는데 아무리 해도 정상적인 데이터를 얻을 수가 없습니다.

처음 사용했던게 file_get_contents("URL"); 였는데 결과를 보니
[[["Sswotppurk","�험","","sswochppulg"]],,"ko",,[["Sswotppurk",[5],1,0,1000,0,1,0]],[["�험",5,[["Sswotppurk",1000,1,0]],[[0,2]],"�험"]],,,[["ko"]],3]
이렇게 이상하게 나옵니다. 물론 문자 인코딩은 utf-8로 봤을때구요. 한글 부분은 %EC%8B%9C%ED%97%98 이렇게 변환시켜서 사용했습니다.

그다음엔 file() 을 이용해서 표시했는데 역시 똑같습니다.

이걸로 이틀째 씨름하다가 오늘은 한번 저 url을 w3m 브라우저로 다운로드 해봤습니다. 결과가 똑같더라구요.

애초에 php랑 w3m 에서 다운로드 하는 방식이 파이어폭스와는 다른것 같습니다.

대체 어떤 과정으로 저 주소로 파일 다운로드가 이루어지는지를 모르니까 더이상 검색으로 알아낼 수준이 아닌것 같아 이렇게 질문드립니다.

왜 같은 URL을 사용하는데 결과가 차이가 나는지 알 수 있을까요?

송효진의 이미지

&ie=utf-8&oe=utf-8
구글의 서비스는 위 인자를 붙이면 인자의 인코딩으로 처리됩니다.

hardboiled65의 이미지

와! 되네요. 감사합니다!

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.