구글 번역의 문제점

세벌의 이미지

cat 을 고양이로 번역한다.
cat 은 고양이 맞긴 한데...
리눅스 명령어 이기도 하죠.
그래서 아직은 사람이 필요합니다. :)

백연구원의 이미지

일전에 발표된 내용 보면 딥러닝을 활용해서 문맥의 흐름을 보고 번역할텐데 단순히 단어 입력만으로 번역기의 성능을 판단하기는 힘들 것 같습니다.


소곤소곤

 의 이미지

재미있는 관점이긴 하지만, 실제로 고양이(cat)와 유닉스 유틸리티(cat)가 둘 다 등장하는 텍스트가 얼마나 있을까요.

물론 그런 경우가 아예 없다고는 말씀 못 드리겠습니다만. 예컨대:
https://unix.stackexchange.com/questions/382535/keyboard-set-to-cat-mode

페이지 번역을 돌리면 code 태그에 힘입어 "고양이"로 번역되어야 할 cat과 그렇지 않은 cat을 구분해 내는 것 같습니다. 텍스트만 긁어서 번역해보면 구분 못 하는 것 같네요.

cas(unix.stackexchange.com) wrote:
yes, well, this was cat's original purpose - to prevent Stephen Bourne's cat from messing with the first unix systems. the fact that it could also output the content of files was just a side-effect, a happy accidental discovery. and grep was actually named after Dennis Ritchie's cat. :-p

글쎄요. 언젠간 구분해 낼 수 있을지도 모르죠. 한 발 더 나가서 이 텍스트의 작성자들이 언어유희를 즐기고 있다는 걸 이해할 수 있는 컴퓨터가 나올지도?