세상에서 가장 긴 영어 단어는...

rgbi3307의 이미지

구글에서 영어단어 길이를 검색하다가 재미있는 내용이 있어 공유해봅니다.

세상에서 가장 긴 영어 단어는 smiles 라는 우스개 소리가 있군요.
s와 s사이에 mile이 있어서 그렇답니다(^^)

근데 제가 궁금해하고 있는 것은 영어단어의 평균 길이 입니다.
평균은 보통... (최소 + 최대) / 2 하여 얻어 지는데, 영어단어의 평균길이는 얼마일까요?

아래는 영어단어 최대 길이에 대한 재미있는 내용입니다.

세상에서 가장 긴 영어 단어는 무엇일까?

출처: http://sonnets.tistory.com/8

단어의 정의

우리는 일반적으로 '최고'를 좋아 한다. 따라서 단어도 최고로 긴단어는 무엇인가에 관심을 갖게된다. 글자수로 단어의 길이를 이야기할 때는
단어(word)를 어떻게 정의하느냐에 따라 1등의 위치를 차지하는 단어가 바뀐다.

그 단어가 어떤 종류이건, 주요 사전에 올라있건, 지속적으로 단어의 길이가 길어질 수 있는 기술용어이건, 보편적으로 사용되어 여러 기록에 많이
남아 있건, 또는 그렇지 않건 간에 모든 제약 조건을 없애버릴 경우에 과연 어떤 단어가 1위이며 그 길이는 대체 얼마나 되는가?

그 답은 Babyoubiquitouse...중략...oiletub이며 그 길이는 경이롭게도 2,087,214 글자다. 그렇다 2백만 글자가 넘는
한개의 단어다. 나이젤 톰이라는 사람이 쓴 소설 "The Blah Story"는 현재까지 출판된 소설중에 가장 긴 소설로 총 10권,
7312쪽, 3,277,227개의 단어, 그리고 18,308,104개(스페이스 포함)의 글자로 이루어져 있다. 이 중에서 제10권에 이 엄청난
단어가 들어가 있다.

그렇다면 왜 이 말도 안되는 "Babyoubiquitouse...중략...oiletub"가 공인 1위에 등극하지 못한 것일까?
일반적으로 언어학자들이 단어(word)로 인정하는 것에는 몇가지 자격(그러나 법은 아닌)이 있다.

1. 보편성
언어로서의 단어에는 보편성이 있어야 한다. 즉 그것을 사용한 문헌적 기록이 어느 정도 보편화(일반 대중은 아니더라도) 되어 있어야 한다는
것이다. 따라서 단 한건의 기록 즉 한 작품의 소설을 위해서 만들어져 단 한건의 문헌적 기록으로만 남아 있는
"Babyoubiquitouse...중략...oiletub"는 단어로 볼 수 없다는 것이다.

2. 기술용어 vs 단어
과학 기술 분야에서는 끊임 없이 새로운 용어들이 만들어 진다. 각 분야별로 정의되어 있는 다양한 명명법(nomenclature)에 의해
임의적으로 긴 단어를 만들어 낼 수 있다. 따라서 언어학적으로 볼 때 기술용어를 단어로 인정하기 어렵다는 것이다.
이러한 제약이 없다면 가장 긴 단어는 척추동물의 근육 단백질 중의 하나인 커넥틴(connectin 또는 titin이라고 불리기도 한다)의
공식명칭(IUPAC Nomenclature; 국제 순수 및 응용화학 연맹 명명법)은 놀랍게도 189,819개의 글자로 이루어져 있다.
마크로소프트워드의 디폴트 양식으로 times-roman 폰트 12포인트를 사용하였을 경우 46페이지가 나오는 분량이다. 윈도우즈 노트패드에서는
스크롤바(위 사진)를 보면 알 수 있듯이 화면을 꽉 채우고도 모자란다. 알려진 단백질 중 가장 큰 커넥틴의 공식명칭인
"Methionylthreonylthreonyl...중략...isoleucine"는 간혹 가장 긴 영어 단어로 인용되기는 하지만 Oxford
사전의 언어팀은 이를 단어가 아니라 말로된 공식(verbal formula)라고 분류하였다.
풀네임 참조: <">http://www.othyr.com/titin.html>

3. 신조어(Coinage)
신조어의 경우 그 활용도가 보편성을 확보하게되면 단어로 인정받기도 한다. 단어로 인정받는지 아닌지를 알 수 있는 하나의 척도는 주요 사전에
올라가 있는지의 여부로 판단하게 된다.
따라서 Babyoubiquitouse...oiletub의 경우에는 물론 단어하나를 올리는데 천페이지 이상을 할애해야 하므로 사전의 발행에 막대한
비용을 초래한다는 경제적 이슈 뿐만아니라 단 한번 밖에는 사용되지 않았다는 이유로 단어로서의 자격을 얻지 못했다. 100글자가 넘는 예가 많이
존재하나 단어로 인정받지는 못한다.

4. 지명
지명(또는 인명)과 같은 고유의 이름은 일반적으로 단어로 보지는 않기 때문에 사전에 올리지 않는다. 사전에 오르지 않는다면 단어로서의 입지가
무척 불안해진다.
그러나 이러한 제약 조건이 없다면 뉴질랜드의 한 지명인
Taumatawhakatangihangakoauauotamateapokaiwhenuakitanatahu가 1위에 등극 할 수 있겠다. 무려
85개의 글자로 이루어진 '이곳'은 세계에서 가장 긴 이름의 지명을 가지고 있다.

뉴질랜드의 "그곳"

5. 사전
단어로 볼 것이냐 아니냐의 결정은 대체적으로 사전을 편찬하는 곳의 언어팀이 고민을 한다. 영어 사전의 바이블격인 Oxford사전에 등록이 되면
일단은 단어로서의 자격이 상당부분(그러나 모든 학자들이 그들의 의견에 100% 동의하는 것은 아니다) 갖춰진 것으로 볼 수 있다.
주요 사전에 올라 있는 단어들 중에 가장 긴 것들을 나열해 보면 각각의 단점에도 불구하고, 45글자인
Pneumonoultramicroscopicsilicovolcanoconiosis(의미: 진폐증, 단점:기술용어, 조어), 30글자인
Pseudopseudohypoparathyroidism(의미: 유전성 유사 갑상선 기능저하증, 단점: 기술용어), 29글자인
Floccinaucinihilipilification(의미: 부에 대한 경시, 단점: 조어) 등이 1위 자리를 놓고 경쟁 중이다.
조어가 아니고 기술용어도 아니면서 고유명사가 아닌 사전에 올라 있는 단어로는 28글자로 된
Antidisestablishmentarianism(의미: 영국의 국교폐지론을 반대하는 주의)이 현재로서는 언어학자의 구미에 가장 잘 맞는 1위
후보일 수 있겠다. 이 단어는 영어에서 새로운 의미의 단어를 만들어내기 위해 허락하는 교착(agglutination) 즉 어두(prefix)나
어미(suffix)를 더함으로써 생겨난 단어이다.

결론적으로...
언어는 숨을 쉬고 살아 있으며 진화한다. 따라서 길이로 볼때 공인 1위인 단어는 흥미 있는 관심거리가 되긴 하겠으나 정답은 없으며 설사
있다하더라고 1위의 자리가 영원 무궁하지는 않을 것이다.
그럴 가능성은 매우 희박하지만, 예를 들어 영국에서 새로이 국교가 공포되었다고 가정하자. 또한 이를 폐지하자고 주장하는 단체가 생겼다고 하자.
이러한 단체에 반대하는 새로운 주장이 나왔다면, neoantidisestablishmentarianism(신 국교폐지론 반대 주의)라는 단어가
생길 수도 있는 것이다. 31글자다.

[필자주]
- 위의 포스트는 위키피디아의 Longest_Words라는 아티클과 거기에 인용된 참조문헌 등을 종합적으로 분석하여 나름대로 재 구성한 것이다.
- 위의 표에 나와 있는 각 단어들에 대한 상세 설명은 향후 별도의 포스트에서 시리즈로 다루기로 하겠다.

[참조문헌]
http://www.askoxford.com/asktheexperts/faq/aboutwords/longestword
http://en.wikipedia.org/wiki/Longest_words

출처 :
http://kin.naver.com/open100/detail.nhn?d1id=11&dirId=11080301&docId=851128&qb=7Luk64Sl7Yu0&enc=utf8&section=kin&rank=2&sort=0&spq=0
네이버 지식in 오픈백과 파워지식인 imbad99님 원제 : 세상에서 가장 긴 영어 단어

vamf12의 이미지

재미있게 잘읽었습니다

그러나 이런종류의 글은 퍼오시는 것보다 링크를 제공하는 것이 맞습니다

Deios의 이미지

(최소 + 최대)/2 는 중위수입니다.
단어의 평균길이라... 재미있겠군요... 각 언어별로 분석해본다면 언어의 특징이 나타날 것 같네요.
================================
http://deios.kr
$find / -perm 750 | grep girl

$

================================
http://deios.kr
$find / -perm 750 | grep girl

$

rgbi3307의 이미지

옥스포드 영어사전에 등록되어 있는 영어 단어수는 30만여개 된다는 군요.
그럼 영어단어의 평균길이는 30만여개의 단어길이를 모두 더한후 30만으로 나누면 될듯한데요.
컴퓨터의 힘을 빌려야 겠습니다.(이런 계산이 이미 이루어져 있겠죠? 잘 찾아 보진 못했습니다만...)
그런데, 영어 단어를 데이터베이스화 하기위해서는 어느정도의 기억장소가 필요할까요?
보통 컴퓨터에서 한문자의 크기를 1바이트로 봤을때,
영어단어수가 30만개이면 30만바이트(약300KB)
영어단어의 평균길이를 7이라하면 300KB x 7 == 2100KB(약2MB)
그런데, 테이터베이스 검색속도를 높이기 위한 인덱스 공간도 50% 감안하면,
2MB x 2 == 4MB
최소 4MB의 메모리가 필요할듯 한데요..

From:
*알지비 (메일: rgbi3307(at)nate.com)
*학창시절 마이크로마우스를 만들었고, 10년동안 IT관련 개발자로 일하고 있음.
*틈틈히 커널연구회(http://www.kernel.bz/) 내용물들을 만들고 있음.
*((공부해서 남을 주려면 남보다 더많이 연구해야함.))

From:
*알지비 (메일: rgbi3307(at)nate.com)
*커널연구회(http://www.kernel.bz/) 내용물들을 만들고 있음.
*((공부해서 남을 주려면 남보다 더많이 연구해야함.))