예전에 미국 유력 신문이 미대통령 연설에 사용된 어휘를 분석한 기사가 있었고 여기 게시판에서도 인용된 적 있습니다.
검색하지는 못 하겠네요.
혹시 아시는 분 알려주시면 고맙겠습니다.
한국말로도 사용된 어휘 갯수 등을 분석하는 연구를 하는 사람도 있을텐데 제품이나 라이브러리가 있을까요?
형태소 분석기로 토큰을 추출해서 갯수를 세보면 되겠지요.
이게 있으면 재밌을 겁니다.
사람별로 어휘의 유창성 혹은 수월성을 측정할 수 있으니까요.
주요 커뮤니티나 카페별, 직업별 차이도 알 수 있고, 책별, 신문사별, 지정학적, 인구통계학적 차이도 알 수 있을 겁니다.
이걸 대행해주는 사이트를 만들어도 재밌고 어느정도 상업성도 있을 것 갈습니다.
어휘 뿐 아니라 전화와 문자 통계, 소셜서비스, 이동 경로 등으로 행동의 유창성을 측정할 수도 있겠죠.
이분야 꾼들은 이미 하고 있을테지만 저변이 확대되면 좋겠습니다.