통계 업무를 많이 하는 누나에게 프로그래밍 언어를 추천해주려고 합니다.

이응준의 이미지

저희 누나는 수학과 경영학을 전공한 보험계리사입니다.
회사에서 통계 업무를 자주 하는 모양인데 이제까지는 엑셀로 작업을 해왔습니다.

그런데 최근 좀 복잡한 계산식을 사용했더니 엑셀이 5만개의 데이터도 처리하지 못하고 뻗어버린다고 하더군요.
엑셀에 뭔가 문제가 있는게 아닌가 했는데, 단순한 계산식은 100만개라도 문제없이 잘 처리하고 있다고 합니다.

이 문제를 해결해 줄 사람이 없어 직접 프로그래밍을 공부해서 통계를 처리하기로 결심하고,
얼마전에 컴퓨터 학원에 등록해서(넵, 비트입니다) C언어를 공부하기 시작했더군요.
아마 3개월정도 되는 과정인 모양입니다.

저는 C언어가 통계 문제를 처리하는데 적합하지 않다고 생각하고 있습니다.
다른 언어를 추천해주고 싶은데 뭐가 좋을런지 잘 모르겠군요.

의견 부탁드리겠습니다.

ps. 누나와 같이 일하는 프로그래머들은 자바를 많이 사용한다고 합니다.

ps2. 가급적 널리 쓰이는 범용 언어였으면 좋겠습니다.
누나가 프로그래밍을 전공한 사람이 아니다보니 막혔을 때 물어볼 데 없는 언어는 힘들 것 같습니다.
최소한 저(컴퓨터공학, 전자공학 전공)한테라도 물어볼 수 있어야...

johan의 이미지

C나 Java는 시간과 돈의 낭비죠. 마치 전투기를 잡는데 권총을 쏘는 격이라고 할까요?
당연히 R같이 전문적인 통계용 언어와 환경을 사용해야죠. 목표가 뚜렷할 때는 범용 프로그래밍 언어라는 것이 말이 안되는 겁니다. "전용" 프로그래밍 언어를 써야 하는 것이죠. "통계전용" 프로그래밍 언어. 통계를 능숙히 사용하는 사람은 훨씬 빠르고 정확하게 프로그래밍 할 수 있을 겁니다.
http://en.wikipedia.org/wiki/R_(programming_language)

이응준의 이미지

아 R은 국내에도 책이 나와있군요. 이것 좀 알아봐야겠습니다. 감사합니다~

bootmeta의 이미지

http://anyall.org/blog/2009/02/comparison-of-data-analysis-packages-r-matlab-scipy-excel-sas-spss-stata/

통계학을 배우셨다면, SAS나 SPSS나 좋죠.
통계 업무가 많은 회사라면 필수 제품에 가깝기는 한데 문제는 징하게 비싸다는 것
R은 공짜고, 성능도 좋고, visualization도 죽이기는 한데, 상대적으로 프로그래밍에 가깝다는 것

ps)
기타 통계 sw 비교(너무 많아서 솔직히 도움이 안될 확률이 아주 높음 - 항목 보다가 지침)
http://en.wikipedia.org/wiki/Comparison_of_statistical_packages

magingax의 이미지

sas 나 spss 같은 패키지를 쓰거나
언어로는 포트란. 추천합니다
1/3 도 제대로 안되는 c 는 좀.

LISP 사용자모임
http://cafe.naver.com/lisper

LISP 사용자모임
http://cafe.naver.com/lisper
방송기술 개발업체
http://playhouseinc.co.kr

aero의 이미지

Using Perl for Statistics: Data Processing and Statistical Computing
http://www.jstatsoft.org/v11/i01/paper

Fun with Numbers: R and Perl
http://community.moertel.com/~thor/talks/pgh-pm-perl-and-r.pdf

Perl + R: Open Source Programs Simplify Data Manipulation
http://www.devx.com/enterprise/Article/16270

winner의 이미지

2003은 7만개의 행수를 받아들이지 못하던데...

세이군의 이미지

65536행

이응준의 이미지

2007쓴다고 하는군요. 일단 백만라인까지는 2007로 가능하지만, 1500만라인을 처리해야 할 일이 있어서 곤란하다고 합니다.

neon20의 이미지

요즘은 잘 사용하지 않는것 같은데 minitab이란 프로그램도 있습니다.

kucuny의 이미지

음...그런가요? 저의 경우에는 통계 처리할때는 SPSS와 MiniTab 둘 다 사용합니다.
SPSS는 사회현상에 관한 통계 처리할 때 편하고
MiniTab은 소위 산업공학에서 말하는 품질관리에서 사용하기 편합니다.
그래서 전 둘 다 사용하고 있다는..;;

**********************
세상의 중심 kucuny.com
**********************

**********************
세상의 중심 kucuny.com
**********************

이응준의 이미지

여러분의 조언으로 누나가 거의 R로 넘어왔습니다. 책사서 공부하겠다네요.

그리고 왜 다른 개발자들이 숫자를 많이 다뤄야 하는 소프트웨어를 개발할때도 굳이 Java를 쓰는건지 궁금해하는군요.

그냥 업계표준언어라서 그런가요? 개발자를 구하기 쉬워서? 다른 시스템과 통합하기 유리하니까?

johan의 이미지

자신이 뭘하고 있는지, 스스로의 한계가 어디까지인지 모르기 때문이죠

라스코니의 이미지

설마 언어를 배워서 복잡한 통계 관련 라이브러리를 직접 짤려는 생각은 아니시겠지요?
C++ 를 배워서 Devgear C++ builder의 통계 관련 라이브리를 쓰는게 현실적입니다.

어떤 DBMS 라이브러라도 100만건은 껌이죠.

정말 무에서 유를 창조하실 생각이라면 말리고 싶습니다.

이응준의 이미지

그러려고 하면 제가 먼저 말리겠습니다.

cleansugar의 이미지

형한테 가르쳐준다고 질문해도 이렇게 답글이 많이 달렸을까요?

다들 예쁜 누나를 상상하며 답을 올리셨을 겁니다.

답글을 유도하는 좋은 팁 나중에 써먹어야 겠습니다.
___________________

http://blog.aaidee.com

재벌 2세가 재벌이 될 확률과
금메달리스트 2세가 금메달을 딸 확률이 비슷해지도록
자유오픈소스 대안화폐를 씁시다.

아이디의 아이디어 무한도전
http://blog.aaidee.com

귀태닷컴
http://www.gwitae.com

이응준의 이미지

남자친구가 없단 얘기도 슬쩍 끼워넣을 걸 그랬나봅니다.

cleansugar의 이미지

하하하 박장대소
___________________

http://blog.aaidee.com

재벌 2세가 재벌이 될 확률과
금메달리스트 2세가 금메달을 딸 확률이 비슷해지도록
자유오픈소스 대안화폐를 씁시다.

아이디의 아이디어 무한도전
http://blog.aaidee.com

귀태닷컴
http://www.gwitae.com

magingax의 이미지

인증샷 요청이요

LISP 사용자모임
http://cafe.naver.com/lisper

LISP 사용자모임
http://cafe.naver.com/lisper
방송기술 개발업체
http://playhouseinc.co.kr

lazycoder의 이미지

미니탭이 좀 싼 편입니다. 엑셀과 연동도 잘되고 쓰기 쉽고..
R도 괜찮지만 쓰기가 어려워서.. 권유를 못하겠더군요.

opt의 이미지

"누나는 수학과 경영학을 전공한 보험계리사"라는 조건 하에서는 SAS를 하시는게 좋습니다.
문제는 무척 비싸다는 것이죠.

R도 좋습니다.
다만, 어려울 때 물어볼 사람이 한국에 적다는게...
한편으론 문서화가 잘되어 있어서 영어를 어느 정도 하시면 사용에 불편은 없으실 겁니다.
외국에선 커뮤니티도 발달되어 있어서 물어보기 좋구요.

----
LUX ET VERITAS | Just for Fun!

----
LUX ET VERITAS | Just for Fun!

bxhs의 이미지

공개 소프트웨어인 R

취업할려면 SAS/SPSS 등

cleansugar의 이미지

재벌 2세가 재벌이 될 확률과
금메달리스트 2세가 금메달을 딸 확률이 비슷해지도록
자유오픈소스 대안화폐를 씁시다.

아이디의 아이디어 무한도전
http://blog.aaidee.com

귀태닷컴
http://www.gwitae.com

익명 사용자의 이미지

우선적으로 그냥 "전문적인 통계툴"을 추천합니다. (엑셀 같은 것 말고 말입니다.)