혹시 빅데이터와 스몰데이터의 숫자적인 차이를 아시는분 계신가요?

dlsxjsptvmfhxhzhf의 이미지

이게 좀 상대적인 질문일수도 있지만..

단순히 데이터의 양이 많고 적다 라는 것말고, 어느정도의 숫자를 기준으로 해야하나요?

세벌의 이미지

구글에서 찾아보시면 알 겁니다.
빅데이터의 정의가 아주 많다는 걸...
빅데이터의 정의에 따라 달라집니다.

dlsxjsptvmfhxhzhf의 이미지

이미 검색을 많이 해보았습니다.. 제가 이 질문을 여쭤본 이유는 참 당혹스럽긴 하지만..
면접장에서 면접관님이 여쭤보시더라구요. 빅데이터와 스몰데이터의 차이가 뭐냐고..
단순히 의미적으로 아니라, 숫자적으로 차이가 뭐냐고 여쭤보시는데 면접 끝나고 아무리 검색해봐도 잘 못찾겠어서.. 도데체 뭐라고 답을 했어야 최선의 답이었나 고민중이랍니다..

세벌의 이미지

면접관님의 의도를 모르겠네요.
빅데이터 정의가 한둘이 아님을 면접관도 알고 계셨을텐데...

jick의 이미지

빅데이터라는 말이 요즘엔 거의 마케팅 용어처럼 되어 버려서 아무나 다 빅데이터 한다고 하는 시대라서 말이죠... 음 하긴 요즘엔 그것도 한물 간 것 같기도 하고...

"이 정도면 빅데이터인가요?"라는 질문은 대답이 좀 곤란하고요, 뭐 누가 "여기부터 빅데이터"라고 정해놓은 것도 아니니까.

그냥 "(일반적인 데이터 사이즈에서 쓸 수 있는) A라는 툴이 있고, (빅데이터 솔루션이라고 광고하는) B라는 툴이 있는데, 이 사이즈에서 어느 쪽이 더 빠르고 편리한가요?" 이렇게 물어보는 게 맞습니다.

그래서 A가 답이면 빅데이터가 아니고요, B가 답이면 빅데이터입니다. 근데 사실 최악의 경우는 A로 충분히 할 수 있는데 "우리 데이터는 빅데이터라서 B를 써야 합니다!" 하면서 B를 써서 그로 인한 오만가지 오버헤드를 감수하는 경우죠. Mysql에 때려넣고 select하면 될 데이터를 머신 수십대로 나눠서 hadoop 같은 걸 돌린다든지...

* 사족: 정 구체적인 숫자가 필요하시다면, 제 생각에 2019년 기준으로 1PB (페타바이트) 정도 되면 빅데이터라고 해도 누가 딴지걸지는 않을 겁니다. (물론 진짜 빅데이터 돌리는 구글 같은 데서 보면 신입사원 튜토리얼로 돌려볼 수준의 크기지만...)

dlsxjsptvmfhxhzhf의 이미지

사실 제가 이 질문을 여쭤본 이유는 참 당혹스럽긴 하지만..
면접장에서 면접관님이 여쭤보시더라구요. 빅데이터와 스몰데이터의 차이가 뭐냐고..
단순히 의미적으로 아니라, 숫자적으로 차이가 뭐냐고 여쭤보시는데 면접 끝나고 아무리 검색해봐도 잘 못찾겠어서.. 도데체 뭐라고 답을 했어야 최선의 답이었나 고민중이랍니다..