Google Bigtable 관련 논문

권순선의 이미지

Bigtable은 구글 내부적으로 사용하는 분산 데이터베이스 시스템입니다. 대규모의 데이터를 엄청나게 많은 서버에 분산해서 저장하고 동작하는데 저는 이 bigtable 관련된 이야기를 얼마전에 구글이 프로젝트 호스팅 서비스를 제공할 때 svn 데이터를 어떻게 저장하는가에 관한 내용을 읽으면서 처음 들었습니다.

저는 처음에 이게 그냥 단순히 구글이 이름붙인 약간 복잡한 자료형인줄 알았는데 그게 아니더군요. bigtable은 구글 내부적으로 매우 다양한 서비스에서 데이터를 저장하는데 사용되고 있다고 합니다.

현재 bigtable은 구글의 핵심 역량이라고 할 수 있을 듯 한데 이를 소개하는 논문을 구글이 냈네요. 시간 되시는 분들은 한번 읽어 보시고 좀더 자세한 이야기를 해 주시면 감사드리겠습니다.

http://labs.google.com/papers/bigtable-osdi06.pdf

에서 읽으실 수 있습니다. 올해 말에 발표될 논문이라 매우 따끈따끈한 놈이라고 할 수 있습니다. :-)

udanax.org의 이미지

저도 흥미롭게 읽어보았습니다만
분산 시스템이나, insert/read operation 에 대한 처리보다는
multi dimension spatial data 를 색인했다는거...
그거 때문에 대규모데이터에서 다양한 데이터마이닝 계산이 손쉬워졌다는게 핵심인것같네요.