하드디스크 11개중에 동시에 두개가 고장날 확률은..???
글쓴이: GoodWolf / 작성시간: 토, 2006/11/04 - 6:46오후
외장 스토리지 (RAID 5)를 쓰고 있는데요.
+_+
..
총 12개의 하드디스크가 삽입되고, Hot Spare 1개를 제외하고,
..
11개의 하드죵..
..
RAID 5의 경우 동시에 두개의 하드가 고장나면 말짱꽝(?) 이잔아요. ^^;
..
혹시 이런 시스템에서 동시에 두개의 하드가 고장날 확률이 얼마나 될까요?
..
겪어보신 선배님들의 조언 부탁드립니다. ^^;
..
아참. SATA 입니다. ^^;
Forums:
답을 그냥
답을 그냥 알려드리는 것보다 어떤 문제인지가 중요한것 같은데
discrete mathematics를 보면 birthday problem이라고 있습니다.(물론 수학적 해결법입니다)
2년 반동안 관리하던
SCSI입니다.
2년 반동안 관리하던 시스템에서 하드 10개중 하나가 고장난 적이 딱 한 번 있었습니다.
그 때 당시 시스템은 5년 가까이 운영중이었습니다.
다른 환경에서 새거 사서 일년동안 4개중 하나가 나갔습니다.
그 때 그 때 달라요. 확률상 하나가 고장나서 조치되는 동안 다른 하나가 죽을 확율인데
당장 레이드 6으로 교체할거 아니면 백업 잘하시고 고장나면 그 때 가서 생각하세요.
1TB 의 스토리지 안에
1TB 의 스토리지 안에 시게이트 73기가 하드 하나 나갔습니다.
나간지 언 넉달이 다되가는데...하두 오래된 놈이라 구하지 못하고 아직도 그냥 돌고 있습니다...빨리 구해 넣어야 하는데...
또하나는 1테라 좀넘는 sata 도 역시 나갔습니다.
역시 핫스왑이 대치했는데....사타는 고장난것을 뺐다가 다시 끼우니 기냥 잘 돌아가더
군요...이상하지요?
둘다 핫 스왑있습니다.
이건머...
이건머... 오토리빌드도 아니구... 오토리페어인가요? ^^;
-----
오늘 나의 취미는 끝없는, 끝없는 인내다. 1973 法頂
-----
오늘 나의 취미는 끝없는, 끝없는 인내다. 1973 法頂
음...
어쩌다 보니 약 180여개의 고객사에 스토리지+ 서버가 납품되어 있고,
그걸 관리하고 있는데...
2년 좀 넘게 일하는동안 한군데서 딱 한번 두개가 동시에 나가는 증상이 있었습니다.
salpoosi님 말씀처럼 그때그때 다르겠죠. 경우의수를 따지기 힘듭니다.
아예 다 나간건 아니었지만,
어떻게어떻게 간신히 복구해본게 약 20%정도였습니다..;;
이거 확률로 구할수 있다면....
저도 좀 알려 주시지요^^
확률
문제를 좀 단순화할 필요가 있겠네요.
일단 '동시에'라는 개념을 명확하게 할 필요가 있겠네요. 매일 하드디스크를 검사를 하고 같은 날 하드디스크가 고장났음을 발견했다면 동시에 고장난 걸로 하죠.
그리고 하드디스크의 평균 수명을 L, 그 표준편차를 S라 하고 고장날 확률이 시간에 따라서 가우스 분포를 따른다고 하죠.
11개의 하드디스크는 같은 종류의 하드디스크이고 동시에 구입하여 사용한 것이라고 하면 단 두개의 하드디스크가 같은 날 고장날 확률은?
------------------
생각해 보니까 문제가 좀 이상하네요. 하드디스크가 고장나면 교체를 해야 하잖아요. 그러면 문제가 어려워 지는데... 11개의 하드디스크가 돌다가 어떤 날 처음 고장이 발생했는데 그게 두개일 확률은?
------------------
또 고칩니다. 두개 이상 고장나면 안 되기 때문에 두개 이상으로... 세 개 이상이 동시에 고장날 확률은 두개가 고장날 확률에 비해 매우 작을 것이기 때문에 무시 가능하겠지만요.
요게..
요게.. 스토리지용으로 한번에 구매하면 같은 모델에 같은 Lot을 집게 되고...
예전 IBM Deathstar :) 경우처럼 생산과정의 결함을 공유할 가능성이 있습니다.
파워 부분에 문제가 있을 경우 역시 같은 파워라인을 공유하는 놈들이 불안하고요...
흔히들 raid는 같은 모델로 해야한다고 합니다만 전 이런게 좀 꺼림칙해서 가능하면 스펙이 맞는 선에서 최대한 섞어 씁니다.
호스팅 업계에서는
호스팅 업계에서는 일반적으로 서버에 SATA 를 쓴다고 하면
하드 하나의 수명을 보통 2년. 길게는 3년 짧게는 1년 6개월정도로 생각합니다.
확률로는 모르겠지만....
실제 사용하는 HDD 와 백업용 HDD 의 텀을 6개월정도로 주는게 가장 안전한 것 같습니다.
동시에 고장날
동시에 고장날 확율이 중요한게 아니라 서버관리자가 얼마나 부지런한가에 달려있지요.
오랜 시간 관리 안하면 11개중에서 2개가 고장나있을 확율은 엄청 높은거고...
날마다 관리하면 11개중에서 2개가 고장나있을 확율은 매우 낮은거고요...
댓글 달기