서버가 어떤 로그도 없이 죽습니다...
글쓴이: freestyle / 작성시간: 월, 2009/04/20 - 1:51오후
과에서 쓰는 리눅스 서버가 있는데, 요즘 들어 자꾸 죽네요.
증상이 크게 두 가지입니다.
어느 순간 보면 전원이 나가 있는 경우와
전원은 켜져 있는데 서비스가 hang되어 먹통되어 버리는 것입니다.
문제는 장애 발생의 근거로 삼을만한 로그가 안 남아있다는 데 있습니다.
계속 비정상적으로 꺼지면 하드디스크까지 날아가버릴지도...
구입한지 2년도 채 되지 않은 x86 제온서버입니다.
OS는 CENTOS 5.2구요.
처음 도입해서 얼마가지 않아 메모리쪽 크래시로 죽은 적이 몇 번 있었지만,
그 뒤로는 문제 없었고,
CPU 온도를 CMOS에서 확인해도 그리 높지 않군요.
전원이 가장 의심가는데, 초기에 교내 전원 불안정으로 자주 죽어서
역시 30분정도 버티는 오래된 UPS를 물려놨습니다.
UPS가 삐소리를 내지 않는 것으로 봐서 공급 전원 문제는 아닌듯 하고,
메인보드나 본체의 파워서플라이의 문제가 가장 의심됩니다.
어찌해야 할까요?
Forums:
서버에서 사용중인
서버에서 사용중인 서비스, 사용자 수 등등에 대한 정보가 있으면 여기 보시는 분들도 짐작을 해볼만하지 않을까요?
라스베가스를 꿈꾸며...
혹시 gigabyte 보드라면......
요즘 말이 좀 많더군요. 전압강하와 더불어 무한 재부팅 또는 먹통..... 그것도 한번 알아보심이 좋을 듯 하네요.
MB는 ASUS사의 제품을 사용합니다.
-------------------------------
Go to the U-City
----------------------------------------------------------------------------------------
Don't Feed the Trolls!
----------------------------------------------------------------------------------------
top 좀 볼 수 있을까욤
top 좀 볼 수 있을까욤 +_+;
memtest86 돌려보시고,
memtest86 돌려보시고, 문제가 없는 경우...
시간 단위로 dmesg, 메모리 사용량을 체크해보세요. (한 시간에 한 번씩 메일로 보내는 식)
--
오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...
http://mytears.org ~(~_~)~
나 한줄기 바람처럼..
오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...
http://mytears.org ~(~_~)~
나 한줄기 바람처럼..
질문하신 분께서 가깝게 추측하고 게신 것 같습니다
이런 경우 거의 하드웨어의 문제이고 그 중 가장 흔한것이 파워 또는 발열 또는 먼지등으로인한
전기적 오류일 것입니다.
이런 부분은 경험적으로 확인하는 수밖에 없는데 온도체크를 믿지 말고 직접 의심해보는것,모든 부품을 빼서 에어 등으로 한 번 청소한 후 다시 하나씩 조립하기 등이 일반적으로 생각할 수 있는 접근법일 것입니다.
이런 과정을 가다가도 직감적으로 이게 아니다 싶으면 보드 자체의 부품결함을 의심하는 순서가 될 것입니다.기계적인 것은 그럴 수 없지만 반도체 등 전자적인 부품은 열이 있는 상태와 없는 상태에 따라
정상 <-> 오류 를 반복하기도 하기 때문에 매우 까다로운 부분입니다.
흔히 컴퓨터 본체에 신경쓰는 만큼 케이스에는 신경쓰지 않는 관리자가 많으며 심지어는 발열해결한다고
케이스를 열어놓고 사용하는 관리자도 봤습니다.
행여나 해서 말씀드리는겁니다만 2년도 안된,제온서버라면 PC 서버중에서는 귀하신 몸이기 때문에 그에 맞는 케이스사용을 하시고 계신가 점검해 보시기 바랍니다.
컴퓨터 없이도 컴퓨터를 배울 수 있을까? 8년째!
=========================
매일막걸리 한 병 = 상태메롱
댓글 달기