서버 다운 [CPU context corrupt]
안녕하세요?
몇 달간 아무 문제없이 잘 돌아가는 저희 서버가 토요일에 갑자기
다운이 되었습니다. 처음 일어난 일이라 생소하고 이상하여
로그를 까는 중에 발견한 내용입니다.
호스트 네임이 "server" 입니다.
------------------------------------
Feb 3 19:42:21 server kernel: CPU 1: Machine Check Exception: 0000000000000004
Feb 3 19:42:21 server kernel: Bank 4: b200000000020151
Feb 3 19:42:21 server kernel: Kernel panic: CPU context corrupt
Feb 3 20:08:01 server syslogd 1.4.1: restart.
------------------------------------
CPU쪽의 문제인 것 같은데. 이러한 일이 반복될까 두렵습니다.
물론, 재부팅 이후에는 다시 정상적으로 돌아가고, interrupts 파일을 봐도
2개의 CPU가 고르게 일을 하고 있더군요. (TOP에서도 고르게 일함)
위 마지막줄의 restart는 IDC관리자께서 재기동한 것입니다. (약 26분정도 다운)
그 전에는 dmesg를 통해서 자신(하드웨어)의 상태를 모두 알려줬기에 대비할 수 있었는데,
이번에는 무슨 영문인지 모르겠습니다.
아시는 분 답변 부탁드립니다.
감사합니다.
http://www.linuxquestions.org
http://www.linuxquestions.org/questions/showthread.php?t=333042
제일 마지막에 보면 cpu fan 이 고장났기 때문이라고 하네요.
결국 열이 너무 많이 났다는 얘길까요?
http://en.wikipedia.org/wiki/Machine_Check_Exception
도 참고하세요.(제가 아는게 없어 링크만 왕창...)
pung96님 감사
감사합니다. 일단 바로 확인할 필요가 있을 것 같습니다.
IDC 환경 및 서버의 쿨링쪽을 확인하겠습니다.
많은 도움이 되었습니다. ^^;
저도 비슷한 증상이
저도 비슷한 증상이 연이어서 나타나서 긴장했었는데.. (여름)
청소해주고 나니 다시 안나타나고 있습니다 -_-;
댓글 달기