시스템이 이유없이 죽을때는...?
글쓴이: dnagod / 작성시간: 목, 2009/07/30 - 11:03오전
어떤 로그를 뜯어봐야 하나요..?
지금 /var/messages, /var/maillog, /var/cron 를 뜯어 봤는데...
언제까지만 살아 있었다라는 것 밖에는 추측하기가 힘드네요..
왜 그런거 있지 않습니까, 술먹고 잘 놀다가 필름이 확 나가버리는 듯한 느낌이요...
이놈도 그러네요... 멀쩡하게 살아있다가, 아침에 와보면 죽어있고...;;
전원이 문제일까요?? 아니면 또 다른 로그를 뜯어봐야 할까요??
조언 부탁드릴께요. 워낙 뉴비라서...막막하네용...ㅡㅜ
사양은 HP서버에 Redhat을 설치해놓은 상태입니다.
서버 껍데기에 rx2600이라고 써있습니다.
Forums:
메모리를 전부
메모리를 전부 교체해보세요. 가능성 높습니다.
HP 서버 이시라면 IML 로그를..
HW 적인 문제라면 IML로그를 참조 하시면 됩니다...
HP서버라면.....
*********************************************************
또 밀어야 하나 아니 이제 인생 자체를 밀어야 한다..... (/ㅡ_-)/~
또 밀어야 하나 아니 이제 인생 자체를 밀어야 한다..... IT 관두는 젖비린내 SE (/ㅡ_-)/~
IML 로그는 어디 있는건가요..?
find / -name IML 해도 안나오는데용..? ;;
난세에 태어나...
제 경험으로는.......
전원, 쿨러 입니다;
----------------------
Go to the U-City
----------------------------------------------------------------------------------------
Don't Feed the Trolls!
----------------------------------------------------------------------------------------
...
문제의 범위를 축소하기 위해
1) 네트워크를 절체하고 일정시간 시스템을 관찰합니다.
2) 특정 장치(옵션으로 설치한 것등이 있다면) 디바이스 제거 또는 디바이스 드라이버를 내려 놓고 관찰합니다.
3) 서비스(서버프로세스)를 최소화하고 관찰합니다.
...
이런 식으로 진행해보세요.
* 가능하다면, 시스템을 재설치한 후 하나씩 더해(서비스 또는 디바이스를) 가면서 관찰하는 것도 방법입니다.
------------------ P.S. --------------
지식은 오픈해서 검증받아야 산지식이된다고 동네 아저씨가 그러더라.
------------------ P.S. --------------
지식은 오픈해서 검증받아야 산지식이된다고 동네 아저씨가 그러더라.
인내심이 필요하겠지만...
이런 방법이 가장 근본적인 해결책이 될 듯.
그런데 갑자기 맛이 가는 놈들은 멀쩡할 땐 정말 또 멀쩡하다니까요.
약간 불규칙하긴 한데...
불규칙하게 죽기는 하는데요..
좀 규칙적을 따져 보면 일단 일요일 오후에는 죽는 것 같네요... ;;
그래서 월욜날 사뿐하게 한주 시작하면서 서버 올린다는...?
ㅡㅡ;;
난세에 태어나...
일요일 오후...가 단서 같군요..
아랫분 말씀대로 정기적으로 일요일 오후마다 야동 파일 분석 작업이 수동..으로 실행되면서 관리자 생체 발열량 상승에 의한 cpu 및 hdd의 온도상승 피드백 효과로.....^^농담...
그러나 어떤 이유에서건...결국 온도 상승이 주범 같단 생각이 드네요. 온도를 체크해보시죠?
하드디스크랑 cpu온도를 모니터링 해보시면...일욜일 오후에 놈이 남겨놓은 흔적을 찾을지도...
저에게도 비슷한 경험이 있었습니다.
앗,
http://kldp.org/node/107479
여기 보시면, temperature어쩌구 하는 흔적이 있는데...이것에 대한 전문가 분들의 분석이 궁금하군요. 그 분석은 아래에...이어집니다.
내 저도...
솔직히 온도를 의심하고 있는데요..
이거 측정하는 방법도 모르겠고... ;;
명령어가 뭔지 아시는 분...?
전에 다운되기 전에도 HDD 온도가 41도를 찍었더라구요..
이게 원인이 될 수가 있나?? 하는 생각이 드네요..
근데 문제는
1. HDD 온도를 알아내는 명령어를 모른다는 점과.
2. 일요일 오후에 항상 온도가 높아서 그렇게 죽는 것인가.
하는 점이지요...;;
난세에 태어나...
아마 서버라서 제가
아마 서버라서 제가 돌리던 환경과는 비교도 할 수 없는 자원을 가지고있을테고 미리 확인해 보셨을테니 전혀 상관은 없을것 같긴한데...
하드가 풀이면 시스템이 소리없이 죽어버리는 경우가 있습니다. 더이상 로그를 못만드니 로그 남기지도 못하고..
리부팅하면 임시파일이나 그런 파일들이 정리되면서 하드 공간이 티끌만큼 확보되므로 잘 돌아가고... 한 일주일 돌다고 일요일 저녁쯤이면 또 죽어주시고...
일요일 저녁에 다시 리부팅하면 일주일 돌아가고 하더군요...
왜그럴까 한참 고민하다가 하드용량확인해보니 0%....;; 파티션을 나눠서 디렉토리 별로 분할해 주고 데이터 하드로 쓰이는놈 용량만 신경쓰다보니 시스템파일있는 하드가 만땅이 되 버린걸 눈치 못챈거였습니다 어흑..
엄청 쪽팔려하면서 서버사용하는 사람들이 알아채기전에 슥샥슥샥했습니다...
http://free4u.wo.tc/weblog/16
http://free4u.wo.tc/weblog/1631
요거 함 써보세요.
그리고 일요일 오후가 혹시 사무실이나 연구실의 냉방장치가 가동안되는 시간일 수도 있다는
환경에 대한 추측에서 였습니다.
토요일 퇴근 시, cron으로(http://coffeenix.net/board_view.php?bd_code=97) hdd온도를 매분 단위로 세밀하게......저장하게 해놓고 월욜날 로그기록 분석해보면,
혹시 온도때문이라면 몬가 나올지도..
[음...댓글을 잘못 달았군요...^^;; 윗 질문자님 글에 대한 답글입니다...빨간삽..님ㅎㅎ이 아니구요]
p.s. 하드스토리지 문제였다면.....대반전~!
야동을 지우세요...
$HOME/.system/util/인강/지우면안되는거/[노-유]모
그...그냥 웃자고 한소립니다...
;;;;
;;;;
난세에 태어나...
hp장비를 사용하고
hp장비를 사용하고 계시고 hp에서 제공하는 psp(proliant support pack)을 설치 하셨다면
hplog -v 를 사용하시면 윗분께서 말씀하신 IML 로그를 확인하실 수 있습니다.
참고로 hplog -t는 현재 서버의 온도를 확인하실 수 있습니다.
그리고 전면의 LED도 함께 체크 해보세요~
장비만..HP라..
장비만 HP라 그런지..
그 팩키지가 안깔려 있네용~~
암튼 조언 감사드려요~ ^^
난세에 태어나...
hp itanium을
hp itanium을 사용하시는 것 같습니다~~
MP console에서 System Log를 확인해 보시기 바랍니다.
MP console...이 무엇인지....? ;;
MP console...이 무엇인지....? ;;
일단 구글링 해봐야겠네용~
답변 감사드려요~ ㅎㅎ
난세에 태어나...
console에만 뿌리는
console에만 뿌리는 로그를 파일로도 남기도록 syslog 설정을 변경하고 모니터링 해보세요.
댓글 달기