I/O에러 때문에 골치가아프네요 ㅜㅜ
현재 리눅스와 윈도우즈 서버를 합해서 15대 정도를 운영하고 있는 서버관리자입니다.
이전부터 리눅스를 공부하긴 했는데 실무에 들어온건 몇달안되고 실제 서버를 맡은지도 얼마안되서
아직 모르는게 너무많군요...
이번에 점검을 하는데 리눅스 서버 (레드햇7.3)에서
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 4
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 4
end_request: I/O error, dev 03:00 (hda),sector 0
end_request: I/O error, dev 03:00 (hda),sector 4
dmesg 를 쳐봣더니 이런 오류가 나오는데요
여기서 검색을 해보니까 베드섹터일 확률이 일단 가장 크다고 해서
badblocks로 모든 파티션
/dev/ida/c0d0p2 /
/dev/ida/c0d0p5 /home
/dev/ida/c0d0p6 /tmp
/dev/ida/c0d0p7 /var
none /dev/shm
을 검사해봣는데 배드섹터는 검색되지 않았고요...
항상 돌아가야하는 서버인데 정 fsck 해야한다면 시디부팅해서 해볼수는 잇겠지만..
아직 제맘대로 껏다켯다 할수 있는 서버도 아니고 그래서 고민이 많습니다
이제까지 괜찮다가 갑자기 저러네요... 새로운 하드를 연결한것도아닌데말이죠...
케이블문제일수도 있다는데... 어제부터 이거때문에 머리가 깨질거같네요...
서버는 컴팩 proliant ml570 이고
18.2G ultra2 scsi 하드 4개로 raid5 가구성되어 있습니다.
레이드 컨트롤러는 lsi logic / symbios logic 53c1510 이라네요...
고수분들의 조언부탁드립니다.
음.
대략 안봐도 뻔한 스토리의 전개 같습니다.
ml570 이구 redhat 7.3 이라고 하는것까지 하며;;
대략 아무리 못되어도 5년이상은 된 서버라고 생각되어집니다.
그렇게 오래된서버의 하드라면 언제 맛이가도 이상하지 않다고 생각되어지진 않으십니까?
1년만 빡시게 돌아도 맛이 가는 하드가 얼마나 많은데 ml570 모델도 세대가 있을테고 아마
아마 사양으로 말씀해주시는것이 빠를껍니다.
ml570 이면 사이즈도 7u 일테고 아마 p3 xeon 이 탑재되었겠죠.
raid 5 라고 말씀하셨는데 지금 어디서 18.2G scsi 똑같은 모델을 구할수 있을까요;
요즘 나오는 왠만한 1u 모델이면 충분히 커버를 하고도 남을것이라 생각되어집니다. ( 많이 남겠죠 )
왠만하면 교체하시라고 말씀드리고 싶습니다. 모든면에서 교체하시는쪽이 경제적입니다.
--------------- 절취선 ------------------------
하늘은 스스로 삽질하는 자를 삽으로 팬다.
http://glay.pe.kr
--------------- 절취선 ------------------------
하늘은 스스로 삽질하는 자를 삽으로 팬다.
http://glay.pe.kr
그렇군요...
p3 제온 700mhz, 램은 128m 100mhz짜리 8개에...
제가처음맡을때부터 들은이야긴데 처음구축한게 10년전이라고하더군여..
중간중간에 뻗은 녀석들은 새걸로 갈아주긴한거같은데
이녀석은 이대로 꽤나 오래쓴모양입니다.
그리고 1u 랑 7u 이게 뭔지 잘모르겠네요...
교체를 한다면 전체를 백업해둔다음에
에러난 하드디스크만 교체하면될까요 아니면,,, 용량이 낮아서
구하기가힘드니까... 하드디스크만 전체다 교체해야되나요?
아 그리고 디스크가 4개가 있는데 과연 어느디스크에서
i/o 에러가 나는지 어떻게 알수 있을까요????
사이즈는 찾았네요
1u~7u 는 서버의 사이즈네요... 실제크기
계속 검색해보고 해결방법을 찾고있는데 아마 교체해야될거같네요..
제 생각에는
위에분 말씀 대로 하드디스크 관련에러 같습니다.
서버 디스크에 빨간불이 들어와 있는지 확인하시고 들어와 있지 않다면 아직 fail은 아니지만 조만간 고장 날거라는 신호일 수 도 있습니다.^^;
디스크에 빨간뿔이 들어와 있다면 raid5로 구성되어 있기 때문에 그냥 빼고 한 1분 있다가 새로운 디스크 넣으시면 됩니다.
1u 7u는 서버 사이즈(높이)를 말하는 겁니다.
왠만하면 서버 교체를 생각 하시는 것이 위에분 말대로 건강에 좋을 실 겁니다.^^
빨간모자 7.3이면 꽤
빨간모자 7.3이면 꽤 오래되었네요. 빨간모자 9 후속으로 나오는 페도라가 1부터 시작해서 지금 11까지 나왔습니다.
하드 문제일 수도 있지만 칩셋이나 케이블 불량 등등도 저런 에러 날 수 있습니다, 서버 오랫동안 썼다면 그런것도 의심할수 있습니다.
바꾸기 어렵다면 일단은 예비 하드 구해다가 그쪽으로 백업을 받으심이. 물론 윗선에는 장비 바꿔달라고 계속 졸라야 할겁니다.
Written By the Black Knight of Destruction
Written By the Black Knight of Destruction
일단은 예비하드에
일단은 예비하드에 전체백업 떠놓는게 우선이겠군요...
그래야 문제생기면 복구라도 할수잇겟죠.
일단은 서버실에 가면 fsck 해보고 백업부터 떠놔야 겠군요..
으흠
용량이 18G * 3 이겠군요? ( raid 5 니까 )
그래봐야 ;; 얼마 안되겠죠? ( 전체 다 사용하진 않으실테니까 )
요즘 나오는 centos 같은것으로 새시스템에 카피하시고.
apm 등은 그냥 yum 을 이용해서 설치 하시고;
버철호스트 같은것을 어떻게 돌리시는진 잘 모르겠지만
제가 예상하기로 os 설치 부터 모두 다 백업하고 어쩌구해도;; 1시간안에 다 끝나는 작업같습니다.
실제 작업에 오래걸리는부분은 당연히 데이타카피일테고
fsck 하시다 어떻게 될지 모르니 일단 백업하시고 그리고 나서 진행하십시오.
걍 퍼뜩 진행하세요;; 오래두면 위험해집니다 서버에 대한 충분한 사이클링을 계산하고
거기에 맞게 작업하세요 5년이상된서버들은 시한폭탄같은 존재들입니다.
거기에 대한 충분한대비를 하시던지 날잡고 교체작업을 진행하셔야 합니다.
참고로 7.3 이라면 -_-;; glibc 도 2.1 인가? 그럴테고;; 하악.. 윈도 98 격이군요 -_-;
교체작업 진행을 강력히 추천합니다.
--------------- 절취선 ------------------------
하늘은 스스로 삽질하는 자를 삽으로 팬다.
http://glay.pe.kr
--------------- 절취선 ------------------------
하늘은 스스로 삽질하는 자를 삽으로 팬다.
http://glay.pe.kr
댓글 달기