리눅스 부팅시 에러점 잡아주세요.
삼성 SmartServer 3210 4대에 그냥 레드헷 7.3 배포판을 일반적인 설정으로(설정건드리지않고) 깔았습니다.
그리고 랜카드가 잡히지 않아서 보드 CD에 있는 랜카드 드라아버 모듈을 올렸습다.
서버 사양은 아래와 같습니다.
M/B : Intel Server Board SE7501HG2 CPU : Intel Xeon 2.4Ghz (533MHz, 512KB L2 Cache) 2개 MEMORY : DDR ECC REG 512MB 2개 CD-ROM : Black 52X CD-ROM LAN-CARD : Intel PRO 1000 Ethernet Connect Ethernet Connect 2개 HDD : Fujitu SCSI
그리고 4대중 한 대에 폴더 하나를 export 시키고 나머지 3대가 그 폴더를 nfs로 잡아 사용했습니다.
리눅스를 설치 한 후 한동안 아무 이상 없이 잘 돌아 갔습니다.
그런데 설치후 약 3개월 정도 지난 후에 가끔씩 커널 에러가 발생했습니다.
에러 내용은
Assertion failure in journal_commit_transaction() at commit.c:535: "buffer_jdirty(bh)" --------- [ cut here ] --------- kernel BUG at commit.c:535 invalid operand: 0000 soundcore binfmt_misc autofs e1000 usb-uhci usbcore ext3 jbd aic7xxx sd_mod sc cpu: 1 EIP: 0010[<f88560e4>] Not tainted EFLAGS: 00010286 EIP is at journal_commit_transaction [jbd]0xb04 ~~~~~~ 대략 이 다음 부터는 이상한 숫자들이 막 나오는 에러 였습니다.
이렇게 커널에러가 발생한 후 해당 시스템으로 ping을 날려보면 ping은 살아 있는데
콘솔상에서 어떠한 명령도 먹지 않아서 reset 버튼으로 껏다 키면서 사용했습니다.
그런데 문제는 어느날 이렇게 에러가 나길래 reset 버튼으로 껏다가 켰는데
부팅 메시지 중에
Starting system logger: [FAILED] 이 메시지가 뜨고 Starting NFS quotas: Cannot gegister service: RCP: Unable to recive; errno = connection refused rpc.rquotad: unable to register(RQUOTADOG,RQUOTAUERS,udp) [FAILED] Starting NFS mountd: Cannot gegister service: RCP: Unable to recive; errno = connection refused rpc.rquotad: unable to register(RQUOTADOG,RQUOTAUERS,udp) [FAILED] Starting NFS daemon: portmap: server localhost not responding, time out Portmap: server localhost not responding, time out
이렇게 NFS 관련 에러 메시지가 뜨고 한참 있다가 부팅이 되었습니다.
그런데 문제는 부팅 후 top을 실행 시키면 cpu 개수가 4개가 나와야 되는데 하나만 나오는 겁니다.
(원래 실제 CPU 개수는 2개인데 보드에서 하이퍼스레드 기법으로 4래로 만들어 준답니다.)
또 콘솔 상에서 setup 명령을 치면
Your terminal lacks the ability to clear the screen or position the cursor.
이렇게 뜹니다. 물론 root로 실행 시켰습니다.
또 하나의 증세는 vi로 문서를 열면 화면에 문자가 지워지지 않는 겁니다. 그러니까 다시 설명하면
문서를 열고 커서를 밑으로 내리면 위에 있는 글자가 지워지지 않고 밑에 화면에 계속 나오는 겁니다.
그래서 혹 NFS 문제인가 라는 생각에 /etc/rc.d/rc3.c/S60nfs 를 K60nfs로 바꾸어 주고 부팅을 하면
NFS관련 에러 메지지는 않나오나 Starting system logger: [FAILED] 메시지는 여전히 뜨고 부팅 후 발생하는
문제도 여전합니다.
잘 돌아가던 시스템이 갑자기 이렇게 망가져 버리니 어떻게 할 방법이 없네요.
이 증상을 치료해 줄 방법을 제발 알려주세요.
정녕 포맷하고 다시 깔아야 하나요?
...
커널 configure 를 새로 함해보세요... NFS를 사용하신다면
쿼터에 걸린것 같은데 그게 아마 커널에서 모듈을 못올리는 경우 같습니다.
(관련 모듈이 날라갔거나...) :roll:
커널성정에서 쿼터부분을 커널에 포함시키셔서 컴파일해 보셔요...
---------------------------------------------------
야!...
쿼터부분을 커널에 포함 시키라는 말이 무슨 뜻입니까?
답변 감사드립니다.
그런데 커널설정에서 쿼터부분을 커널에 포함 시키라는 말이 커널 컴파일을 다시 하는 도중에
-->FiLe SyStemS --> [*] Quota Support 를 체크해서 컴파일 하라는 말씀이십니까?
다시한번 부탁드립니다.
...
네 그렇구요...
http://doc.kldp.org/KoreanDoc/html/2.4Kernel_Compile-KLDP/2.4Kernel_Compile-KLDP-30.html
참고하시구요...
그리고 안에 내용을 보면 저널링시스템에서 에서...
" NFS와 quota를 ReiserFS와 함께 사용하려면 패치를 해야합니다 (관련 링크: www.reiserfs.org)"
란 말이 있네요...
---------------------------------------------------
야!...
A/S 기간 종료 안된걸로 아는데, AS센터에 전화해서 하드웨어를 통째로
A/S 기간 종료 안된걸로 아는데, AS센터에 전화해서 하드웨어를 통째로 바꿔달라고 하십시오.
일단, CPU 1개가 맛이 간것 같읍니다. AS센터에 전화를 하면 서울통신으로 연결해줄겁니다. 거기 전화해서 증상을 이야기하고, '아무래도 CPU가 이상한 것 같다. 하드도 맛이 간것 같다...'라고 이야기를 하면 사람이 올겁니다.
하드웨어 문제인지 아닌지를 보고싶으면, 문제가 발생한 3210의 하드디스크를 빼서 다른 3210에 꽂아서 부팅을 시켜보십시오. 3210이 똑같은 4대일테니까, 당연히 하드를 옮겨꽂아서 하드 혹은 파티션에 이상이 없다면 정상적으로 부팅할 것이고, 이때는 CPU나 메모리 쪽의 에러일 가능성이 농후하겠지요.
만약에, 똑같은 증상이 나타난다면 이건 하드디스크 쪽에 물리적 혹은 파티션이 날라간 증상이라고 보시면 될겁니다.
7.3이 기본으로 설치되어 있고, 저기에는 ReiserFS를 사용하고 있지 않을 겁니다. 따라서 이문제와는 상관이 없읍니다.
삼성전자 서비스에 전화를 하시고, 그냥 '하드나 시피유 문제인듯하다'라고 말하고 시스템을 교체해달라고 하십시오. 그럴려고 '삼성서버'산건데, 고생할 필요가 없겠지요...
--------------------------------
윈도위의 리눅스 윈도위의 윈도우 리눅스위의 익스플로러
역시 하드가 맛이 간거 같네요...ㅡㅡ;
MyCluster님께서 말씀하신 대로 다른 컴퓨터에 하드를 바꾸어 부팅을 시켜보았는데 같은 현상이 발생하더군요.
역시 OS의 특정 부분의 파일이 깨진거 같습니다.
이거 정말 밀기 실었는데.... 할 수 없군요.
다시 밀고 깔고 세팅해야지요. ㅡㅡ;
답변 감사합니다.
댓글 달기