nfs이용한 두대의 클러스터중 클라이언트의 reboot시 에러...
글쓴이: amorfati / 작성시간: 화, 2004/03/23 - 10:49오후
redhat 9.0으로 두대를 pxelinux.0을 이용하여 diskless 클러스터를 연결했습니다.
중간에 이것저것 에러도 많았고 손도 많이 봤지만 일단 연결됬고 마스터도 클라이언트도 failed없이 부팅이 되었습니다.
그런데 클라이언트를 reboot시키면 다음과 같은 에러가 화면을 가득채우고 멈추지 않습니다.
RPC : sendmsg returned error 101
nfs : RPC call returned error 101
다른곳에서 찾아보니 패치를 하면 된다고한 답변을 보았을뿐 더 자세한 내용은 찾을수가 없었습니다.
커널 2.6.4이고 마스터 클라이언트 모두 모듈없이 커널에 다 집어넣었구요,
특이사항은 nfs-utils-1.0.6 업그레이드 시켜준것 뿐입니다~
지금 여기까지의 작업만 벌써 여러번이네요...
저번에 이 문제가 생겼을땐 하다하다 안되서 그냥 무시하고 넘어간다음
MPI를 설치하다가 mpd가 안올라가 다시 처음부터...
그런데 또 이 에러가 나타납니다....ㅜ.ㅜ
그래서 여기 고수분들께 도움 청합니다.
그리고 클러스터를 연결했을때 두대가 failed없이 부팅되었다고해도 가장 먼저 잘 작동되는지 체크해봐야하는게 뭐가있을까요?
Forums:
이것저것 하다보니...
/etc/init.d/killall stop 혹은 /etc/init.d/killall start 하면 같은 에러가 발생합니다..
당췌 이유가 뭔지 도무지 모르겠습니다..
아무래도 저의 한계가 넘어서는 듯 하네요..ㅜ.ㅜ
a.m.o.r.f.a.t.i.
도움이 되실런지요.
이게 맞느지는 확실하진 않구요.
저도 책에서 보고 한 거거던요.
도움이 되었으면 좋겠네요. 저도 diskless 때문에 고생을 많이 했거던요.ㅡㅡ;
감사합니다..
답변 감사합니다.
제가 외부에 나가있어서 오늘에야 봤습니다.
말씀하신대로 했더니, rpc error 101이라고 하면서 화면을 가득채우며 멈춰버리는건 사라졌네요..^^
그런데 reboot이나 종료시에 아래와같은 메시지가 나옵니다.
그리고는 다시 부팅하면 아주 정상적으로 부팅되구요...
다시한번 질문 드립니다.
1. 한 node에서 nfs 마운트된 디렉토리에 화일을 생성하고 다른 node에서 rsh로 생성된 화일을 확인할수 있습니다.
이것이 되면 nfs가 정상적으로 작동된다고 보면 되는건지 궁금합니다.
2. 위 메시지에서 failed의 원인을 모르겠습니다.
아래는 /etc/exports file 입니다.
아래는 클라이언트의 /etc/fstab 입니다.
portmap, nfslock, nfs 정상작동 하구요..
지금 MPICH를 올려 앞으로 갈길이 먼데 여기서 자꾸 나아가질 않습니다.
도와주십시요... :oops:
a.m.o.r.f.a.t.i.
답변
1. 한 node에서 nfs 마운트된 디렉토리에 화일을 생성하고 다른 node에서 rsh로 생성된 화일을 확인할수 있습니다.
이것이 되면 nfs가 정상적으로 작동된다고 보면 되는건지 궁금합니다.
==> 답변
네. 잘 동작하는 것 같습니다.
NFS서버에서 export 시킨 디렉토리를 NFS클라이언트에서 파일을 읽고 쓸 수 있으면 잘 동작하는 겁니다.
2. 위 메시지에서 failed의 원인을 모르겠습니다.
저도 /proc 부분에서 나는 에러는 잘 모르겠네요.
그러나 저도 diskless 컴퓨터를 reboot이나 halt 할때 에러메지지는 납니다.
정확한 메지지는 기억이 나질 않네요.
그리고 한가지 더 생각나는게 있어서요.
참고 하세요.
댓글 달기