SMP 노드 여러개로 구성된 클러스터
글쓴이: ns123 / 작성시간: 토, 2005/06/11 - 4:54오후
안녕하세요, 여러분. 날도 더운데 다들 건강관리 잘 하시기 바랍니다. 현재 Opteron dual이 각각 8개와 10개 연결된 클러스터를 사용하고 있습니다. 총 CPU 갯수는 16개와 20개인 셈이죠. 그런데 MPI_COMM_SIZE에서 파악하는 노드 갯수는 8개와 10개가 아닌 16개와 20개 더라구요. 개인적으론 노드가 8개인 시스템에서 프로그램이 노드를 8개만 인식하고 노드별로 할당된 작업은 각 노드에서 OMP로 돌아가는 걸 원합니다. 그런데 현재는 노드를 16개로 인식하니 OMP는 전혀 의미가 없죠.
개인적으론 MPICH의 configure에서 뭔가 문제가 있는 거 같은데 오랜시간 삽질을 해도 알 수 가 없네요. 참고로 scheduler는 Open PBS이고 실행스크립트는 다음과 같습니다.
#PBS -l nodes=8:ppn=2
.....
mpirun -machinefile $PBS_NODEFILE -np 16 ./mz4_hyb > process.txt
여기서 np를 16으로 하면 여지없이 16개의 노드로 인식합니다.(8node*2 가 아니라요.) 그렇다고 -np 16을 없애고 -n 8만 했더니 노드 네개의 CPU는 놀고 나머지 네 개 노드의 8개 CPU만 돌더라구요. 어떻게 해결해야 할지 현재로선 정말 난감합니다.
Forums:


댓글 달기