Infiniband에서 Open MPI 사용 병렬 계산 시 CPU 중복 문제
글쓴이: kgb3233 / 작성시간: 화, 2015/11/24 - 10:31오전
안녕하세요,
클러스터에 Infiniband가 설치되어 있고, Open MPI를 이용하여 병렬 계산 (OpenFOAM) 을 하고 있습니다.
노드 1개에는 20개의 core가 있으며, 2개의 node, 총 40개의 core를 이용하여 계산을 수행하는 도중 문제가 발생하네요.
우선,
1. Open MPI를 이용하여 계산할 때 single node에서 core 개수를 늘리며 계산을 해보면 core 4개를 기점으로 speed up이 떨어지기 시작합니다. 20개의 core로 계산할 경우 speed up이 10도 안나오네요.
2. 2개의 node를 이용하여 40개의 core로 계산할 경우, Job은 40개를 돌리고 있지만 실제 CPU는 39개만 사용되고 나머지 하나는 idle 상태입니다.
대부분의 Job cpu usage가 100% 가까이 나오는 반면 두 개의 job에서 cpu usage가 50%로 찍히네요.
혹시 원인이 무엇인지 짐작이 가시는 분 계시나요?
Forums:
찾아봤습니다.
여기 버그리포트 하는곳이 있습니다.
http://www.openfoam.org/bugs/
트위터와 위키가 있습니다.
Unofficial OpenFOAM wiki
https://openfoamwiki.net/index.php/Main_Page
제80회 Open Technet, OpenFOAM 컨퍼런스 2015
http://sendmade.blog.me/220478151592
OpenFOAM
http://search.naver.com/search.naver?ie=utf8&sm=stp_hty&where=se&query=OpenFOAM
OpenFOAM® for Windows 15.06
Free package for running OpenFOAM® CFD software in Windows OS
http://www.cfdsupport.com/openfoam-for-windows.html
----------------------------------------------------------------------------
젊음'은 모든것을 가능하게 만든다.
매일 1억명이 사용하는 프로그램을 함께 만들어보고 싶습니다.
정규 근로 시간을 지키는. 야근 없는 회사와 거래합니다.
각 분야별. 좋은 책'이나 사이트' 블로그' 링크 소개 받습니다. shintx@naver.com
1. 전형적인 문제가 아닌가 생각됩니다.
1. 전형적인 문제가 아닌가 생각됩니다. ahmdal's law ?
synchronization 으로 인한 오버헤드가 아닌가 생각됩니다.
2. taskset/cpuset 으로 놀고 있는 1개 core에서는 대체 뭘 하는지 알아보시는게 좋겠습니다.
* 클러스터의 노드 개수를 모르지만, OS가 사용할(작업용으로 안쓰고) 가능성도 생각해 볼 수 있겠습니다.
댓글 달기