/proc/[pid]/stat 내용 업데이트 주기
안녕하세요..
허접 리눅스 개발자 입니다.
프로세스 별 cpu 사용량을 모니터링 하게 해달라는 요청이 있어서 /proc/[pid]/stat 내용에서 14,15번째의 값의 증가치를 이용해서 값을 구하였습니다.
편의상 이 14, 15번째의 값을 utime, stime 이라고 하겠습니다.
exemple [/proc/[pid]/stat]
30182 (TTTTest) R 30124 30182 30124 34845 30182 4218880 142 0 0 0 5274 0 0 0 20 0 1 0 55611251 17408000 386 18446744073709551615 4194304 4260634 140733397159392 140733397158504 4203154 0 0 0 0 0 0 0 17 2 0 0 0 0 0 6360520 6361584 33239040 140733397167447 140733397167457 140733397167457 140733397168110 0
5초 후
30182 (TTTTest) R 30124 30182 30124 34845 30182 4218880 142 0 0 0 5440 0 0 0 20 0 1 0 55611251 17408000 386 18446744073709551615 4194304 4260634 140733397159392 140733397158504 4203154 0 0 0 0 0 0 0 17 2 0 0 0 0 0 6360520 6361584 33239040 140733397167447 140733397167457 140733397167457 140733397168110 0
테스트 환경에서는 이 파일의 갱신 주기가 약 1초 정도로 측정 되어서 다음의 공식으로 process의 cpu usage를 산출 하였습니다.
process_cpu_usage = ((utime - old_utime) + (stime - old_stime))/5
위의 수치를 가지고 계산하면 결과는 다음과 같습니다.
33.2 = ((5440 - 5274) + (0 - 0)) / 5
그런데, 서버에서 프로세스를 1주일 이상 하드하게 굴리니 원래 1초에 한번 업데이트 되던 /proc/[pid]/stat 파일이 점점 주기가 늘어나 이제는 1분에 한번씩 업데이트가 되어서 잘못된 cpu_usage를 구하게 되었습니다.
stat 파일의 업데이트가 없어 계속 0%의 cpu usage를 구하다가 한번에 몇천% 씩의 usage를 구하게 되던데요.. top이나 htop 같은 유틸으로 봐도 같은 결과가 나오네요.
결국은 /proc/[pid]/stat 파일이 업데이트 주기가 일정하기 않아서 생기는 문제 같고 근본적으로 해결 하려면 /proc/[pid]/stat 파일의 업데이트 주기를 일정 시간 이내에 갱신 되도록 강재 할 수 있어야 할 것 같은데..
어디부터 보아야 할지 모르겠네요.
도와주세요
댓글 달기