System Call 함수를 호출하지 못하는 경우가 있나요?
글쓴이: trymp / 작성시간: 수, 2010/03/03 - 7:48오후
리눅스에서 Heart bit 을 체크하는 데몬을 만들었습니다.
서버에서 300개 정도의 client 에서 3초 주기로 request를 받으면 해당 client 한테
reply 를 보내주는 형태입니다. 이것을 통해 client 에 대한 세션을 관리합니다.(죽었는지 살았는지??)
프로토콜은 UDP 이고요 송수신 바이트는 60바이트 이하입니다.
데몬 내에서 pthread 로 각 client 의 live 여부를 확인하는 쓰래드가 돌고 있고 메인 쓰래드에서
select() 로 대기하고 있다가 패킷이 오면 client 에 대한 세션리스트를 갱신해주고 바로 reply 를 보내줍니다.
그런데 가끔 서버가 client 한테 reply 를 못 보냅니다. 한 4초 정도...
그래서 strace 로 데몬을 디버깅 해보니 애러가 난 시점에 select(), recvfrom(), sendto() 같은 시스템 콜 함수가
찍히지 않았습니다. (평소에는 초당 100개 이상씩은 찍힙니다.)
제가 궁금한 점은 어떤 경우에 시스템 콜 함수가 호출이 안되고 저렇게 보이는지 이해가 되지 않습니다.
제가 소켓 프로그래밍에 노하우가 부족해서 고수님들의 조언 부탁드립니다.
답변 주시면 감사하겠습니다.
Forums:
strace 로 시스템 콜이
strace 로 시스템 콜이 안 나온다면,
프로세스의 최종 stack 상태를 확인해 보면 디버깅에 도움이 될 것 같습니다.
user cpu 영역에서 먼가의 loop 작업(메모리 핸들링 작업등.)이 수행되고 있다면 system cpu 영역에 안 갈수도 있을것 같네요.
gdb 로 해당 프로세스에 attach 해서 최종 stack 상태를 확인해 보세요.
gdb --pid=PID 로 attach 해서
bt 명령으로 최종 stack 확인
이후에 먼가의 실마리를 찾아야 할 것 같습니다.
댓글 달기