패킷수집 커널 대 유저영역 성능차이
글쓴이: dalili / 작성시간: 금, 2010/10/29 - 2:07오후
패킷 수집을 처리하는 모듈인데 두개의 제품 성능차이가 너무 심하게 나서요
제품1 : 커널 -> mbuff -> Applicatoin(T)
제품2 : 유저영역에서 device를 bind 후 mmap -> buffer -> Application(D)
두개의 제품이 있는데 2번 제품이 10배 이상 느리네요
Applicatoin(T)와 Application(D)는 동일한 모듈인데도 불구하고, top 명령어로 cpu사용량을 보면 월등히 Application(D)가 높습니다.
제품1은 커널에서 tcp/ip 스택을 올라가지 않게 하였습니다.
이럴 경우 성능차이가 이렇게 심하게 날까요?
그리고 궁금한게 커널에서 cpu사용량이 높으면 유저영역의 application도 느려지는게 맞는지요?
어떻게 확인할 수 있을까요?
Forums:
음.. 어디서 속도
음.. 어디서 속도 차를 보일 수 있는지는 워낙 광범위해서 어디 때문에 느리다고는 말씀드릴 수는 없겠네요.
받는 느낌으로는 제품1의 경우는 DEVICE DRIVER -> BPF FILTER (IFNET 상의) 을 이용하여 구현된 제품으로 생각이 되네요 (물론 가정입니다.) BPF FILTER 의 경우 /dev/bpf 을 통해서 COPY 가 이루어지기 때문에 logic 상으로 봤을 때는 가장 간단한 구조일 듯 하구요. TCP/IP stack 을 없앴다는 걸로 봐서는 패킷 capture 을 위해 최적화한 제품 같군요.
제품2의 경우는 mmap(2) 을 사용한게 문제인 듯 하네요. (물론 여기서 device 을 bind 한다는 말씀이 무슨 말인지 모르겠구요.) mmap 은 VM 을 거치는 것이기 때문에 안에서 무슨 삽질을 하고 있는지 모르구요. mmap 을 읽는 패턴에 따라서 혹은 데이타의 량에 따라서 속도 차이가 달리질 수도 있을 것 같습니다. 근데 왜 mmap(2) 을 사용하는지 부터 제품 만든 개발자한테 들어봐야 겠는 걸요?
어느 정도의 network bandwidth 을 capturing 하는 건지 모르겠지만 CPU 사용량이 많다는 그 많큼 연산이 많다는 것이겠죠. (먼가 비효율적인 부분이 있다는 겁니다.)
마지막으로 CPU 사용량이 높으면 application 이 느려지는게 맞습니다만 원래 CPU 의 용량에 최대치를 하는 것이니, 느려진다는게 맞을 수도 아닐 수도 있겠습니다. 일이 많으니 최대치 만큼 하는게 CPU 가 할 수 있는 것이겠죠. 관점의 차이라..
두서없이 적어 죄송합니다. ㅋ
댓글 달기