이건 어떤 문제인지 궁금합니다

kkakuru의 이미지

안녕하세요~~

여러모로 도움을 받고있습니다.

얼마전 회사 서버들을 IDC이전하면서 L4에서 HA System으로 변경하였습니다

헌데 HA의 Load Balancer가 이상한 작동을 하고 있네요

아래는 LB의 top 내용입니다.

top - 07:20:04 up 8 days, 23:10, 3 users, load average: 0.10, 0.07, 0.01
Tasks: 128 total, 1 running, 125 sleeping, 2 stopped, 0 zombie
Cpu0 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 0.0%us, 1.0%sy, 0.0%ni, 98.0%id, 0.0%wa, 1.0%hi, 0.0%si, 0.0%st
Cpu2 : 0.0%us, 1.0%sy, 0.0%ni, 93.1%id, 0.0%wa, 2.0%hi, 3.9%si, 0.0%st
Cpu3 : 0.0%us, 0.0%sy, 0.0%ni, 25.0%id, 0.0%wa, 1.0%hi, 74.0%si, 0.0%st

보시면 특별한 이상은 없는데 Cpu3 의 System Interrupt 가 항상 60% 이상이네요

각 Cpu로 균일한 배분을 못해주고 있는것 같습니다.

cpuspeed와 irqbalance 같이 돌아가고 있는데요

가끔 서비스가 죽어서 LB의 heartbeat를 restart해 주면 잘 작동되곤 합니다.

아무래도 Cpu3의 si 문제인듯 한데

아시는 분 계시면 조언 부탁드립니다~

좋은 시간 보내세요~

juy0215의 이미지

뭔가 서버에 문제가 있다면 가장먼저 dmesg 와 messages 를 분석하는게 1순위 겠지요~
로그분석을 생활화 해보세요 그곳에 답이 있습니다.
만약 별다른 로그가 없는데도 CPU가 돌고 있다면 많은 양의 패킷이 처리되고 있다는것이겠구요
이때의 모니터링 수치는 sy 가 올라가겠죠
위에서나오는 si 면 Swap in 을 말하는것 같은데요
Swap in 은 0일경우가 가장 좋구요 만약 si 가 수치가 올라가거나 그런현상이 있다면
메모리관련되어 점검해보면 되겠습니다.
프로세스가 메모리를 다쓰고 스왑메모리를 쓰기 시작할대 si 수치가 올라가게 됩니다.
메모리를 많이쓰고 스왑까지 넘어가게만든 프로세스를 찾아서 점검 해보는것이 좋을것 같습니다.