HA(high Availability) 에 관한 질문입니다.

hellokdw의 이미지

지금 NAT+HA 를 구성하려고 하는중입니다.
먼저 HA 를 테스트 서버 두대에 설치 하였는데요.

질문 몇가지를 드리겠습니다.

1.master로 가동되고 있는 서버에서 물리적으로 선을 제거하면 정상적으로 동작을 합니다.
그런데 ifconfig eth0 down을 하면 원하는 데로 동작을 하지 않네요.

2.그리고 eth1 을 다운시키면 넘어가게 되고 난후 crm_mon 을 통하여 모니터링을 하면 두개의 싱크가 맞지 않습니다.
모니터링을 하는 서버들이 각각 자기가 살아 있다고 나옵니다.

3. 2번과 같은 상황에서 heartbeat 을 eth1을 죽였던 서버에서 restart 시키면 다시 싱크가 맞게 됩니다. 이과정이 꼭 필요한가요?

4. 가끔 무슨 이유인지 모르겠지만 heartbeat을 stop 시키면 stop이 매우 느리거나 되지 않습니다.

위의 4가지 질문에 대한 답을 부탁드립니다. 감사합니다.

kkakuru의 이미지

;; 제가 잘 몰라서 그러는데 NAT 라고 하면

흔히들 말하는 사설 IP인가요?

waps의 이미지

keepalive, deadtime, checktimeout, checkinterval 등의 시간설정이나 hearbeat 방식,, anycast냐 broadcast냐 등등 의 설정상의 문제로 감지 못할수도 있습니다..

NAT면 흔히 말하는 사설아이피겠죠? ip터널링이나 ipforward 방식으로 안하셨다면...

공인ip로 해도 뭐 문제는 없습니다... 작동은 하겠죠...

하나더.. 엔지니어는 감을 믿으면 안되고 로그를 믿어야죠..

juy0215의 이미지

1.master로 가동되고 있는 서버에서 물리적으로 선을 제거하면 정상적으로 동작을 합니다.
그런데 ifconfig eth0 down을 하면 원하는 데로 동작을 하지 않네요.

- 우선 ha.cf 설정을 보셔야겠네요 핼스체크를 하는 인터페이스 명이 eth0 인지 eth1 인지를 먼저 확인해보셔야겠네요
ha 구성한 서버에 eth0 과 eth1 두개의 인터페이스가 있으신것 같은데 두 인터페이스중 두가지 모두 체크를 하던가
아니면 eth0 과 eth1중 중요한 것을 스텐바이 서버에서 체크하도록 하는게 좋겠네요 또 헬스체크는 브로드케스트나 멀티케스트보단
유니케스트로 단일로 지정하는게 좋습니다.
설정중 bcast eth0 뭐 이런식으로 되어있다면
ucast eth0 192.168.0.12 # 유니케스트패킷을 eth0 통해 192.168.0.12 로 보낸다~ 여기서 192.168.0.12 는 스탠바이 서버의 ip가 되겠죠

2.그리고 eth1 을 다운시키면 넘어가게 되고 난후 crm_mon 을 통하여 모니터링을 하면 두개의 싱크가 맞지 않습니다.
모니터링을 하는 서버들이 각각 자기가 살아 있다고 나옵니다.

- mon 의 설정이 잘못된것이 확실합니다.

3. 2번과 같은 상황에서 heartbeat 을 eth1을 죽였던 서버에서 restart 시키면 다시 싱크가 맞게 됩니다. 이과정이 꼭 필요한가요?

- 뭔가 설정을 잘못하신것 같습니다 어떤 구조로 설정하셨는지 자세히 알수 없어서 ㅎㅎ;; 뭐라 말씀드리기가 ㅎ

4. 가끔 무슨 이유인지 모르겠지만 heartbeat을 stop 시키면 stop이 매우 느리거나 되지 않습니다.

- 로그를 확인해보세요