HA(high Availability) 에 관한 질문입니다.
글쓴이: hellokdw / 작성시간: 목, 2010/06/03 - 11:54오전
지금 NAT+HA 를 구성하려고 하는중입니다.
먼저 HA 를 테스트 서버 두대에 설치 하였는데요.
질문 몇가지를 드리겠습니다.
1.master로 가동되고 있는 서버에서 물리적으로 선을 제거하면 정상적으로 동작을 합니다.
그런데 ifconfig eth0 down을 하면 원하는 데로 동작을 하지 않네요.
2.그리고 eth1 을 다운시키면 넘어가게 되고 난후 crm_mon 을 통하여 모니터링을 하면 두개의 싱크가 맞지 않습니다.
모니터링을 하는 서버들이 각각 자기가 살아 있다고 나옵니다.
3. 2번과 같은 상황에서 heartbeat 을 eth1을 죽였던 서버에서 restart 시키면 다시 싱크가 맞게 됩니다. 이과정이 꼭 필요한가요?
4. 가끔 무슨 이유인지 모르겠지만 heartbeat을 stop 시키면 stop이 매우 느리거나 되지 않습니다.
위의 4가지 질문에 대한 답을 부탁드립니다. 감사합니다.
Forums:
;; 제가 잘 몰라서
;; 제가 잘 몰라서 그러는데 NAT 라고 하면
흔히들 말하는 사설 IP인가요?
아마 설정을 잘못하신게 아닐까요?
keepalive, deadtime, checktimeout, checkinterval 등의 시간설정이나 hearbeat 방식,, anycast냐 broadcast냐 등등 의 설정상의 문제로 감지 못할수도 있습니다..
NAT면 흔히 말하는 사설아이피겠죠? ip터널링이나 ipforward 방식으로 안하셨다면...
공인ip로 해도 뭐 문제는 없습니다... 작동은 하겠죠...
하나더.. 엔지니어는 감을 믿으면 안되고 로그를 믿어야죠..
흐으음~
1.master로 가동되고 있는 서버에서 물리적으로 선을 제거하면 정상적으로 동작을 합니다.
그런데 ifconfig eth0 down을 하면 원하는 데로 동작을 하지 않네요.
- 우선 ha.cf 설정을 보셔야겠네요 핼스체크를 하는 인터페이스 명이 eth0 인지 eth1 인지를 먼저 확인해보셔야겠네요
ha 구성한 서버에 eth0 과 eth1 두개의 인터페이스가 있으신것 같은데 두 인터페이스중 두가지 모두 체크를 하던가
아니면 eth0 과 eth1중 중요한 것을 스텐바이 서버에서 체크하도록 하는게 좋겠네요 또 헬스체크는 브로드케스트나 멀티케스트보단
유니케스트로 단일로 지정하는게 좋습니다.
설정중 bcast eth0 뭐 이런식으로 되어있다면
ucast eth0 192.168.0.12 # 유니케스트패킷을 eth0 통해 192.168.0.12 로 보낸다~ 여기서 192.168.0.12 는 스탠바이 서버의 ip가 되겠죠
2.그리고 eth1 을 다운시키면 넘어가게 되고 난후 crm_mon 을 통하여 모니터링을 하면 두개의 싱크가 맞지 않습니다.
모니터링을 하는 서버들이 각각 자기가 살아 있다고 나옵니다.
- mon 의 설정이 잘못된것이 확실합니다.
3. 2번과 같은 상황에서 heartbeat 을 eth1을 죽였던 서버에서 restart 시키면 다시 싱크가 맞게 됩니다. 이과정이 꼭 필요한가요?
- 뭔가 설정을 잘못하신것 같습니다 어떤 구조로 설정하셨는지 자세히 알수 없어서 ㅎㅎ;; 뭐라 말씀드리기가 ㅎ
4. 가끔 무슨 이유인지 모르겠지만 heartbeat을 stop 시키면 stop이 매우 느리거나 되지 않습니다.
- 로그를 확인해보세요