Solaris SMF 로그 좀 봐주세요.
얼마 전 관리하는 시스템에 뜬금없이 장애가 생겼습니다.
증상은 ps 등의 내부 명령어를 사용하려 하면 "ps getexecname() 실패"라는 메시지와 함께
명령어가 작동하지 않았습니다. 그리고 WAS인 JEUS의 로그를 보면 날짜가 1999년으로 돌아가 있었구요.
원인을 파악하기 위해 전산실 쪽에 문의를 해봐도 외부 침입의 흔적은 없다고 하고,
각종 syslog들을 뒤져봐도 이렇다 할 내용이 보이질 않았습니다.
그러다가 SMF(Service Management Facility) 로그까지 보게 되었는데요.
여기도 여타 이렇다 할 내용이 없었는데, lc6.log 라는 파일에서 다음과 같은 로그를 발견했습니다.
==============================
6월 24 13:14:18 Executing /sbin/rc6 stop
Executing legacy init script "/etc/rc0.d/K01netbackup".
stopping the NetBackup Bare Metal Restore Boot Server daemon
stopping the NetBackup client daemon
stopping the NetBackup network daemon
Legacy init script "/etc/rc0.d/K01netbackup" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K05appserv".
Legacy init script "/etc/rc0.d/K05appserv" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K06mipagent".
Legacy init script "/etc/rc0.d/K06mipagent" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K15imq".
Legacy init script "/etc/rc0.d/K15imq" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K16apache".
httpd stopping.
Legacy init script "/etc/rc0.d/K16apache" exited with return code 0.
/usr/apache/bin/apachectl stop: httpd (no pid file) not running
Executing legacy init script "/etc/rc0.d/K27boot.server".
Legacy init script "/etc/rc0.d/K27boot.server" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K34ncalogd".
Legacy init script "/etc/rc0.d/K34ncalogd" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K50pppd".
Legacy init script "/etc/rc0.d/K50pppd" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K52llc2".
Legacy init script "/etc/rc0.d/K52llc2" exited with return code 0.
Executing legacy init script "/etc/rc0.d/K62lu".
Legacy init script "/etc/rc0.d/K62lu" exited with return code 0.
==============================
이전의 로그들에서는 볼 수 없었던
stopping the NetBackup Bare Metal Restore Boot Server daemon
stopping the NetBackup client daemon
stopping the NetBackup network daemon
이 부분이 뭔가 의심스럽기는 한데, 혹시 이 로그를 가지고 장애의 원인이 유추 가능한지요?
클라이언트 측에서는 원인파악 해야된다고 얘기하고, 방법은 없고 갑갑합니다 ㅠ_ㅠ
댓글 달기