부록 A. 프로브
모니터링 (Monitoring)으로 등록된 시스템들은 프로브를 소유할 수 있으며 프로브들은 이 시스템들의 상태와 완벽한 실행 능력을 지속적으로 확인하기 위해 실행됩니다. 이 부분에서는 가용한 프로브를 Apache와 같이 일반 그룹으로 나누어 각 목록을 제공합니다.
시스템의 내부적인 양상을 감시하는 대부분의 프로브 (예, Linux::Disk 사용량 프로브)는, Network Services::SSH 프로브와 같은 외부적으로 요소 보다는, Red Hat Network 모니터링 데몬 (
rhnmd
)의 설치를 요합니다. 이에 관한 요건은 개별 프로브 참조문 내에 언급되었습니다.
각 프로브는 개별적인 참조문을 가지고 있으며 이는 필수 입력 필드 (*로 표시됨), 디폴트 값, 그리고 통보를 발효하기 위해 설정되야 할 한계점 등을 명시합니다. 유사하게, 각 명령 그룹 부분의 첫머리에는 그 그룹 내의 모든 프로브에 공통적으로 적용 가능한 정보를 담고 있습니다. A.1절. “프로브 정보”에서는 모든 프로브에 대한 일반적인 정보를 담고 있으며, 그 이외 부분에서는 개별 프로브에 대한 내용을 각각 다루고 있습니다.
참고
거의 모든 프로브는 메세지 전달 프로토콜로써 TCP (Transmission Control Protocol)를 사용합니다. 이에 대한 예외 경우는 개별 프로브 참조문 내에 언급되었습니다.
A.1. 프로브 정보 링크 복사링크가 클립보드에 복사되었습니다!
링크 복사링크가 클립보드에 복사되었습니다!
다음은 각 프로브 상태에 대하여 일반적인 정보를 설명하고 있으며, 프로브에 한계점을 설정시 도움이 될 것입니다.
다음 목록은 각 프로브 상태에 대하여 간단히 설명하고 있습니다:
- 알 수 없음
- 프로브 상태를 측정하는데 필요한 수치를 수집하는데 실패한 프로브입니다. 타임아웃된 상태인 프로브는 대부분 이 상태로 나타납니다. 이러한 상태의 프로브는 잘못된 설정으로 인해 발생하는 경우도 있습니다.
- 미결
- Red Hat Satellite에서 데이터를 받지 못한 프로브입니다. 일반적으로 새로운 프로브는 이 상태로 시작합니다. 그러나 만일 모든 프로브가 이 상태로 바뀐다면, 모니터링 작업이 실패하고 있다는 것일 수 도 있습니다.
- 확인
- 오류 없이 성공적으로 실행된 프로브입니다. 이상적인 프로브 상태라 할 수 있습니다.
- 경고
- 경고 (WARNING) 한계점을 넘어선 프로브입니다.
- 중요함
- 위험 (CRITICAL) 한계점에 이르렀거나 다른 이유로 위험 상태에 있는 프로브입니다. (타임아웃 기간을 초과했을때 위험 상황으로 변하는 프로브도 일부 있습니다)
프로브를 추가시, 의미가 있는 한계점을 지정하여 만일 이 한계점을 초과하게 되면 시스템 관리자에게 문제를 보고할 수 있도록 하십시오. 타임아웃 시간은 따로 명시하지 않는 이상 초 단위로 입력됩니다. 이상의 규칙에 대한 예외는 개별 프로브 참조문 내에 설명되었습니다.
중요
어떤 프로브는 시간을 기준으로 한계점을 가지고 있습니다. 시간에 기준한 위험 (CRITICAL) 그리고 경고 (WARNING) 한계점이 의도대로 작동되게 하기 위해서는, 한계점 값이 타임아웃 시점으로 설정된 시간 양보다 클 수 없습니다. 그렇지 않으면 모든 장기 대기 시간의 결과로는 알 수 없음 (UNKNOWN) 상태가 반환될 것입니다. 이러한 이유로 Red Hat은 타임아웃 값을 모든 다른 한계점보다 높게 설정하시기를 권장합니다.
통지 한계점을 설정하지 마시고 먼저 프로브를 실행하여, 각 시스템에 대한 기반 성능을 설정합니다. 프로브에 의해 제공된 기본 값이 상황에 적합할 수 도 있지만, 각 조직마다 다른 환경을 갖추고 있으므로 프로브 기본 한계점을 상황에 맞게 변경해야할 경우도 있기 때문입니다.