[server] Nagios가 WAN을 통한 “모니터링”이 이상적입니까?

새로운 회사에서 막 시작한 첫 번째 과제는 사내 모니터링 시스템의 대안을 찾는 것입니다.

현재 솔루션은 WAN을 통해 다양한 장치를 검사하는 .Net 응용 프로그램입니다 (24/7 지원 / “유지 관리”를 제공하는 IT 컨설팅 회사이므로). 장치는 라우터 / 스위치 / 프린터에서 MS 서버 및 서비스에 이르기까지 다양합니다.

사이트에서 수많은 게시물을 읽고 광범위하게 인터넷 검색을 한 후에 Nagios / Munin 믹스의 일종이 갈 길이라고 합의한 것으로 보입니다.

내 질문에 데려다줍니다.

A) Nagios 서버를 회사에서 로컬로 실행하고 WAN을 통해 다양한 외부 사이트를 모니터링 할 수 있습니까? (대부분의 사이트는 비교적 작고 (10-25 개의 호스트) 사이트의 수는 상당히 많기 때문에 (75-100) 각 사이트에서 로컬 Nagios 서버를 원하지 않습니다.)

B) 그렇다면 에이전트는 Nagios 백엔드에 어떻게 연락합니까? SSH를 통해? HTTP?

C) WAN 링크 장애가 발생하기 쉽다는 사실 외에도 그러한 솔루션의 즉각적인 단점은 무엇입니까?

모든 의견에 감사 드리며 업계에 새로운 의미로 오해에 대해 미리 사과드립니다.



답변

WAN을 통한 모니터링은 가능하지만 일반적으로 이상적이지 않습니다. WAN 연결이 끊어 지거나 튀어 나오는 경우 모든 검사가 실패하고 원격 위치에서 발생하는 상황에 대해 눈이 멀기 때문입니다. 또한 대기 시간이 증가하여 LAN View 성능 측정에 유용하지 않습니다. 이런 식으로 가고 있다면 WAN 링크에 문제가있을 때 경고로 넘치지 않도록 종속성을 설정하고 싶을 것입니다.

모니터링 시스템과 모니터링되는 서비스 간의 통신을 확인하는 가장 일반적인 방법은 사이트 간 VPN 터널을 사용하는 것입니다. 그런 다음 통신은 로컬 네트워크와 다르지 않습니다. 또한 Nagios는 종종 Pull 기반입니다 (필요하지는 않지만). 따라서 Nagios는 모니터링하지 않는 서비스 및 서버에 접속합니다.

마지막으로 Nagios와 함께 분산 모니터링 설정을 사용하는 것이 가장 이상적인 솔루션입니다. 하나의 옵션은 http://nagios.sourceforge.net/docs/3_0/distributed.html에 설명되어 있습니다.


답변

그것은 당신이 완에 대해 무엇을 모니터링 할 것인지에 달려 있습니다. 대부분의 경우 핑 검사, 서비스 검사, 디스크 검사 등을 수행하고 nagios의 기본 5 분 검사 시간을 고수하면 문제를 일으키는 것을 볼 수 없습니다.

다시 한 번, 확인하려는 내용에 따라 대화 내용에 따라 달라집니다. Windows 호스트를 확인하는 경우 WMI 쿼리를 사용할 수 있으며 상자에서 에이전트를 실행할 필요조차 없습니다.


답변

이것은 여러 가지 다른 방법을 통해 가능합니다.

“분산 설정”에 문제가없는 경우 다음 중 하나 이상을 수행해야합니다.

  1. 원격 사이트의 모든 상자에 Nagios에 푸시 검사 결과를 푸시하십시오 ( NSCA 참조 ).
  2. Nagios가 모든 원격 사이트의 모든 상자에 도달 할 수 있도록 방화벽 구멍을 뚫습니다.
  3. 각 사이트에서 하나의 상자를 “Nagios 프록시”로 지정하십시오.

방화벽 홀 포킹을 최소화하고 구성을 단순화하기 때문에 # 3을 제안합니다. 각 사이트에서 전체 Nagios 인스턴스가 필요하지 않다는 점에서 분산 설정의 축소 버전입니다.

이를 위해 NRPE를 설정 하거나 check_by_ssh를 사용 하여이 “프록시”가 네트워크의 다른 호스트에 대해 다른 모든 검사를 실행하도록 할 수 있습니다. 프록시와 관련하여 다시 얻을 수있는 성능 데이터의 이점이 추가되어 WAN 지연의 영향을받지 않습니다.

또한 부모 / 자식 설정을 사용하여 원격 사이트의 모든 호스트를 프록시의 자식으로 만들어 오 탐지를 줄일 수 있습니다. 프록시의 check_nrpe (또는 check_ssh) 서비스에 종속 된 모든 서비스를 만들 수도 있습니다. 자세한 내용은 네트워크 연결 가능성 문서를 참조하십시오.

어떤 방법을 사용하든 WAN 링크를 통과하는 지연 시간 을 고려 하여 기본 시간 초과를 적절하게 조정 하는 것이 매우 중요합니다 .


답변