[server] 시간이 지남에 따라 프로세스의 메모리 / CPU 사용량을 모니터링하고 기록하는 방법은 무엇입니까? [닫은]

balooning 메모리 프로세스가 스왑을 채우고 전체 시스템 (예 : 아파치)을 죽이는 스왑 사망과 같은 문제를 진단하는 방법을 찾고 있습니다.

나는 이미 선인장을 사용하고 있으며 nagios (물론 그렇지는 않지만) 또는 munin을 설정할 수 있지만 개별 프로그램 사용을 기록 할 수없는 한 전체 상태 만 알 수 있습니다.

30 초마다 >>의 파일로 스크립트를 롤링 할 수 있지만 기존의 성숙한 솔루션이 이미 존재하는지 확인하고 싶습니다.

다시 말하지만 이상적으로는 다음과 같습니다.

  • N 초마다 프로세스의 메모리 사용량 기록
  • N 초마다 프로세스의 CPU 사용량 기록
  • 지원 차트 및 기록
  • 지원 평균-mysqld가 마지막 날에 43 %의 CPU를 사용했으며 평균 400MB 메모리
  • 자유롭고 오픈 소스입니다

프로세스 이름은 미리 알 수 없으며 미리 알려서는 안됩니다. 아이디어는 프로세스를 모니터링 한 다음 최상위 위반자를 살펴 보는 것입니다.

내 시스템은 Linux (OpenSUSE)입니다.



답변

최고의 가해자 만 원한다면 top배치 모드에서 비교적 긴 간격 (60 초 플러스)으로 실행 하는 것을 고려 하십시오. top여러 리소스에서 최고 위반자를 캡처 하려면 둘 이상의 실행 이 필요할 수 있습니다 . top리소스를 과도하게 사용했을 때 몇주기 동안 시스템이 실행되도록 구성했습니다 .

sar리소스 사용률을 캡처하려면 배치 모드로 실행하는 것이 좋습니다. 나는 이것이 서버 기반이라는 것을 알고 있지만 문제가 발생하는 시간을 결정하는 것이 유용합니다.

munin알림을 실행 하고 활성화합니다. 그러면 서버가 다운되는 것을 볼 수 있습니다. 다운되기 전에 문제점을 정정 할 수 있습니다.

메모리 누수의 경우 스왑 사용량이 꾸준히 증가하면 문제가 있음을 나타냅니다. 한때 서버가 며칠 동안 천천히 죽는 것을 보았습니다. 문제 서비스는 메모리 누수에 대한 다른 프로세스를 모니터링하는 프로그램이었습니다. 시스템 관리자는 서버가 응답을 멈출 때까지 스왑 사용량 증가가 문제가되지 않았다고 계속 주장했습니다.

당신은 찾을 수 cfengine의 이상 탐지하는 일이 잘못되면 시스템 상태를 캡처하는 스크립트를 실행하는 데 사용할 수 있습니다. 가장 많은 리소스를 사용하는 프로세스 외에 많은 정보가 필요할 수 있습니다. 갑작스런 사용으로 인해 이름이 아닌 주소별로 네트워크 연결 목록이 필요할 수 있습니다. 메모리 사용량도 유용합니다.


답변

sysstat 는 당신의 목적을 위해 거의 정확하게 만들어졌습니다.


답변

나는 전에 꼭대기에 사용했다 :

http://freshmeat.net/projects/atop/

“맨 위에는 모든 프로세스의 활동 (간격 동안 프로세스가 완료된 경우에도), 시스템의 매일 로깅 및 장기 분석을위한 프로세스 활동을보고 할 수있는 ASCII 전체 화면 성능 모니터가 있습니다. 색상, 등. 정기적으로 CPU, 메모리, 스왑, 디스크 및 네트워크 계층과 관련된 시스템 수준의 활동을 보여 주며 모든 활성 프로세스에 대해 CPU 사용률, 메모리 증가, 우선 순위, 사용자 이름, 상태, 코드를 종료합니다. “


답변

당신은 수집을 시도 했습니까?
매우 강력하고 사용자 정의 할 수 있습니다.
많은 플러그인이 있으며 nagios와 통합 될 수 있습니다.

http://collectd.org/features.shtml


답변

Nagios 상단의 Centreon, Nagios는 NRPE와 결합되었습니다. 그런 다음 NRPE에 원하는 형식으로 데이터를보고하는 사용자 지정 스크립트를 작성할 수 있습니다. 그런 다음 Nagios는 NRPE를 사용하여 원격 서버의 데이터를 폴링하고 Centreon은 예쁜 그래프를 만들고 많은 사용자 유연성을 추가합니다. 우리는 http://beyondhosting.net 에서 그것을 사용 합니다. 원한다면 centeron + nagios 설정이있는 VZ 컨테이너 템플릿이 있습니다.

그래프 centeron은 hostthenpost.org/tyler/2010-07-23_1719.png를 빌드합니다.


답변

nmon 은 당신이 찾고있는 것을하는 훌륭한 도구입니다. AIX 및 Linux 용으로 개발되었습니다. 많은 상세 출력을 생성하고 보고서에 쉽게 넣을 수 있습니다. Google을 사용하는 경우 데이터 구문 분석을위한 많은 문서 및 추가 유틸리티가있는 IBM 위키가 있습니다.


답변

서버 밀도 는 사용자가 설명한대로 정확하게 수행합니다.

프로덕션 서버 중 하나에서 사용하고 매우 기쁘게 생각합니다. 가장 큰 특징은 차트를보고, 피크를 클릭하고, 실행중인 모든 프로세스를 포함하여 현재 시간에 서버 CPU / 메모리 소비를 볼 수있는 기능입니다. 그들은 그것을 스냅 샷 이라고 부릅니다 .

끊임없이 개선되고 있습니다. 최신 기능 중 하나는 이상 감지로 , 이상 을 쉽게 감지 할 수 있습니다. 다양한 트레스 홀드를 설정할 수도 있습니다