check_ganglia_metric ay isang Nagios plugin na nagbibigay-daan sa iyo upang ma-trigger ang mga alerto sa anumang Ganglia sukatan.
check_ganglia_metric ay mabigat inspirasyon ng check_ganglia_metric.php Vladimir Vuksan, ngunit ito ay may bilang ng mga pagpapabuti.
Pag-install
# PIP install check_ganglia_metric
... O:
# Easy_install check_ganglia_metric
Ganglia Configuration
Maliban kung ang iyong Nagios server at Ganglia Meta demonyo ay tumatakbo sa parehong host, malamang na kailangan mong i-edit ang iyong gmetad.conf upang payagan ang mga remote na koneksyon mula sa iyong Nagios server.
Upang payagan ang mga koneksyon mula sa nagios-server.example.com:
trusted_hosts nagios-server.example.com
Upang payagan ang mga koneksyon mula sa lahat ng mga host (marahil sa panganib ang seguridad):
all_trusted sa
Pagsubok sa Command Line
Una, tingnan natin kung check_ganglia_metric maaaring makipag-ugnay sa Ganglia Meta diyablo:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Katayuan Ok, CPU Idle = 99.3% | cpu_idle = 99.3% ;;;;
Ang mensahe na "Ok Katayuan" ay nagpapahiwatig na check_ganglia_metric ay gumagana. Kung nagkakaroon ka ng problema sa pagkuha ng ito sa trabaho, subukang muli gamit ang maligoy na pag-log pinagana (--verbose) upang makakuha ng mas mahusay na pananaw sa kung ano ang nangyayari mali.
Ngayon subukan ang pagtatakda ng isang limitasyon ng alerto ipaalam:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Katayuan Kritikal, CPU Idle = 99.6% | cpu_idle = 99.6% ;; 99 ;;
Sinabi namin check_ganglia_metric upang magbalik ng katayuan "Kritikal" kung ang Idle CPU ay mas malaki kaysa sa 99. Ang mensaheng "Kritikal Katayuan" ay nagpapahiwatig na ito ay nagtrabaho. Tandaan na check_ganglia_metric Pina-parse ng mga saklaw at mga limitasyon ayon sa mga opisyal na alituntunin pagbuo ng plugin Nagios.
Upang makita ang isang kumpletong listahan ng mga pagpipilian sa linya ng command na may maikling pagpapaliwanag, patakbuhin check_ganglia_metric sa --help opsyon.
Nagios Configuration
Una, lumikha ng isang kahulugan ng command:
tukuyin ang utos {
& Nbsp; command_name check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ $ ARG3
}
Ngayon ay maaari mong gamitin ang command sa itaas sa iyong mga kahulugan ng serbisyo:
tukuyin ang serbisyo {
& Nbsp; service_description idle CPU - Ganglia
& Nbsp; paggamit some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!!
& Nbsp; HOST_NAME host.example.com
}
Ito ay gagana fine hanggang sa isang bagay na napupunta mali sa check_ganglia_metric (eg ang file ng cache ay hindi mababasa / nakasulat na, hindi maaaring umabot na sa Ganglia Meta demonyo, atbp). Sa puntong iyon, ang bawat serbisyo na umaasa sa check_ganglia_metric ay mabibigo, na posibleng inundating sa iyo ng mga alerto. Maaari naming pigilan ito sa pamamagitan ng paggamit ng mga dependency serbisyo.
Ang unang bagay na kailangan namin ay isang command na kahulugan para sa pagsuri sa edad na ang isang file:
tukuyin ang utos {
& Nbsp; command_name check_file_age
& Nbsp; command_line / usr / Lib / nagios / plugin / check_file_age -f $ ARG1 $ -w $ ARG2 $ -c $ $ ARG3
}
Sunod, tukuyin kami ng isang serbisyo na sumusuri sa edad na file ng cache check_ganglia_metric iyon. Tandaan na upang maging tunay na epektibo, kailangan ng serbisyong ito na mai-check ng hindi bababa sa bilang (mas maganda kung higit pa) madalas kaysa sa lahat ng iba pang mga tseke na umaasa sa check_ganglia_metric:
tukuyin ang serbisyo {
& Nbsp; service_description Cache para sa check_ganglia_metric
& Nbsp; paggamit some_template
& Nbsp;!!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; HOST_NAME localhost
& Nbsp; check_interval 1
& Nbsp; max_check_attempts 1
}
At sa wakas,-set up namin ang aktwal na dependency serbisyo. Tandaan na pinagana ko ang use_regexp_matching sa Nagios, na nagbibigay-daan sa akin upang gamitin ang regular na mga expression sa aking mga kautusan. Sa pamamagitan ng nananatili ang "- Ganglia" sa dulo ng bawat serbisyo na umaasa sa check_ganglia_metric, ang maaari kong i-save ang aking sarili ng maraming pagsisikap:
tukuyin ang servicedependency {
& Nbsp; HOST_NAME localhost
& Nbsp; service_description Cache para sa check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - Ganglia $
& Nbsp; execution_failure_criteria c, p
}
Ngayon kung may mangyaring hindi tama sa check_ganglia_metric, ipapadala alerto isa lamang ang tungkol sa file ng cache, at Ipo-pause ang lahat ng mga umaasang mga pagsusuri serbisyo hanggang sa maayos ang problema na sanhi check_ganglia_metric sa mabibigo. Kapag ang problema ay naayos na, kakailanganin mong i-update ang timestamp sa file ng cache upang ilagay ang "Cache para sa check_ganglia_metric" service pabalik sa isang estado OK (na magbibigay-daan sa umaasa sa mga pagsusuri ng serbisyo upang magpatuloy):
& Nbsp; pindutin /var/lib/nagios/.check_ganglia_metric.cache
Mga Tip at Trick
Posible upang makakuha ng isang kumpletong listahan ng mga magagamit na mga host at mga sukatan sa pamamagitan ng pagpapagana "higit pa masyadong masalita" pag-log (-vv). Dahil ang metric_host at METRIC_NAME mga pagpipilian ay kinakailangan, mayroon kang ilang sandali ng isang "manok at itlog" problema dito, ngunit iyan ay OK. Magbigay lamang ng ilang dummy data. Ay error ang plugin sa dulo ng "host / sukatan ay hindi nahanap" error, ngunit hindi bago ito kalumbayan cache nito:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = dummy --metric_name = dummy -vv
Ano ang bagong sa paglabas:
- Magdagdag - -metrics_max_age pagpipilian
- Pagsamahin ang CHANGELOG.rst sa README.rst
Mga Kinakailangan :
- Python
- Nagios
Mga Limitasyon :
- Hindi gumana sa Python 2.4
Mga Komento hindi natagpuan