alertes par courrier électronique en cas d'erreurs système graves

Je récupérais syslog sur un server pour les erreurs et j'ai remarqué ces lignes qui n'avaient rien à voir avec ce que je cherchais mais qui alertait assez:

kernel: [8456851.218586] ata2.00: irq_stat 0x08000000, interface fatal error kernel: [8456851.220076] res 50/00:00:80:45:c1/00:00:08:00:00/e0 Emask 0x10 (ATA bus error) 

Comment puis-je être sûr que mes servers m'alerteront avec un e-mail lorsque des erreurs similaires se produisent? J'ai besoin d'au less attraper toutes les erreurs de lecteur (quand il s'agit de server H / WI doivent faire face à des interruptions d'alimentation et des pannes de disque dur plus que toute autre chose). Cependant, toute autre chose qui a de fortes chances d'indiquer un échec à venir est digne d'un e-mail aussi longtime que je ne reçois pas trop de faux négatifs que je cesse de regarder attentivement dans ces e-mails.

J'utilise logcheck pour parsingr mes files journaux. Il parsing les nouvelles inputs une fois par heure et m'envoie des lignes inconnues ainsi que des lignes connues qui sont classées dans le rapport.

Il existe également des outils qui vont regarder vos files journaux et vous envoyer un e-mail quand ils sont certains contenus.

J'utilise le module ommail dans rsyslog . La configuration est simple, vous pouvez utiliser plusieurs servers smtp pour envoyer vos e-mails d'alerte (en tant que basculement):

 $template mailSubject,"EMERGENCY:" $template mailBody," %$NOW% %timereported:8:15% %programname%: %msg%\n" $ActionMailSMTPServer mail1.example.com $ActionMailFrom [email protected] $ActionMailTo [email protected] $ActionMailSubject mailSubject $ActionExecOnlyOnceEveryInterval 60 *.emerg :ommail:;mailBody # begin backup action, carried out if primary fails $ActionExecOnlyWhenPreviousIsSuspended on $ActionMailSMTPServer mail2.example.com $ActionMailFrom [email protected] $ActionMailTo [email protected] $ActionExecOnlyOnceEveryInterval 60 &