Projet de fin d études

(1)

Projet de fin d’études – Chausson Frédéric

1

Projet de fin d’études

Outil de supervision

Fully Automated Nagios

Chausson Frédéric 2007 - 2009

(2)

2

Remerciements

Je tiens à remercier Monsieur VEZIGNOL Laurent (Chef opérationnel sur la deuxième partie de mon alternance) ainsi que Monsieur GUIMONT Jean Luc (Chef opérationnel sur la première partie de mon alternance) de m’avoir accueilli au sein de l’UP informatique de la gare SNCF de Bordeaux durant ces deux années d’alternance. Je remercie également mes deux tuteurs Monsieur MARTINAT Sébastien et Monsieur SAUMITOU Guy ainsi que l’ensemble du personnel informatique qui m’a suivi, aidé et appris de nombreuses choses durant ces deux ans .

Expériences acquises

CESI

Durant ces deux années que j’ai passé au cesi j’ai énormément appris dans le monde de

l’informatique et ainsi j’ ai augmenté mes connaissances. Le fait de faire de l’alternance renforce ces acquis et permet de les utiliser dans le monde du travail. Lorsque nous avons cours, nous étudions un seul domaine à la fois chaque semaine : Windows, Word, Excel, Linux, html, PHP… Ce qui permet d’approfondir les connaissances et de retenir un maximum d’informations.

SNCF

Etre alternant (1 semaine de cours, 3 semaines en entreprise) est une opportunité d’appliquer ce que l’on nous enseigne en cours apprends en cours mais aussi d’apprendre de nouvelles méthodes de travail, cela permet de travailler en équipe, d’être autonome et de développer le sens de la

communication. En entreprise on nous donne des responsabilités, on nous apprends à respecter les règles de travail et de sécurité et ainsi à devenir un employer de l’entreprise à part entière.

(3)

3

Sommaire 3

Présentation du candidat 6

L’entreprise 7

Présentation de la SNCF 7

Historique 7-8

Activités 8

Evolutions économiques 8

Unité de Production informatique 9

Organigramme 10

Ma position et mes activités dans l'entreprise 11

Projet 12

Étude du projet 12

Situation actuelle 12

Intérêt des outils de supervision (Monitoring) 12

Outils de supervision déjà en place 13

Besoin des utilisateurs 14

Problématique 14

Cahier des charges 15

Plannings 16

Étude de solutions 17

Liste des solutions existantes 17

Présentation des solutions 17-18

Comparaison des solutions 18

Choix final 18

(4)

4

Présentation de la solution Fan 19

Descriptif 19

Nagios, Plugins/Addons 19-20

Protocole SNMP 21

Principe de fonctionnement 22

Choix du matériel 23

Serveur 23

Caractéristiques 23

Coût 23

Système d'exploitation 24

Vmware ESX 24

Linux 24

Installation et mise en place 25

Vmware ESX 25

Linux, Suite Full Automated Nagios 26-31

Interface et prise en main 32

Nagios 33-40

Centreon 40-44

Nagvis 45-48

Bilan 49

Résultats 49-51

Soucis rencontrés 52

Impacts de la mise en place de la solution 52

Conclusion personnelle 52

Lexique 53

Annexes 54

Configuration CentOS + Fan (Procédures) 55-91

(5)

5

(6)

6

Présentation du candidat

(7)

7

L’entreprise

Présentation de la SNCF

La Société nationale des chemins de fer français (SNCF) est l'une des principales entreprises publiques françaises, centrée sur le transport ferroviaire

Sa forme juridique est celle d'un établissement public à caractère industriel et commercial (EPIC), qui par ailleurs détient des participations majoritaires ou totales dans des sociétés de droit privé regroupées dans le groupe SNCF. L'EPIC, employant près de 166 000 personnes début 2007 pour un chiffre d'affaire de 17 milliards d'euros, exerce une double activité :

- Entreprise ferroviaire chargée de l'exploitation commerciale de services de transport ferroviaire de voyageurs et de marchandises, d'une part ;

- Exploitation et maintenance, pour le compte de RFF, du réseau ferré national français, d'autre part.

La SNCF exploite environ 32 000 km de lignes, dont 1 850 km de lignes à grande vitesse (juin 2007) et 14 800 km de lignes électrifiées. Elle fait circuler en moyenne 14 000 trains par jour. Par son volume d'activité, c'est la deuxième entreprise ferroviaire de l'Union européenne après la Deutsche Bahn. Depuis le 21 février 2008, son président est Guillaume PEPY en remplacement d’Anne-Marie Idrac. Le siège de la SNCF se situe à Paris

Historique

Les premières lignes de chemins de fer sont mises en service en France au début du 19ème siècle. L'Etat attribue le droit de construire et d'exploiter, à des compagnies privées, qui financent la construction des lignes et supportent les risques financiers liés à leur exploitation. L'Etat exerce aussi une surveillance des tarifs ferroviaires, considérant que les compagnies assurent le service public.

Sous le Second Empire, la France se couvre de voies ferrées, toutes les grandes lignes sont construites et les grandes villes de France sont reliées à Paris. Mais en raison de difficultés financières l'Etat est amené à intervenir dans la gestion des chemins de fer.

La grande crise de 1929 compromet définitivement les chances de redressement des compagnies. L'Etat décide alors de nationaliser les chemins de fer : la convention du 31 août 1937 crée pour une durée de 45 ans, à partir du 1^ier janvier 1938, une "Société Nationale des Chemins de Fer français", la SNCF.

La SNCF de 1938 est une société anonyme d'économie mixte dont l'état possède 51% du capital. Ce n'est que le 31 décembre 1982, date à laquelle la convention arrive à expiration que l'ensemble de la SNCF revient à l'état, qui la dote d'un nouveau statut. Elle devient un Etablissement Public à caractère Industriel et Commercial (EPIC). Un cahier des charges et des "contrats de plan" pluriannuels règlent l'ensemble des relations entre l'Etat et l'entreprise.

(8)

8 En 1997, un nouvel Etablissement Public national à caractère Industriel et Commercial est créé : Réseau Ferré de France (RFF). Il devient propriétaire du réseau ferré national et reprend la dette de la SNCF. Endettement qui était lié au développement et la modernisation du réseau.

La SNCF assure alors, deux missions distinctes, en étant d'un côté transporteur et exploitant du réseau; de l'autre gestionnaire d'infrastructure.

Activités

La SNCF est un ensemble d’entreprises partenaires qui constituent un groupe puissant de par la complémentarité des services offerts. Elle est l’acteur majeur du transport en Europe.

Chacune de ses sociétés exerce son activité dans une ou plusieurs des branches du groupe : - Transport de voyageurs

- Transports de marchandises (FRET)

- Gestion de l’infrastructure et valorisation du patrimoine et du savoir-faire.

C’est un groupe organisé de façon à offrir un service complet à ses clients (voyageurs, transporteurs, autorités organisatrices du transport public), et ce aussi bien en France qu’à l’étranger.

Evolutions économiques

Le chiffre d’affaire du groupe consolidé est de 20 129 millions d’euros pour l’exercice 2005, contre 19 839 millions pour 2004, soit une progression de prés de 1%. La branche Transport de voyageurs est celle qui contribue le plus au chiffre d’affaires consolidé du groupe, suivi par le Transport de marchandises puis la Gestion de l’Infrastructure.

« Chiffre d’affaire en pourcentage par section »

25%

42%

33%

Infrastructure - Valorisation du patrimoine et du savoir faire

Transport de voyageurs

Transport de marchandises

(9)

9

Unité de Production informatique

L’Unité de Production informatique (UPI*) joue le rôle de « société de services » répondant aux besoins informatiques des établissements que l’on peut assimiler à des entreprises. Elle est composée de 4 secteurs :

- Groupe Technique (GT) : Ce secteur assure la gestion des serveurs (ressources, impressions, DHCP…), la gestion des comptes utilisateurs (Création des comptes, création des boites mails…) et des équipements réseau (Switch, routeurs…). Il a également en charge des projets proposés par la DSIT*. Cependant, il peut être amené à gérer des projets internes .

- Secteur Nord et secteur Sud : Ces deux secteurs ont les mêmes objectifs et les mêmes travaux sauf qu’ils ne s’occupent pas du même secteur. Le secteur Sud s’occupe des interventions informatiques à l’intérieur de la gare st Jean, de la

direction et du sud Aquitaine(Intra-muros). Le secteur Nord (Extra-muros) est chargé d’intervenir sur le reste des installations de Bordeaux, Gironde, Lot et Garonne, Dordogne et Poitou Charente. Ils ont pour mission de déployer les applications nationales ou locales, l’installation et la maintenance des ordinateurs ainsi que d’aider les utilisateurs à prendre en main leurs nouveaux outils de travail.

- Hotline : elle est chargée de répondre aux demandes d’assistance des utilisateurs, de les dépanner à distance ou de transmettre l’intervention au secteur concerné.

*Nb : tous les mots suivis d’une étoile (*) sont définis dans le lexique (page 53)

(10)

Projet de fin d’études

Organigramme

Assistant Directeur Up informatique A. Lacave

Directeur Up informatique L. Vezignol

Technico-Admin L. Sicaud

Assistant Directeur Up informatique Hotline

P. Richard F. Cabanac

Directeur Up informatique

Groupe technique

Responsable- G. Saumitou Assistant- E. Cattarin

M. Bouyou B. Lassale S. Etchelecou J.F Fleury

Secteur Sud Responsable- F. Berge Assistant- Ch. Pascouau

A. Agar B. Chaptal M. Marque J.J. Mesplede K. Marugan G. Larregaray

Secteur Nord Responsable- S. Martinat Assistant- E. Lacour

C. Engels P. Bazin S. frere G. Arnaudet B. Beaujoin Alternant- F. Chausson

10 Groupe technique

G. Saumitou E. Cattarin

S. Etchelecou

Secteur Sud F. Berge Ch. Pascouau

J.J. Mesplede G. Larregaray

Secteur Nord S. Martinat

F. Chausson

(11)

11

Ma position et mes activités dans l’entreprise

Depuis ma rentrée en septembre 2007, je suis arrivé au secteur Nord (Extra-muros).

En tant que Technicien informatique, je suis chargé :

- De prendre connaissance des fiches d’intervention demandées sur mon secteur qui sont transmises par le biais d’intranet,

- De traiter la demande ou de faire intervenir la personne compétente si la demande n’est pas dans mon champ de compétence ou d’autorisation,

- De clôturer les fiches d’intervention lorsque l’incident est réglé.

Mon travail se compose de plusieurs tâches :

- Diagnostiquer des pannes (BSOD* ordinateur qui rame, plante, changements de pièces…).

- Installer et configurer des nouveaux postes (fixes ou portables).

- Paramétrer des comptes utilisateurs (Outlook, documents, pda*, téléphones…).

- Installer des applications régionales ou locales.

- Dépannages informatiques à distance (Avec le logiciel DameWare).

- Maintenance des serveurs d’impression et Active Directory (ajouts/suppression d’utilisateurs et d’ordinateur).

- Faire de la Hotline afin d’aider les utilisateurs et de créer des fiches d’interventions.

Pour réaliser mon projet de fin d’études, j’ai changé de secteur et je suis passé au Groupe Technique où j’ai collaboré au projet de mise en place d’un serveur.

(12)

12

Projet

Etude du projet

Situation actuelle

Actuellement plusieurs outils de supervision sont utilisés pour le réseau (Switch, routeurs…) et les serveurs. En cas de panne d’un équipement, de nombreuses remontées d’alarmes (souvent redondantes) doivent être traitées et triées par les administrateurs. Les indications données par ces outils sont parfois peut précises.

Intérêt des outils de supervision (Monitoring)

De nos jours les systèmes d’informations sont devenus des éléments clés pour les

entreprises, ils deviennent de plus en plus complexes, vastes et importants, ce qui demande énormément de temps pour la gestion et la maintenance. C’est pourquoi un outil de

supervision devient nécessaire pour accompagner les administrateurs et techniciens réseaux afin de leur simplifier la tâche.

Lorsqu’un service ou une connexion réseau cesse de fonctionner, ils doivent le plus rapidement possible prendre les dispositions nécessaires, pour rendre de nouveau le système opérationnel car l’arrêt ou la panne d’un système peut mobiliser plusieurs

personnes, surtout à la SNCF. Ces outils sont la pour anticiper et réagir au plus vite dans ces moments de conflits. Ils nous renseignent et nous aident pour :

- Résoudre des problèmes qui auraient pu être détectés plus tôt.

- Tenter de déterminer l’importance et la priorité des événements et leurs causes principales.

- Rechercher l’information nécessaire pour résoudre le problème.

- Nous avertir au plus vite afin de résoudre les soucis les plus paralysants.

Le principe du « monitoring » est d’anticiper les problèmes pour tenter d’y remédier avant l’arrêt d’un service ou du moins minimiser le temps de restauration du service. Mais aussi d’avoir une vue quasi temps réel du système d’information. Une plate-forme de supervision est un outil indispensable pour une entreprise dotée d’un grand parc informatique car l’arrêt d’un service ou matériel peut avoir des conséquences financières assez importantes.

Exemple, si un serveur qui gère les trains, tombe en panne il faut réagir au plus vite car les dégâts peuvent être très importants.

(13)

13 Outils de supervision déjà en place

Les logiciels présents dans le service informatique qui servent à superviser les équipements on été choisis et imposés au niveau national (contrat cadre national, ils généralisent pour un moindre cout)

Pour le réseau :

Console enterasys : Gère tous les équipements enterasys en supervision et aussi en administration (console)

Console 3com : Gère tous les équipements 3com en supervision et aussi en administration (console)

Système :

HP Insight Manager : Outil de supervision serveurs, qui vérifie entre autre l’état des services, la connectivité du serveur… etc.

Divers scripts : Des scripts mis en place pour savoir si un serveur est connecté ou en erreur réseau, si oui un mail est envoyé à l’administrateur afin qu’il en soit averti

(14)

14 Besoin des utilisateurs

Les utilisateurs souhaiteraient avoir une seule et même interface pour superviser les équipements :

- Plus simple et plus précise dans la remontée des erreurs.

- Un plan du réseau + une indication en temps réel sur l’état du réseau.

- La supervision de services (DHCP, Dns…)

- La supervision matérielle des serveurs (Mémoire, CPU, Disques…)

Problématique :

Tous les logiciels actuels envoient une remontée d’alerte

- Ces notifications peuvent être floues et demander une recherche approfondie des pannes, voir un déplacement physique sur le site.

- Il y a donc trop de notifications similaires mais qui n’arrivent pas du même logiciel, ce qui rend la tâche difficile pour trouver d’où vient réellement le problème.

- Certains services ne sont pas remontés en erreur à certains moments, on ne peut pas savoir précisément si la panne est matérielle ou logicielle.

(15)

15 Cahier des charges

Fonction principale 1 : L’outil de supervision devra être complet.

- Un seul et même outil pour la supervision Fonction principale 2 :

L’interface devra être simple.

- Une seule et même interface pour la supervision.

Fonction principale 3 : L’outil devra envoyer des alertes via emails.

- Les emails alertent rapidement pour une intervention spontanée Fonction principale 4 :

L’outil devra superviser les services des serveurs.

- Des services comme le DHCP ou le DNS.

Fonction principale 5 :

L’outil devra représenter une cartographie du réseau.

- Une interface simple pour les administrateurs et les techniciens.

Contraintes :

- Le système devra être en place avant fin juillet.

- Le système devra être opérationnel 24 heures/24 - 7 jours/7.

- La mise en production ne doit pas provoquer de coupure pour les outils déjà présents.

- L’outil devra être évolutif

Plannings (Voir page ci après)

(16)

Projet de fin d’études – Chausson FrédéricChausson Frédéric

16

(17)

17

Étude de solutions

Liste des solutions existantes

Plusieurs solutions peuvent être mises en place, qu’elles soient gratuites ou payantes. Elles ont plus ou moins de possibilités, de compatibilités matérielles, d’évolution future. On peut retrouver des logiciels payants comme Scom (Microsoft System Center Operation Manager) ou bien des gratuits comme Nagios.

Présentation des solutions

Scom : Développé par le géant Microsoft, Scom est un programme de supervision réseau qui permet le monitoring des différents équipements grâce à une interface logicielle.

Principales caractéristiques :

- Automatisation du déploiement des stratégies de surveillance pour les systèmes et applications installés.

- Collecte des événements applicatifs, systèmes et compteurs de performances.

- Surveillance avec corrélation de ces éléments et des alertes proactives.

- Collecte d'audit des journaux d'événements sécurité.

- Fonctions de création de rapports et d'analyse.

- Des tâches et des connaissances personnalisables associées à certaines alertes ou applications.

- Intégration complète de PowerShell, nouveau langage de script des systèmes Windows.

- Avoir des Informations précises sur l'état des serveurs et générer en temps réel des alertes.

- Concentrer la surveillance des systèmes d'information en un produit unique de supervision.

- Obtenir la visibilité nécessaire pour assurer la protection des renseignements et surveiller son environnement.

- Améliorer l'efficacité des opérations informatiques via des pratiques éprouvées intégrées dans les packs d'administration.

- Générer des rapports sur les niveaux de services et de performances afin d'aider à analyser l'état de fonctionnement du SI.

- Permettre de générer des tableaux de bord et rapports sur l'historique du fonctionnement des serveurs et objets managés.

(18)

18 FAN (Full Automated Nagios) : Développé par la communauté libre de linux FAN est un cd automatisé qui regroupe tous les outils pour mettre en place une suite de logiciels de supervision (Nagios, Centreon, Nagvis…) fonctionnant sous linux.

Principales caractéristiques :

- Une Surveillance des services réseau (SMTP, POP3, HTTP, PING...).

- Une Surveillance des ressources des hôtes (charge processeur, utilisation des disques, charge mémoire…).

- Création de graphiques via SNMP et l’application RRD.

- Alertes par le biais d’emails ou sms.

- Une Parallélisation de la vérification des services afin de limiter la charge CPU - Une collecte d'audits des journaux d'événements sécurité.

- Des tâches et des connaissances personnalisables associées à certaines alertes ou applications.

- Une Possibilité de définir la hiérarchie du réseau en utilisant des hôtes "parents", ce qui permet la détection et la distinction entre les hôtes qui sont à l’arrêt et ceux qui sont injoignables.

- Avoir des Informations précises sur l'état des serveurs et générer en temps réel des alertes.

- Concentrer la surveillance des systèmes d'information en un produit unique de supervision.

- Permettre de générer des tableaux de bord et rapports sur l'historique du fonctionnement des serveurs ou équipements managés.

Comparaison des solutions

Scom Nagios

Prix élevé. Gratuit et Open Source.

Difficultés pour gérer les licences. Pas de gestion des licences.

Pas de monitoring pour les matériaux et produits non Microsoft (Switch, serveurs…).

Possibilité de monitoring pour tous les matériaux, avec l'adresse IP.

Pas de cartographie. Cartographie complète grâce à Nagvis.

Aucune évolution logicielle. Plugins, Addons, Scripts, communauté libre…

Choix final

Notre choix final s’est porté sur une solution gratuite, vaste et qui a des possibilités d’évolutions futures.

(19)

Présentation de la solution

Descriptif

Fan a été crée dans le but de réunir tous les outils les plus utilisés dans la communauté Nagios. Elle se présente sous forme de format

l’installer sur n’importe quel serveur/machine. L'installation installe une distribution linux sans interface graphique (CentOS

(Centreon, Nagvis, Nareto…).

Nagios, Plugins/Addons

Nagios (Anciennement appelé Netsaint) et une application l

supervision réseaux fonctionnant sur la plateforme qui permet de remonter les éventuels problèmes dans le parc informatique de manière rapide et spontanée. Il effectue

contrôles intermittents sur les hôtes et services en utilisant des plugins externes qui retournent un statut d'état à N

de plusieurs manières : Email, SMS, Messagerie

place ce qui facilite la lecture, et la supervision de n'importe quel poste (Avec une authentification lors de la connexion

perfectionnent et le rendent encore plus compatibles ave d'être bien plus performant pour la supervision. Il permet donc

[x] Superviser des services réseau : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP, etc [x] Superviser les ressources des serveurs (charge du processe

durs, utilisation de la mémoire paginée) sur la plupart des systèmes [x] Interface avec le protocole SNMP.

[x] La supervision à distance peut utiliser [x] La vérification des services se

[x] Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre un serveur en panne et un serveur injoignable.

[x] La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins [x] Acquittement des alertes par les administrateurs.

[x] Gestion des escalades pour les alertes.

[x] Limitation de la visibilité, les utilisateurs peuvent avoir un accès limité à quelques éléments.

[x] Capacité de gestion des oscillations (nombreux passages d d'erreur dans un temps court).

Présentation de la solution Fan

été crée dans le but de réunir tous les outils les plus utilisés dans la communauté Nagios. Elle se présente sous forme de format ISO* qui est bootable* afin de pouvoir l’installer sur n’importe quel serveur/machine. L'installation installe une distribution linux

CentOS) ainsi que tous les packages et outils associés à Nagios

Nagios, Plugins/Addons

é Netsaint) et une application libre (sous licence GPL

supervision réseaux fonctionnant sur la plateforme qui permet de remonter les éventuels problèmes dans le parc informatique de manière rapide et spontanée. Il effectue

contrôles intermittents sur les hôtes et services en utilisant des plugins externes qui

d'état à Nagios (4 états voir ci après). Il peut envoyer des notifications de plusieurs manières : Email, SMS, Messagerie instantanée, etc... Une interface Web est en place ce qui facilite la lecture, et la supervision de n'importe quel poste (Avec une

lors de la connexion.) Il peut être complété de nombreux plug

encore plus compatibles avec certains matériels, et qui permet d'être bien plus performant pour la supervision. Il permet donc de :

[x] Superviser des services réseau : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP, etc [x] Superviser les ressources des serveurs (charge du processeur, occupation des disques durs, utilisation de la mémoire paginée) sur la plupart des systèmes d’exploitation

[x] Interface avec le protocole SNMP.

[x] La supervision à distance peut utiliser SSH* ou un tunnel SSL*.

[x] La vérification des services se fait en parallèle.

[x] Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre un serveur en panne et un serveur injoignable.

[x] La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins Acquittement des alertes par les administrateurs.

[x] Gestion des escalades pour les alertes.

[x] Limitation de la visibilité, les utilisateurs peuvent avoir un accès limité à quelques [x] Capacité de gestion des oscillations (nombreux passages d'un état normal à un état d'erreur dans un temps court).

19 été crée dans le but de réunir tous les outils les plus utilisés dans la communauté

afin de pouvoir l’installer sur n’importe quel serveur/machine. L'installation installe une distribution linux

et outils associés à Nagios

licence GPL*) de supervision réseaux fonctionnant sur la plateforme qui permet de remonter les éventuels problèmes dans le parc informatique de manière rapide et spontanée. Il effectue des contrôles intermittents sur les hôtes et services en utilisant des plugins externes qui

voir ci après). Il peut envoyer des notifications ne interface Web est en place ce qui facilite la lecture, et la supervision de n'importe quel poste (Avec une

de nombreux plug-ins qui le c certains matériels, et qui permet

[x] Superviser des services réseau : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP, etc…).

ur, occupation des disques d’exploitation.

[x] Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre [x] La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins

[x] Limitation de la visibilité, les utilisateurs peuvent avoir un accès limité à quelques 'un état normal à un état

(20)

20 [x] Chaque test renvoie un état particulier :

1. OK (tout va bien)

2. WARNING (le seuil d'alerte est dépassé) 3. CRITICAL (le service a un problème)

4. UNKNOWN (impossible de connaître l'état du service) Plugins/Addons :

Les plugins ou addons sont des programmes qui sont ajoutés en complément de nagios, ils ajoutent des nouvelles fonctionnalités et apportent un confort dans la supervision.

• Centreon (Anciennement appelé Oreon) : Interface Web pour Nagios.

Une interface multi-utilisateur intuitive et personnalisable.

Une interface de configuration évoluée.

Une gestion de tous les fichiers de configuration de Nagios.

Un module de chargement de configuration de Nagios.

Une compatibilité Nagios 1.x, Nagios 2.x, Nagios 3.x

Des fiches d'identités serveurs/équipements réseau regroupant les informations de base sur ces types de ressource.

Des représentations graphiques personnalisables.

Une gestion des accès très sécurisée et personnalisable.

Un système de modules qui permet l'inclusion d'autres applications.

Un compte-rendu complet sur les incidents.

Un système de calcul de la qualité de service en temps réel avec alerte en cas de diminution de la qualité de service.

Une cartographie Java pour une vision simplifiée de l'état du système d'information.

• Nagvis : Module qui permet de créer des Schémas de la supervision. Il est possible de coupler Nagvis à un Schéma réseau et ainsi mettre en relation les données de Nagios en temps réel sur le schéma.

• NDOUtils : stocke les données Nagios dans une base MySQL.

• NRPE : Mécanisme qui permet d'exécuter des commandes sur les machines

« monitorées » et envoyer les résultats sur Nagios.

• Nareto (Nagios Reporting Tools) : Interface de haut niveau à Nagios. Nareto se base sur les informations de Nagios pour fournir des vues de plus haut niveau pour différents utilisateurs (On définit les limites de vue pour chaque utilisateur).

Trois vues sont disponibles : le Temps réel, le Reporting, l'Historique des Alarmes et le Suivi des Alarmes.

(21)

21 Protocole SNMP

Le protocole SNMP fonctionne sous forme de questions-réponses entre un serveur (dans notre cas Nagios) et des équipements réseau (hôtes) (Serveurs, Switch, Hubs, Ordinateur, routeurs…) ayant ce protocole installé.

Le client peut émettre un message vers le serveur sans nécessiter de réponse : le message visant à alerter l’administrateur d’une défaillance (par exemple, l’espace disque d’un serveur ayant dépassé un seuil défini au préalable par le technicien).

Il peut récupérer toutes sortes d’informations sur l’état actuel d’un équipement réseau. Ces informations sont stockées dans une base de données arborescente appelée MIB (management information base). Ce protocole n’est plus l’unique moyen de supervision : en effet les logiciels de supervision d’aujourd’hui tendent vers l’utilisation d’agents propriétaires afin de remplacer le protocole SNMP et ce dans le but de fournir toujours plus d’informations à l’utilisateur. Cependant le protocole SNMP reste le seul moyen de surveiller l’activité d’équipements réseaux tels que les commutateurs ou les routeurs, étant donné que ces matériaux offrent rarement la possibilité d’installer des logiciels tiers.

(22)

22 Principe de fonctionnement

(23)

23

Choix du matériel

Serveur

Pour le choix du serveur, il m’a été imposé. C’est un serveur qui regroupera plusieurs serveurs (Vmware ESX, voir ci après). Ce type de serveur peut faire fonctionner une dizaine de serveurs simultanément, ce qui permet le gain de consommation d’électricité, de place et de coût final.

Caractéristiques

Type : Serveur

Modèle : HP Prolian DL360 G5

Processeur : Bi-Processeur iXEON Quad-Core X5450 3Ghz 4Mb L2 Mémoire : 32 Gigas PC2-5300F DDR2

Disque dur : 10,4 téraoctets Partition Nagios : 74 Go

2 cartes réseaux 2 ports : 4 Ports 1Gb Coût

(24)

24 Système d’exploitation

Vmware Esx

Vmware Esx est un hyperviseur qui partitionne les serveurs physiques en plusieurs machines virtuelles. Chaque machine virtuelle représente un système complet : processeur, mémoire, réseau, disque dur…

Cela permet un gain de place, d’électricité, de coût et surtout permet une redondance très rapide et quasiment invisible (Une simple copie de l’image vmware et tout re-fonctionne, à condition bien sur d’effectuer des sauvegardes régulières.). Il est compatible avec tous les systèmes d’exploitation existants (Windows, linux, mac, Unix…).

Linux

Pour installer Nagios, il faut obligatoirement un système d’exploitation linux. Pour ce qui est du choix de la distribution (Il en existe énormément), le choix a été rapide du fait j’ai choisi d’installer un système qui regroupe Nagios + plugins (Full Automated Nagios). Le choix a donc été CentOS, une distribution linux basée et crée à partir des sources RedHat. Cette distribution n’a pas d’interface graphique (Avec une interface graphique le serveur serait un peut plus lourd…). Nous pouvons tout de même configurer Nagios et ses addons/plugins via l’interface web.

(25)

25

Installation et mise en place

Vmware ESX

Vmware ESX était déjà en place, nous avons besoin de configurer une partie de Vmware afin de pouvoir intégrer le serveur dans la structure. Je ne détaillerai pas la marche à suivre car je n’ai pas eu le temps de comprendre à 100% l’utilisation et toutes les marches à suivre pour créer une nouvelle machine virtuelle, en voici les caractéristiques :

(26)

26 Linux, Suite Full Automated Nagios

Avant toute chose il faut récupérer et graver l’image ISO du cd FAN (http://fannagioscd.sourceforge.net).

Après avoir booter sur le CD, il faut appuyer sur la touche « entrée » puis il est demandé la langue voulue ainsi que la configuration du clavier mettre comme suivant :

(27)

27 Il faut ensuite s’occuper du partitionnement, une fenêtre s’ouvre ensuite cliquer sur « Oui » :

(28)

28 Pour bien crée les partitionnement il faut les créer en mode manuel : pour cela choisir l’option « Crée un partitionnement personnalisé » :

On sélectionne notre disque et on clique sur « nouveau »

(29)

29 Sur l’espace disque souhaité (En règle générale c’est 1,5 fois la taille de la mémoire physique) on créer la partition « Swap » qui permet de prendre le relais de la mémoire si il n’y en as plus assez :

Puis on créer pour finir la partition dite « ext3 » ou va être installé le système, ne pas oublier « le point de montage « / » » puis on sélectionne « remplir jusqu’a la taille autorisée maximale » qui permet de prendre le reste de la taille du disque.

Une fois validé, on clique sur suivant afin de passer à l’étape finale de l’installation L’installateur « Grub » doit être installé, sinon le système d’exploitation ne sera pas lancé.

(30)

30 Un mot de passe Root est demandé, il sert à prendre le contrôle total de la machine, et à avoir les droits administrateurs afin de faire des modifications système.

(31)

31 L’installation se poursuit et se termine, le serveur démarre…

L’accès à l’interface en ligne de commande est maintenant opérationnel :

(32)

32 Interface et prise en main

Pour avoir accès à n’importe quelle interface (Nagios, Nagvis ou Centreon) il suffit de se connecter sur http://Nom_de_votre_Serveur

On peut accéder aux trois interfaces pour l’utilisation de l’outil de supervision (1).

(33)

33 Nagios :

Avant de pouvoir consulter Nagios une authentification htaccess* est requise

Page d’accueil de Nagios, à gauche le menu qui permet la navigation avec plusieurs menus et sous menus.

(34)

34

« Tactical Overview » permet d’avoir une vue globale sur les statuts des équipements et des services.

Une vue très légère pour avoir un aperçu rapide de l’état réseau.

La partie « Nagvis overview » sera détaillée plus tard car depuis cette interface il est moins agréable (Fenêtre de vision beaucoup plus petite).

« Nareto overview » ne sera pas détaillé car il ne sera pas utile dans notre solution.

« Service detail » montre une vue totale de tous les services que l’on à souhaité superviser, on peut y voir leur statut et un statut avancé pour le service (par exemple le pourcentage d’espace

libre/occupé qu’il reste sur un disque). On peut savoir aussi leur Uptime (Indique depuis quand ils sont UP).

(35)

35

« Host Detail » permet de voir le statut de manière globale de tous les équipements, savoir si ils sont en ligne (UP) ou si ils ont un autre statut (Warning, Critical, Unknown).

« Host Group » et « Service Group » permettent de lister de manière claire les groupes d’équipements et les groupes de services que l’on a crée.

Deux catégories sont présentes :

« Summary » qui montre une liste des groupes d’équipements créée et « Grid » qui montre une liste des groupes d’équipements mais avec les équipements présents dans chaque groupe.

Summary :

(36)

36 Grid :

Pour avoir une vue sur tous les matériaux et services qui ont un souci on peut utiliser les deux catégories « Service Problems » et « Host Problems » (1)

(37)

37 Une partie « Reporting » (1) qui sert de logs* et qui permet de visualiser tous les équipements ou services qui ont eu un problème à un moment précis. Elle se compose de 4 parties :

« Trends » : Sert à créer des graphiques sur une période choisie, pour un équipement ou un service afin de faire un graphique de ses statuts (2).

« Availability » : Permet de donner précisément le/les statuts des équipements et des services par groupes ou séparés sur une période choisie :

(38)

38 La partie « Alerts » regroupe trois parties :

« Histogram » qui permet de faire des graphiques du nombre d’événements (Recovery, Warning, Unknown, Critical) sur une période choisie.

« History » qui regroupe les toutes les alertes positives et négatives qu’il y a eu le jour voulu.

« Summary » fait une liste des 25 alertes les plus critiques sur les matériaux ou services choisis.

(39)

39 La partie « notification » fait une liste de tous les notifications (Dans notre cas notification par email) qui ont été envoyées.

La partie « Event Log » regroupe toutes les notifications de nagios et tous les changements de statuts des équipements.

(40)

40 Centreon :

Une authentification cette fois ci intégrée à l’interface Web en php. Pour des informations plus détaillées voir en Annexes.

(41)

41 Une interface un peu plus conviviale que Nagios :

Le menu qui permet une navigation rapide et aisée (1).

Barre qui regroupe le nombre d’host (équipements) que l’on surveille (2).

Barre qui regroupe les services qui sont surveillés (3).

« Monitoring » permet d’avoir un aperçu sur tous les statuts (Services et Ping) et les logs* de chaque équipement.

(42)

42

(43)

43

« Reporting » permet de faire un graphique (On sélectionne l’équipement sur lequel on veut des informations) par rapport au % de fonctionnement des services ou du statut.

« Centreon Overview » génère des graphiques suivant le service que l’on veut sur la machine voulue.

(44)

44

« Id Cards » remonte les informations SNMP des équipements qui sont en V1, cela est encore utile sur de vieux équipements.

« Configuration » est la partie où l’on ajoute tous les équipements/Services de Nagios, voir les Annexes pour une partie plus détaillée.

(45)

45 Nagvis :

Nagvis est beaucoup plus agréable quand il est lancé depuis la page d’accueil de FAN car il n’y à pas la barre de navigation de Nagios. Un accès htaccess* est requis pour ouvrir l’interface Nagvis. Une fois ouvert on arrive sur une page qui regroupe toutes les cartes que nous avons créées (Pour voir comment en créer, voir les Annexes).

La carte Automap permet de faire une carte automatique en fonction des liens de parenté mises dans centreon.

(46)

46 On peut voir la carte globale de l’aquitaine avec une petite flèche verte (1) qui indique que tous les équipements et les services sont OK sur « Agen » :

(47)

47 Lorsque l’on clique sur la petite flèche on a une vue plus précise de la ville

Si on clique par exemple sur une flèche verte (qui passe rouge quand un service ou un élément cesse de fonctionner). Si on clique sur la salle serveur on peut avoir une vue encore plus précise avec une photo de la salle serveurs par exemple :

(48)

48 Et aussi un détail complet lorsque l’on clique sur la flèche verte « serveur »:

(49)

Bilan

Résultats :

Une fois tous les équipements et les sites insérés sur l’interface Web Nagios on peut voir une grande carte qui regroupe la plupart des sites

Une fois tous les équipements et les sites insérés sur l’interface Web Nagios on peut voir une grande carte qui regroupe la plupart des sites :

49 Une fois tous les équipements et les sites insérés sur l’interface Web Nagios on peut voir une grande

(50)

50 Lorsque l’on clique sur une croix verte, rouge ou orange (La couleur dépend du niveau d’alerte) une autre page s’ouvre et on peut voir une carte plus détail du site :

Pour toutes les salles serveurs une autre vue est disponible en cliquant sur l’icône de la salle : (on peut voir sur la carte une remontée des services disque mémoire et processeur de chaque machines.).

(51)

51 Pour mettre en place tous les sites il a fallu ajouter manuellement tous les Switch, routeurs, et serveurs dans centreon (Il y à environ 700 équipements):

On peut voir ci-dessus des statistiques instantanées en diagramme circulaire (Représenté en %).

Deux tableaux pour les services et les hosts sont aussi présents pour avoir un œil rapide sur tous les équipements.

Dès qu’un équipement tombe ou un problème sur un serveur un email est envoyé du type :

***** centreon Notification *****

Notification Type: RECOVERY Service: Bd_System_Mem Host: Sxxxxxxxx

Address: 10.xx.xx.xxx State: OK

Date/Time: Mon Jul 6 13:13:20 CEST 2009 Additional Info :

Memory usage: total:8796.63 Mb - used: 686.00 Mb (8%) - free: 8110.63 Mb (92%)

(52)

52

Soucis rencontrés

De nombreux soucis ont été rencontrés lors de l’installation et la configuration de Nagios, souvent des soucis de configuration ou des oublis d’options. La documentation et l’aide se fait rare sur internet, je me suis principalement aider de :

http://www.google.fr http://forum-centreon.com

http://nagios-fr.org/forums/index.php

Lors de la mise en place sur le réseau il n’y a pas eu de problèmes mis à part des finitions comme les intervalles des notifications, des équipements en erreur et quelques autres soucis peu important.

Impacts de la mise en place de la solution

Avec la mise en place de mon projet, les techniciens informatiques ont pu découvrir de nouveaux problèmes et ainsi anticiper sur d’éventuelles pannes futures. Par exemple des disques durs de serveurs qui étaient pleins à 95% ou des processeur bloqués à 100%...etc.

Ils ont maintenant une vue globale avec tous les sites à superviser en temps réel, beaucoup plus agréable à voir et mieux cibler les sites.

Nous avons aussi par la même occasion tenter de réparer un maximum de problèmes pour avoir une carte avec le moins d’alertes possibles, et ainsi trouver quelques équipements qui n’existaient plus ou encore qui avaient changés d’ip (Pour les cartes).

Conclusion personnelle

Durant ces 6 mois d’intégration et de mise en place de mon projet Nagios, j’ai pu élargir mes connaissances en travaillant avec des outils compliqués comme Vmware, Linux et Nagios. J’ai

travaillé en équipe car j’avais besoin continuellement d’information sur le vaste réseau informatique.

J’ai eu beaucoup de chance de pouvoir mettre en place un tel outil de supervision sur un très grand réseau, avec un bon serveur, ce qui m’a permis de travailler dans les meilleures conditions et de mettre fin à mon projet dans la limite du temps.

(53)

53

Lexique

Licence GPL (General Public License) : est une licence qui fixe les conditions légales de distribution des logiciels libres du projet GNU*

Projet GNU (Gnu's Not Unix) : est un projet de système d'exploitation composé exclusivement de logiciels libres

UPI : Unité de Production Informatique

DSIT : Direction des Systèmes d'Informations et des Télécommunications BSOD: Blue Screen Of Death

ISO : Image d'un cdrom mis sur un disque dur

Bootable : Une fois une iso gravé sur un cd, si il est inséré dans le lecteur cdrom il s'exécute avant le lancement du Système d'exploitation

OS : Opérating System (Système présent)

SSH : Secure SHell, protocole de communication sécurisée SSL : Secure Socket Layer, protocole de sécurisation d’échanges

SMS : Systems Management Server, permet la gestion des applications et des machines d'un parc informatique.

Htaccess : fichier qui permet entre autre de mettre un accès restreint à une page internet (Une authentification est demandée)

Logs : Fichiers où sont stockés toutes les activités pour garder des traces et savoir ce qui c'est passé à un moment précis.

Pda : Personal Digital assistant ou ordinateur de poche

(54)

54

ANNEXES

(55)

55

Procédure d’installation et de configuration Full Automated Nagios

1) Paramétrage CentOS 57

a. Changer le mot de passe root 57

b. Synchroniser la date et l’heure 58

c. Configurer les DNS 58

d. Configurer l’adresse IP 58

e. Configurer le nom de la machine 58-59 f. Changer le mot de passe de l’interface web Nagios 59

2) Centreon 60

a) Ajouter un utilisateur 60-61

b) Ajouter un host 62

1. Mettre des relations aux hosts et infos divers 63

2. Créer des hosts groups 64

c) Ajouter un service basique (ping) 65

1. Mettre des relations aux services 66

d) Ajouter un service avancé (Pross, mémoire, HDD…) 67-68

1. Installation du client sur les serveurs 69

2. Toutes les commandes de check 69-70

e) Créer un template pour host 71-72

(56)

56

3) Présentation et prise en main de Nagios 73-80

4) Nagvis 81

a) Menu « Manage » 81-82

1) Maps 82

2) Backgrounds 83

3) Shapes 83

b) Ajouter un Hosts 84-85

c) Ajouter un groupe d’host 86-87

d) Faire des liaisons entre les cartes 88

e) Ajouter un lien shape ou du texte 89-91

f) Mettre à jour l’image de fond d’une carte 91

(57)

57

1) Paramétrage CentOS

Le serveur Nagios est enfin lancé, nous allons le configuré afin de le normaliser.

Il faut tout d’abord se loger puis rebooter le serveur. (Pour redémarrer immédiatement, la commande est « shutdown –r now»)

Une fois redémarré une page de configuration s’ouvre, on quitte directement on va le configurer manuellement.

a. Changer le mot de passe root

Pour le mot de passe root il suffit de se loger sur le serveur (que ce soit avec putty ou directement depuis le serveur) et taper la commande :

# passwd

Il demande en suivant de taper un nouveau mot de passe.

(58)

58 b. Synchroniser la date et l’heure

Pour éviter que le serveur Nagios ne perde l’heure, il faut le synchroniser avec un serveur de temps.

Il faut modifier un fichier qui se trouve dans « /etc/ » : « vi /etc/ntp.conf »

Et lui ajouter les ip des serveurs sous la forme « servername_ip », il faut aussi supprimer toutes les lignes (1) et (2)

c. Configurer les DNS

Il faut entrer les ip manuellement car le serveur ne fait pas parti d’un domaine, pour ce faire éditer le fichier « vi /etc/resolv.conf » et y rentrer les ip sous la forme « nameserver ip »

d. Configurer l’adresse IP

Pour l’IP par défaut le serveur est en automatique (Il récupère directement son IP depuis le DHCP, il faudra par contre la fixer avant son lancement.). Si on veut la fixer manuellement on peut le faire avec la commande

# system-config-network

e. Configurer le nom de la machine

Il faut ensuite qu’on lui donne un nom, pour cela il faut modifier le fichier network dans /etc/sysconfig/network

On édite ce fichier avec la commande « vi »

# vi /etc/sysconfig/network // Ne pas oublier l’espace entre vi et /etc/

On appuie sur la touche « i » pour pouvoir modifier le fichier (Insert apparait en bas à gauche de l’écran)

(59)

59 Pour sortir du menu modification (une fois qu’on lui à attribué un nom), on appuie sur la touche échap puis la combinaison de touche « :wq » (Ne pas oublier les : ) w : sert à sauvegarder et q : sert à quitter.

Pour finaliser le nommage on doit taper la commande : # hostname Nom_que_l_on_souhaite_afficher

Il suffit de redémarrer pour que tout soit pris en compte.

On peut voir que le hostname à été pris en compte.

Pour éviter de se déplacer sur le serveur on peut prendre la main sur via SSH avec par exemple le client Putty.

Vérifier,au cas où,l’heure avec la commande :

# date

mar mar 17 11:06:54 CET 2009

f. Changer le mot de passe de l’interface web Nagios

On va aussi changer le mot de passe par défaut de Nagios pour accéder à son interface Web.

# htpasswd /etc/nagios/htpasswd.users nagiosadmin

Il vous demande de taper un nouveau mot de passe.

Si on veut ajouter un nouvel utilisateur il suffit de faire :

# htpasswd /etc/nagios/htpasswrd.users Nom.du.nouvel.utilisateur

Pour supprimer un utilisateur il suffit d’éditer le fichier htpasswd.users et de supprimer la ligne de l’utilisateur

# vi /etc/nagios/htpasswd.users

(60)

60

2) Centreon

/ !\ Pour toute modification dans centreon il est IMPERATIF de faire la manipulation suivante à chaque modification (Après avoir ajouté un groupe de périphériques, une ou plusieurs machines) / !\

Il faut pour cela aller dans Configuration/Nagios(1) et cocher toutes les cases comme suit et cliquer sur « export » (2)

a) Ajouter un utilisateur

On va tout d’abord créer un utilisateur. Il suffit de se connecter sur l’interface Centreon puis dans configuration(1)/utilisateurs(2)/ajouter(3)

(61)

61 1 – Nom qui sera utilisé pour ouvrir la session

2 – Surnom du compte

3 – Adresse mail qui recevra les notifications 4 – Groupe dans lequel sera l’utilisateur

5 – Si l’utilisateur a le droit d’accéder à l’interface centreon 6 – Mot de passe pour l’utilisateur

7 – Langage de l’interface Centreon 8 – Format du mail pour les alertes

9 – L’utilisateur sera administrateur ou non 10 – Type d’authentification

11 – Choix du type de notification que l’on souhaite recevoir pour les Hosts

12 – Période de notification (24x7 signifie qu’on recevra des notifications 24heure/24 7jours/7) 13 – Le type de notification (Laisser celle là par défaut)

14 – Choix du type de notification que l’on souhaite recevoir pour les services

15 – Période de notification (24x7 signifie qu’on recevra des notifications 24heure/24 7jours/7) 16 – Le type de notification (Laisser celle là par défaut)

(62)

62

b) Ajouter un host

On va maintenant ajouter un host à notre environnement, pour ce faire on se rend dans la partie

« configuration/hosts/ajouter » on arrive donc à cet écran :

1 – Nom de l’ordinateur

2 – Surnom de l’ordinateur (Nom qui apparaitra dans la description) 3 – Adresse IP de la machine

4 – Communauté SNMP, par défaut mettre Public en V1 5 – Pour mettre un template s’il à déjà été créé

6 – Période ou nagios fait le contrôle de la commande (c'est-à-dire 24heure/24 7jours/7) 7 – Commande associée à la machine (Pour le moment check_host_alive est un Ping) 8 – Certaines commandes demandent des arguments en plus

9 – Nombre d’essais maximum avant l’envoi de mail en cas d’échec 10 – Lorsque le statut est OK, le service est vérifié toutes les x minutes 11 – Groupe de contact à contacter

12 – Intervalle d’envois de mail en cas d’échec

13 – Période ou nagios envois les mails (c'est-à-dire 24heure/24 7jours/7) 14 – Type de notifications que l’on veut recevoir

15 – Si on veut avoir un état de suivi précis

(63)

63 1. Mettre des relations aux hosts et infos divers

Pour avoir une hiérarchie et pour mieux cibler les problèmes nous pouvons mettre en place des relations. Une fois que nous avons rempli la première partie sur la configuration de l’host on va dans l’onglet « relations » :

1 – Ici on choisit dans quel host groups on veut notre ordinateur, Si l’ordinateur est sur bordeaux on peut créer un réseau nommé bordeaux pour s’y retrouvé plus facilement (Pour la création de host groups voir page suivante.)

2 – Définir les hosts parents, les Switch, serveurs, routeurs, firewall…

3 – Définir les hosts enfants, serveurs, postes, Switch, routeurs, firewall…

Le dernier onglet sert à ajouter des infos supplémentaires sur le matériel, on peut lui attribuer une icône (Afin que ce soit plus propre dans la vue de nagios) ou encore noter un commentaire.

(64)

64 2. Création des hosts groups

Pour créer des host groups il faut se rendre dans configuration/Hosts/Host Groups/Ajouter :

1 – Nom que l’on veut donner à notre groupe d’host 2 – Surnom que l’on veut donner au groupe d’host 3 – Communauté SNMP, par défaut mettre Public en V1

4 – On sélectionne tous les hosts que l’ont veut attribuer dans le groupe

(65)

65

c) Ajouter un service basique (Ping)

Pour ajouter un service il faut se rendre dans configuration/Services/Services par host/Ajouter

1 – Nom que l’on veut donner au service

2 – Période ou nagios fait le contrôle de la commande (c'est-à-dire 24heure/24 7jours/7) 3 – Commande qui va être exécutée

4 – Pour certaines commandes des arguments sont nécessaires (Voir article 3.d) 5 – Nombre d’essais maximum avant l’envoi de mail en cas d’échec

6 – Lorsque le statut est OK, le service est vérifié toutes les x minutes

7 – Lorsque le statut est différent de OK, le service est vérifié toutes les x minutes 8 – Groupe de contact à contacter

9 – Intervalle d’envois de mail en cas d’échec

10 – Période ou nagios envois les mails (c'est-à-dire 24heure/24 7jours/7) 11 – Type de notifications que l’on veut recevoir

(66)

66 1. Mettre des relations aux services

Après avoir rempli la configuration du service on peut directement le mettre en relation avec un Host, cliqué sur l’onglet relations (à coté de service configuration).

1 – Tous les host auxquels on veut attribuer un service

2 – Tous les groupes auxquels on veut attribuer un service (Si on ajoute un groupe dans ce service, le service passera directement dans Service par Host Group)

(67)

67

d) Ajouter un service avancé (Pross, mémoire, HDD…)

Pour ajouter un service avancé il nous faut avant toute chose configurer les commandes de check.

Pour cela il faut aller dans configuration/commandes/ soit on modifie une commande existante ou alors on en crée une nouvelle (dans notre cas, ce sont les commandes qui correspondent au client NC_NET)

1 – Nom que l’on veut donner à notre commande de check 2 – Commande qui va être exécutée

$USER1$/check_nt -H $HOSTADDRESS$ -v SERVICESTATE -l $ARG1$ -s "None"

La commande se compose de 5 parties :

$USER1$/check_nt : $USER1$ correspond à l’utilisateur courant qui exécute la commande et check_nt correspond à la commande qui sera exécutée sur le serveur.

-H $HOSTADDRESS$ : -H est l’option ou il faut mettre une adresse IP en suivant, le fait de mettre

$HOSTADDRESS$ mettra automatiquement l’adresse IP de la machine sur laquelle on à définit la commande.

-v SERVICESTATE : -v est l’option pour définir ce qu’il doit checker (Vérifier) dans notre cas SERVICESTATE correspond à un statut d’un service.

-l $ARG1$ : -l signifie que l’on va mettre des arguments, dans notre cas $ARG1$ correspond au nom du service que l’on veut checker.

-s "None" : -s est l’option qui permet de mettre un mot de passe pour accéder aux infos du serveur.

Par défaut c’est None.

(68)

68 Quand on ajoute un nouveau service, on peut utiliser la commande check_NT

1 – Nom de la commande utilisée

2 – Arguments, chaque argument ($ARG1$, $ARG2$, $ARG3$...Etc.) doit être noté !+argument, dans notre cas on en avait qu’un donc on lui ajoute !+ « nom_du_service »

3 – Si on veut se rappeler de la commande que l’ont à taper avec les arguments à remplir on clique sur cet icône

4 – Sert à répertorier toutes les options de la commande check_NT

(69)

69 1. Installation du client sur les serveurs

Pour avoir les remontées d’informations sur chaque serveur on doit installer un petit programme (client) qui va s’en occuper. L’installation est toute simple il y a deux possibilité, soit on l’installe directement sur chaque serveur (très long) soit on fait un lot sms. Pour pouvoir l’installer, le serveur doit répondre à plusieurs caractéristiques :

• NC_Net est écrit en langage C et utilise Dot Net Framework 1.1.4322 (Obligation d’installer une version supérieure à dot net 1.1.4322)

• Le système d’exploitation doit être Windows 2000, XP, Windows 2xxx Servers.

• Il fonctionne aussi sous NT 4 mais après avoir installé DOT NET (pour plus d’informatique voir sur le site de Microsoft : kb 815177

2. Toutes les commandes de check Voici un récapitulatif de toutes les commandes du client :

- CPU Load

Commande : check_nt -H HOSTNAME -v CPULOAD –l minutes_range, warning_percent, critical_percent

Exemple : check_nt -H 127.0.0.1 -v CPULOAD -l 10,80,95,60,80,95,1440,80,95 - Disk Usage

Commande : check_nt -H HOSTNAME -v USEDDISKSPACE -l drive_letter -w warning_percent -c critical_percent

Exemple : check_nt -H 127.0.0.1 -v USEDDISKSPACE -l C -w 80 -c 90 - Uptime

Commande : check_nt -H HOSTNAME -v UPTIME Exemple : check_nt -H 127.0.0.1 -v UPTIME

- Services States

Commande : check_nt -H HOSTNAME -v SERVICESTATE [-d SHOWALL] -l service_1[,service_2,service_3,...]

Exemple : check_nt -H 127.0.0.1 -p 1248 -v SERVICESTATE -d SHOWALL -l LanmanServer,Schedule - Process States

Commande : check_nt -H HOSTNAME -v PROCSTATE [-d SHOWALL] -l process_1[,process_2,process_3,...]

Exemple : check_nt -H 127.0.0.1 -v PROCSTATE -l "NC_Net.exe,notepad.exe,dummy name.txt" -d SHOWALL

- Client Version

Commande : check_nt -H HOSTNAME -v CLIENTVERSION Exemple : check_nt -H 127.0.0.1 -v CLIENTVERSION

(70)

70 - Memory Usage

Commande : check_nt -H HOSTNAME -v MEMUSE [-w warning_percent ] [-c critical_percent]

Exemple : check_nt -H 127.0.0.1 -p 1248 -v MEMUSE -w 80 -c 90 - File Age Usage

Commande : check_nt -H HOSTNAME -v FILEAGE –l filename_Path[,date_format] [-w warning ] [-c critical]

Exemple : check_nt -H 127.0.0.1 -v FILEAGE -l "c:\\program files\\shatter it\\NC_Net\\config\\passive.log" -w 8 -c 10

- Custom Counter

Commande : check_nt -H HOSTNAME -v COUNTER -l counter_name[,counter_description] [-w warning_percent ] [-c critical_percent]

Exemple : check_nt -H 127.0.0.1 -p 1248 -v COUNTER -l "\\Paging File(_Total)\\% Usage","Paging file usage is %.2f %%" -w 80 -c 90

- Instances

Commande : check_nt -H HOSTNAME -v INSTANCES -l Category_object[,Category_object2]

Exemple : check_nt -H 127.0.0.1 -v INSTANCES -l system,processor,memory - Event Log Check

Commande : check_nt -H HOSTNAME -v EVENTLOG -l "Event Log,Event Type, Time Interval min, Evt Source List size, [Event source list], Evt Desc list size [RegExp list], Evt ID list size, [Event ID filter list]" [- w <warning value>] [-c <critical value> ]

Exemple : check_nt -H 127.0.0.1 -v EVENTLOG -l Application,any,10,1,NC_Net,-2,start,stop,0 - WMI Query

Commande : check_nt -H HOSTNAME -v WMICHECK -l "<Namespace>[^<Select> | ^<FULL SELECT>][^<Class>][^<condition>]"

Exemple : check_nt -H 127.0.0.1 -v WMICHECK -l "cimv2^select name,size,freespace from win32_logicaldisk"

- Free Space Check

Commande : check_nt -H HOSTNAME -v FREEDISKSPACE -l drive_letter -w warning_percent -c critical_percent

Exemple : check_nt -H 127.0.0.1 -v FREEDISKSPACE -l c -w 10 -c 5

Pour plus d’informations : http://shatterit.com/nc_net/files/