1.WINDOWS...2
1.1. VERSIONSSUPPORTÉES...2
1.2. SURVEILLANCEDEBASE...2
2.LINUX...2
2.1. VERSIONSSUPPORTÉES...2
2.2. SURVEILLANCEDEBASE...2
3.AIX...3
3.1. VERSIONSSUPPORTÉES...3
3.2. SURVEILLANCEDEBASE...3
4.VMWARE...4
4.1. VERSIONSSUPPORTÉES...4
4.2. SURVEILLANCEDEBASE...4
5.ORACLE...6
5.1. VERSIONSSUPPORTÉES...6
5.2. SURVEILLANCEDEBASE...6
6.MYSQL...8
6.1. VERSIONSSUPPORTÉES...8
6.2. SURVEILLANCEDEBASE...8
7.MS SQL SERVER...9
7.1. VERSIONSSUPPORTÉES...9
7.2. SURVEILLANCEDEBASE...9
8.DB2 DE BASE...11
8.1. VERSIONSSUPPORTÉES...11
8.2. SURVEILLANCEDEBASE...11
9.POSTGRESQL...13
9.1. VERSIONSSUPPORTÉES...13
9.2. SURVEILLANCEDEBASE...13
10.APACHE...14
10.1. VERSIONSSUPPORTÉES...14
10.2. SURVEILLANCEDEBASE...14
11.JMX...15
11.1. VERSIONSSUPPORTÉES...15
11.2. SURVEILLANCEDEBASE...15
12.AS400...16
12.1. VERSIONSSUPPORTÉES...16
12.2. SURVEILLANCEDEBASE...16
13.IIS...17
13.1. VERSIONSSUPPORTÉES...17
13.2. SURVEILLANCEDEBASE...17
1. Windows
1.1.
Versions supportées
Windows Server 2000, 2003, 2008
1.2.
Surveillance de base
Mesure Seuil d'alerte Commentaires
Disques Alarme haute si > 95%
Alarme basse si > 90%
CPU Alarme si > 97% pendant 1800s MEM Alarme si > 95% pendant 1800s Services
Windows Alarme si service en démarrage auto est arrêté
I/Os
2. Linux
2.1.
Versions supportées
Toute distribution où la compilation est possible (pré-requis : les include librairies sont résidentes sur le serveur).
2.2.
Surveillance de base
Mesure Seuil d'alerte Commentaires
Disques Alarme haute si > 95%
Alarme basse si > 90%
CPU Alarme si > 97% pendant 1800s
MEM Alarme si > 95% pendant 1800s
I/Os
3. AIX
3.1.
Versions supportées
AIX 5.1, 5.3, 6.1
3.2.
Surveillance de base
AIX Base Alarmes Commentaires
AIX CPU: % libre Déclencheurs (2)
AIX CPU: % System AIX CPU: % User AIX CPU: % Wait
AIX CPU: Nbre CPUs Logiques affectes Déclencheurs (2) AIX CPU: Nbre de cpu libre dans shared pool
AIX CPU: Running Queue Déclencheurs (2)
AIX DISK: % libre sur tous les FS Déclencheurs (2) AIX DISK: hdiskpower0 % activity
AIX MEM: % libre Déclencheurs (2)
AIX MEM: % swap utilise Déclencheurs (2) AIX MEM: Total
AIX MEM: Total Libre
AIX HMC Alarmes Commentaires
AIX HMC: lpar led BAT A {$LPAR_NAME} Déclencheurs (1) AIX HMC: lpar led BAT C {$LPAR_NAME} Déclencheurs (1) AIX HMC: lpar status BAT A {$LPAR_NAME} Déclencheurs (1) AIX HMC: lpar status BAT C {$LPAR_NAME} Déclencheurs (1)
AIX Cluster PowerHA Alarmes Commentaires
AIX CLUSTER: cluster manager service Déclencheurs (2) AIX CLUSTER: nombre offline nodes Déclencheurs (2) AIX CLUSTER: nombre ressource group offline
AIX CLUSTER: nombre ressource group total Déclencheurs (2) AIX CLUSTER: nombre total nodes Déclencheurs (4) AIX CLUSTER: state general Déclencheurs (1) AIX CLUSTER: substate general
AIX VIOs Alarmes Commentaires
DISK VIO Espace sur tous les FS Déclencheurs (2) DISK VIO /var/vio/VMLibrary Déclencheurs (2)
LOG ERROR Déclencheurs (1)
AIX CHASSIS HMC Alarmes Commentaires
CHASSIS: ERROR LOG Déclencheurs (1)
CHASSIS: TEMP Déclencheurs (1)
4. VMWARE
4.1.
Versions supportées
ESX & ESXi 3.5, 4.0, 4.1
4.2.
Surveillance de base
Mesure Seuil d'alerte Commentaires
Array_** Disk_Command_Latency.average Array_** Disk_Read_Latency.average Array_** Disk_Read_Rate.average Array_** Disk_Write_Latency.average Array_** Disk_Write_Rate.average Array_**
Kernel_Disk_Command_Latency.average Array_** Kernel_Disk_Read_Latency.average Array_** Kernel_Disk_Write_Latency.average Array_**
Physical_Device_Command_Latency.averag e
Array_**
Physical_Device_Read_Latency.average Array_**
Physical_Device_Write_Latency.average Array_** Queue_Command_Latency.average Array_** Queue_Read_Latency.average Array_** Queue_Write_Latency.average CpuTotal
CpuUsed >90% pendant plus de
1800s CpuUsed / CpuTotal > 90%
Server in Maintenance Mode NA
Memory active Memory consumed Memory granted Memory heap Memory heapfree
Mesure Seuil d'alerte Commentaires
Memory overhead Memory reservedCapacity Memory shared
Memory sharedcommon Memory state
Memory swapin Memory swapinRate Memory swapout Memory swapoutRate Memory swapused Memory sysUsage Memory unreserved Memory usage Memory vmmemctl Memory zero MemSize in Byte
MemUsage in Byte >90% pendant plus de
1800s MemUsage / MemSize > 90%
vmnic** duplex vmnic** IN bps vmnic** OUT bps vmnic** speed vmnic** state
Volume.Capacity Array
Volume.Free Array in Byte >80% Volume.Free / Volume.Capacity > 80%
>90% Volume.Free / Volume.Capacity > 90%
Notes:
• ** représente l'Id du disque, de l'interface, ...
5. Oracle
5.1.
Versions supportées
Oracle 8, 9, 10 & 11
5.2.
Surveillance de base
Mesure Seuil
d'alerte
Commentaires
Active Users count Number of active users
Alert.log Scan de l'Alertlog pour chaines ORA-
All DB Files Size All datafiles size (Octets)
Buffer busy waits
Buffer Cache Hit Ratio < 60% Buffer Cache Hit Ratio (See METALINK Note 33883.1) (%)
"Bytes received via SQL*Net from client /s Bytes sent via SQL*Net to client /s Current Logons
Database version
Datafiles free increments <10% Autoextensible datafile with less alarm level free increments db file parallel write /s
db file scattered read /s db file sequential read waits /s db file single write /s
DB Size Database size (Octets) (inf to all datafiles size)
Deadlocks N/A
Direct path read /s Direct path write /s
Disk sorts ratio disk sort ratio (%)
Enqueue waits /s
Extents <= 2 Segments with less than alarm level free extents Free buffer waits
Hard parse ratio hard parse ratio (%)
Index fast full scans (full) /s
Instance Active N/A test connection to oracle
Last applied archive log (at standby) Last archived log sequence
Library Cache Hit Ratio < 60% Library Cache Hit Ratio (%) Log file parallel write /s
log file switch completion Log file sync /s
Redo Writes /s
Table scan rows gotten /s Table scans (long tables) /s
Tablespaces > 90% Non autoextensible tablespaces above alarm level used%
space
Uptime uptime (seconds)
Users Commits /s
Users Count Number of connected users
Users Rollbacks /s
6. Mysql
6.1.
Versions supportées
Mysql 4.x, 5.x
6.2.
Surveillance de base
Mesure Seuil d'alerte Commentaires
Nombre d'insert /s
Nombre d'Octets envoyés /s Nombre d'Octets reçus /s Nombre d'opérations d'écriture /s Nombre d'opérations de lecture /s Nombre d'update /s
Nombre de commit /s Nombre de delete /s Nombre de select /s Nombre total de lignes
Server available N/A
Server version
Taille Base > Seuil Seuil personnalisé par base
Taille Index
Taille moyenne rows Uptime
7. MS SQL Server
7.1.
Versions supportées
MS SQL Server 2000, 2005, 2008 versions FR ou US sur systèmes d'exploitation FR ou US.
7.2.
Surveillance de base
Mesure Seuil d'alerte Commentaires
Instance par défaut MSSQL Server version
BM: Buffer Cache Hit Ratio BM: Database Pages BM: Page Life Expectancy DB: Data File Size (TEMPDB) DB: Data File Size (TOTAL) DB: Log File Size
DB: Transactions per second JOBS: Number Failed Jobs LOCK: Lock Waits per second
LOCK: Number of Deadlocks per second MEM: Memory Grants Pending
MEM: Total Server Memory PROC: % Processor Time PROC: sqlservr Private Bytes PROC: Working Set
SERV: Service State - MSSQL$
{$INSTANCENAME}
N/A
SERV: Service State - SQLAgent$
{$INSTANCENAME}
N/A
STAT: Batch Requests/sec STAT: Number Users Connected
Windows Application Event Log N/A Report Errors if 9002 (Transaction Log is full) & 9004 (no way to rollback/recovery) errors are found
SQLSERVER - SERV: Integration Services N/A SQLSERVER - SERV: Reporting Services N/A
SQLSERVER - SERV: SQL Agent N/A
SQLSERVER - SERV: SQL Browser N/A SQLSERVER - SERV: SQL Server N/A
Instances Nommées List all databases logs used space > 95%
List all databases used space > 95%
List all users databases Database size
MSSQL Server cpu %
MSSQL Server disks reads /sec MSSQL Server disks writes /sec MSSQL Server Instance Name MSSQL Server io %
MSSQL Server Ping N/A Connection test to Named Instance
8. DB2 de base
8.1.
Versions supportées
DB2 8.x, 9.x
8.2.
Surveillance de base
Mesure Seuil d'alerte Commentaire
INSTANCE % de Tri type Piped
Agents en attente
Date de lancement de DB2 Memoire de l Instance Nb de connexions Niveau de Service Nom du produit Nom du Serveur
Status de l Instance DB2 Tri au dessus du seuil Version
DATABASE % de Tri hors limite
Connexion
Date activation base Date du dernier backup
Global % d Ecriture Asynchrone des données
Global % d Ecriture Asynchrone des Index
Global % de Lecture Asynchrone des données
Global % de Lecture Asynchrone des Index
Global Hit_ratio des Donnees
Global Hit_ratio des Donnees Temporaires
Global Hit_ratio des Index Global Hit_ratio des Index Temporaires
Nb de Commits Nb de Deadlocks Nb de Lignes inserees Nb de Lignes lues
Nb de Lignes mises a jours Nb de Lignes selectionnees Nb de Lignes supprimees Nb de tris au dessus du seuil Nb Instructions DDL
Nb Instructions de selection Nb Instructions Dynamiques Nb Instructions en Erreur Nb Instructions en Rollback Nb Instructions Statiques Nb Instructions UID
Nb Jours depuis le dernier Backup Nb Total de connexions
Nb Transactions douteuses Nom Base de Connexion Nom de la base
Nom de l instance Status de la base Type de Serveur Utilisation du Log Verrous escalades
Verrous etendus escalades Verrous hors delais
9. Postgresql
9.1.
Versions supportées
Postgresql 8.x
9.2.
Surveillance de base
Mesure Seuil d'alerte Commentaires
DATABASES CHECKS Database size
tuples deletes /s tuples fetches /s tuples inserts /s tuples returns /s tuples updates /s
INSTANCES CHECKS Check connection
Check version Databases List
Total number of checkpoints launched by timeout /s
Total number of checkpoints requests /s Total number of commits /s
Total number of rollbacks /s Total number of server processes
Total number of access Exclusive Locks /s Total number of Access Shared Locks /s Total number of Exclusive Locks /s Total number of Row Exclusive Locks /s
Total number of Row Shared Locks /s
Total number of Row Shared Update Exclusive Locks /s
Total number of Shared Row Exclusive Locks /s
10. Apache
10.1. Versions supportées
Apache 2.x
10.2. Surveillance de base
Mesure Seuil d'alerte Commentaires
Apache: Busy Workers Number Apache: Bytes per request Apache: Bytes per second
Apache: Closing Connection Processes Number Apache: DNSLookup Processes Number
Apache: Gracefully Finishing Processes Number Apache: Idle Cleanup of Worker Processes Number Apache: Idle Workers Number
Apache: KeepAlive Processes Number Apache: Logging Processes Number
Apache: Reading Request processes Number Apache: Requests Per Sec
Apache: Sending Reply processes Number Apache: Starting Up processes Number Apache: Total Accesses Number Apache: Total KBytes Number Apache: Uptime
Apache: Waiting for Connection processes Number
11. JMX
11.1. Versions supportées
JMX > V1.5
11.2. Surveillance de base
off
sessions /probe active
Mesure Seuil d'alerte Commentaires
bytes received per second bytes sent per second qzip compression errors per second
processing time per second requests per second
threads allocated threads busy
> 70% max thread
threads max > 70% max
thread sessions /probe peak
sessions /probe rejected
sessions /zapcat-1.2 active
sessions /zapcat-1.2 peak
sessions /zapcat-1.2 rejected
tomcat version
12. AS400
12.1. Versions supportées
V5x, V6x
12.2. Surveillance de base
> 70%
Interface X Description
SW - i5/OS (hrSW2)
> 80%
Mesure Seuil d'alerte Commentaires
CPUs util % (last 60 sec)
Disks Units Status (hrd4) Changt status
Interface X Admin Status Interface X InDiscard Interface X InErrors Interface X In Traffic (Bps) Interface X Operation Status Interface X OutDiscard Interface X OutErrors Interface X Out Traffic (Bps) Main Card Enclosure Status (hrD1) Number of users
Optical Disk Drive Status (hrD23) RAM Size (hrStX)
SW - DB2 Query Manager and SQL Development Kit for iSeries (hrSW8)
not running SW - IBM DB2 Web Query for System i Option Base
(hrSW13)
SW - IBM Developer Kit for Java (hrSW5) not running SW - IBM HTTP Server for i5/OS Status (hrSW3)
SW - IBM Portable Utilities for i5/OS (hrSW14) SW - IBM Toolbox for Java (hrSW4)
SW - iSeries Access Base (hrSW12) SW - iSeries Access for Windows (hrSW11)
SW - Licensed Internal Code (hrSW1) not running SW - Performance Tools for iSeries - Base (hrSW6)
SW - Query for iSeries (hrSW7)
SW - TCP/IP Connectivity Utilities for i5/OS (hrSW9) not running SW - WDS for iSeries (hrSW10)
sysDescription sysName
System ASP (hrSt1)
System ASP Storage used size (hrSt1) System Date/Time
System Processor Card (hrD2) System Processor Card (hrD3) Tape Unit Status (hrD24) Uptime
V.24 Port Status (hrD25) V.24 Port Status (hrD26)
13. IIS
13.1. Versions supportées
6.x, 7.x
13.2. Surveillance de base
IIS: Pools IIS
Mesure Seuil d'alerte Commentaires
Pools IIS en status « stoped »