ccub:gestion_de_la_capacite

Cette version (2024/09/02 06:37) est en ébauche.
Approuvés: 0/1

Ceci est une ancienne révision du document !


Gestion de la capacité

La politique de gestion de la capacité vise à s'assurer que les ressources et systèmes d'information disposent des capacités suffisantes pour répondre aux besoins actuels et futurs de l'organisation en matière de sécurité de l'information. Cela permet de garantir la disponibilité et les performances des systèmes d'information critiques.

Les systèmes et ressources critiques sont identifiés au travers de l'inventaire des actifs sensibles. Pour chaque actif sensible, une procédure détaille les actions techniques à mener pour s'assurer que chaque actif dispose des ressources suffisantes pour répondre aux besoins de l'organisation.

Serveurs de stockage et de calcul

Les serveurs de stockage et de calcul sont supervisés pour s'assurer qu'ils sont correctement dimensionnés pour l'activité du Centre de Calcul. Le cluster contient 3 volumes de stockage : /user (/user1 et /user2), /work et /archive,. Pour utiliser ces volumes de stockage il faut se connecter sur une machine du cluster.

Classes de données

Données permanentes

Description

L'espace /user accueille les données permanentes qui se trouvent dans les répertoires principaux des utilisateurs (ou home directory) /user1 ou /user2. Ce système de stockage est indépendant des machines de traitement (accès via NFS sur une liaison Ethernet haut-débit); Les données sont très sécurisées (système RAID et sauvegardés sur disque et sur bandes magnétiques dans des bâtiments différents).

Quota et gestion de la capacité

Chaque utilisateur appartient à un groupe, par exemple le groupe “ccub” contient plusieurs utilisateurs : util01, util02, util03, etc.

Dans /user1 il n’y a pas de quota pour chaque utilisateur mais un quota pour tout le groupe. Un utilisateur peut prendre 100% de l’espace alloué au groupe et bloquer tous les autres utilisateurs.

Données de calcul ou scratch ($WORKDIR = /work)

Description Les données de calcul se trouvent dans le répertoire /work qui est dédié au calcul. C’est un système de stockage haute performance adapté au calcul intensif. Tous les calculs doivent être lancés depuis ce répertoire pour ne pas charger les /user. Pour cela, l'utilisateur doit copier les programmes, scripts et données de calculs depuis /user vers le répertoire de calcul /work, les données sont sécurisées (système RAID) mais pas sauvegardées sur bandes magnétiques.

Quota et gestion de la capacité Dans le /work chaque utilisateur a son propre quota.

Données archive ($ARCHIVEDIR = /archive)

Description Dans /archive les données de calcul à des fins de post-traitement ou d’archivage à long terme seront stockées. C’est un stockage capacitif mais peu performant, il est recommandé de ne pas l'utiliser pour exécuter des calculs.

Il est sécurisé (système RAID et duplication des données dans des bâtiments différents). Une restauration des données que vous auriez pu effacer par erreur est possible sur un créneau de 2 mois maximum.

Quota et gestion de la capacité

Données temporaires (/tmp3) Description Chaque machine du cluster dispose d’un dossier temporaire : /tmp3

En cas de besoin, ce dossier peut être utilisé comme $TMPDIR . Il est recommandé d'utiliser le /tmp3 en lieu et place du /tmp .

Contrairement aux volumes cités plus haut, le /tmp3 est local à chaque machine. Si vos jobs batch laissent des données dans le /tmp3 après leur exécution, il vous sera impossible de les récupérer vous même. La talle du volume /tmp3 dépend de chaque machine, et peut varier entre 150 Go et 800 Go.

Les données stockées dans le /tmp3 peuvent être effacées par les administrateurs du cluster en cas de besoin.

Tout fichier présent dans le répertoire /tmp3 et dont la dernière modification remonte à plus de 30 jours est supprimé automatiquement.

Différent types de données sont hébergées dans les volumes de stockage du Centre de Calcul.

Production de froid et électricité

La production de froid, la continuité d'alimentation électrique et l’alimentation électrique de secours font l'objet d'une attention particulière : elles sont vitales pour le bon fonctionnement du Centre de Calcul.

Les indicateurs de dimensionnement sont collectés périodiquement. Pour chaque indicateur une fréquence de collecte, une source et une définition sont associées. Une page du SMSI leur est dédiée. Ils sont restitués et analysés périodiquement à l'occasion des COPIL SSMI et annuellement à l'occasion des revues de direction.

Les outils de supervision contribuent à la surveillance continue des capacité et génèrent des alertes quand les seuils sont atteints ou dépassés.

La planification de l'évolution des capacité se fait :

  • suite à des incidents de sécurité dont l'analyse à postériori met en lumière un besoin d'ajuster les capacités
  • En revue de direction, s'il apparaît que les capacités ne sont plus adaptées à l'activité du Centre de Calcul

Toute demande de modification de la capacité ou d'allocation de capacité supplémentaire à un utilisateur fait l'objet d'une demande de service qui s'inscrit soit dans le cadre de la gestion de changements et de la sécurité de l'information dans la gestion des projets.

  • ccub/gestion_de_la_capacite.1725259022.txt.gz
  • Dernière modification : 2024/09/02 06:37
  • de cardynal