RAID : des disques dur en grappes
 

Cet article présente les systèmes RAID, les différents types (ou niveaux) de configurations existants, leurs avantages et inconvénients, ainsi que les éléments nécessaires à la mise en place de cette technologie.
Remarque préliminaire :
Il convient de préciser que cette technologie, qui vise à augmenter la protection du système contre les pertes de données, n'est ordinairement installée que sur des machines critiques, telles que des serveurs de fichiers, ou baies de disques durs utilisées dans les réseaux de stockage SAN (Storage Area Network).

Qu'est ce que le RAID?

RAID signifie «Redundant Array of Independent Disks» qui se traduit habituellement en français par "grappe de disques durs redondants".

Principe

La publication, intitulée "A Case of Redundant Arrays of Inexpensive Disks (RAID)", rédigée par Patterson, Gibson et Katz de l'Université de Berkeley, en Californie, établissait le principe de base de la technologie RAID. Cela consiste à combiner plusieurs disques durs (un minimum de deux disques durs étant requis) en une grappe de disques durs apparaissant à la machine comme une unité logique de stockage unique. Pour les utilisateurs un seul disque dur est visible.

Objectifs

Cette technologie a principalement été mise au point afin :

  • D'offrir une tolérance aux pannes de disques en fonction des différents niveaux de RAID décrits ci-dessous.

  • D'accroître les performances des machines.

Raid 0 - striping

Caractéristiques 

Le RAID 0, ou striping (entrelacement de données) permet de répartir l'écriture des données sur plusieurs disques en même temps (sans redondance).

Avantages

Cette technologie augmente considérablement les performances du système en accédant à plusieurs disques durs en même temps et en réduisant ainsi le temps de transmission entre la mémoire et les disques durs.

Par exemple sur un RAID 0 de n disques durs, chaque disque ne doit lire/écrire que 1/n des données, ce qui a pour effet de décupler les taux de transmissions, et donc d'accélérer les traitements.

Inconvénients 

Le RAID 0 ne permet pas de redondance des données et n'offre donc pas de protection contre la perte de données. En effet, la perte d'un disque dur entraîne la perte de l'entièreté des données.

Conclusion 

Etant donné le risque de perte de données, le RAID 0 n'est pas recommandé pour des applications stratégiques au sein d'une entreprise/administration ou à usage personnel mais plutôt pour des applications où le délai de traitement est l'élément critique (retouche d'image, vidéo,etc.).
 

Raid 1 - mirroring

Caractéristiques 

Le RAID 1, ou mirroring (mise en miroir de disques), écrit et lit les données simultanément sur tous les disques de la grappe. Les disques durs doivent être de capacité de stockage égale.

Avantages

Cette technologie de mise en miroir offre une protection des données excellente (via une redondance parfaite) et garantit la sécurité des données en cas de défaillance d'un disque, mais n'apporte pas de gain de performance. En effet, tous les disques du système RAID sont à tout moment interchangeables, lors de la défaillance d'un disque le fonctionnement de la machine n'est nullement affecté.

Une fois le disque défectueux remplacé, le contrôleur RAID entame automatiquement la synchronisation du nouveau disque avec les disques actifs.

Inconvénients 

Le principal inconvénient du RAID 1 réside dans le fait qu'il n'augmente pas la performance par rapport à un disque dur isolé. De plus, comme tous les disques sont miroirs l'un de l'autre, l'espace de stockage restera le même que pour un disque isolé.

Conclusion 

Ce type de RAID est recommandé pour les utilisateurs exigeant un maximum de fiabilité au niveau du stockage de données critiques sans besoins spécifiques de performances.

Raid 5 et 6

Caractéristiques 

Le RAID 5 et 6 permet un meilleur compromis entre sécurité et espace disponible. Il consiste en la répartition des données sur plusieurs disques (au moins 3) de telle manière qu'au moins un disque soit redondant (un disque redondant pour le raid 5 et deux pour le raid 6).

Exemple 

L'utilisation de quatre disques de 500GB en RAID 5 donnera un stockage total de 1500GB (au lieu de 2000GB) mais donnera l'assurance qu'un disque quelconque pourra tomber en panne sans affecter le système.

Avantages

Les RAID 5 et 6 offrent une bonne protection des données sans pour autant sacrifier autant d'espace que le RAID 1 et offrent donc un bon compromis entre sécurité et capacité lors de l'utilisation de beaucoup de disques.

Inconvénients 

La perte de stockage de l'équivalent d'au moins un disque en fonction du niveau de RAID.

Conclusion 

Ce type de RAID est adapté aux utilisations exigeantes alliant performance et criticité des données. C'est la technique conseillée pour tout serveur important ou critique (p.ex. serveur de fichiers, serveur Web, etc. ).

Raid 10

Caractéristiques

Le RAID 10 est en fait la combinaison du RAID 1 et du RAID 0 : on crée de multiples miroirs RAID 1 au-dessus desquels on ajoute un entrelacement (strip) RAID 0, un minimum de quatre disques durs de taille similaire est requis.

Avantages

Cette technique permet de se prémunir contre de multiple défaillance disques, tant qu'il reste un disque par miroir RAID 1. Ainsi de très bonnes performances ainsi qu'un excellent niveau de protection des données est assuré.

Inconvénients 

Comme le RAID 1 cette technique est très grande consommatrice d'espace disque, en effet, elle partage l'espace utilisable en deux.

Conclusion 

Cette solution, qui est la plus onéreuse des solutions RAID, est plus particulièrement utilisée dans des cas où on exige des performances rapides et fiables mais est de loin la plus chère.

Les composants d'un RAID

Les composants généraux d'une architecture RAID sont bien sûr les disques durs ainsi qu'un contrôleur RAID, dédié à la gestion de cette technologie. On parle de RAID logiciel "software RAID" dans le cas où le contrôleur est intégré dans le système d'exploitation et de RAID matériel "hardware RAID" dans le cas où la gestion est effectuée par une carte matériel dédié.
Le choix au niveau du contrôleur logiciel ou matériel est aussi important que le choix du type de RAID à mettre en place.

Le RAID logiciel

Le RAID logiciel est la solution la moins coûteuse, mais peut générer de la charge supplémentaire sur le CPU (Central Processing Unit). Le RAID logiciel est généralement intégré dans le système d'exploitation, mais des logiciels dédiés existent.

Le RAID matériel

Plus coûteux, le contrôleur RAID dédié supporte la technologie sans l'aide des ressources de la machine (CPU,etc.) et permet l'implémentation de tous les niveaux RAID.

D'autres avantages sont la sécurité. Un système d'exploitation qui devient instable n'aura aucune influence sur le bon fonctionnement du système RAID et donc indirectement sur la sécurité des données.

Le principal avantage est la performance. Non seulement l'ajout d'un contrôleur limite la congestion du CPU, mais en fonction du produit il peut contenir des mémoires caches ou autres avantages matériels pouvant accélérer le traitement des données.