HyperDisponibilité

L'Hyperdisponibilité

Les réflexions et les idées développées dans les précédents billets nous ont permis de bâtir une solution répondant aux besoins d’un très large panel de PME. Les contraintes budgétaires de certaines structures nous ont même obligé à imaginer une solution à moindre coût.

Les objectifs à atteindre sont :

  • Assurer un fonctionnement du data center dans les conditions optimales de performance à tout moment,
  • Prendre en charge les pannes de manière transparente pour les utilisateurs,
  • En cas de perte d’une des deux salles, prendre en charge 100% des serveurs sur la seconde salle,
  • Ne perdre aucune donnée, soit assurer un RPO = 0,
  • Assurer un retour aux opérations RTO qui dépendra des ressources acquises ou non par l’entreprise,
  • Prendre en charge le retour à la normale (Une fois redémarrée, la salle doit à nouveau être sous protection).


Et tout cela, sans intervention humaine !



Cette solution, nous l’avons bâtie pour vous, c’est l’HYPERDISPONIBILITÉ

Nous avons bâti la solution opérationnelle répondant à toutes ces exigences. Elle est constituée de deux data centers mobiles. Nous l’avons présentée en 2018 et en 2019 lors d’un road show.

Ce qui a plu aux participants : « Dire ce que l’on fait. Faire (et montrer) ce que l’on dit ».

Aujourd’hui, nous vous proposons d’observer la réaction en temps réel de notre solution face aux différents incidents à laquelle nous pouvons la soumettre.

Vous souhaitez une démo en temps réelle chez vous ? Pour cela envoyez moi un mail sur hyperdisponibilite@hyperdisponibilité.fr pour prendre contact et nous organiserons ensemble la démonstration de cette solution, chez vous si vous le souhaitez.


Demandez votre démonstration à domicile aujourd’hui

Contactez-nous

Hyperdisponibilité : une solution testée et éprouvée


Sécurité | le 20/12/2018 Par William Sydney-Smith

On attend d’un PCA ou d’un PRA qu’il fonctionne au moment où on en a besoin.

La solution Hyperdisponibilité remplit parfaitement cette mission et va même au-delà. En effet, elle remet en état le fonctionnement de la solution une fois la crise passée. L’architecture fonctionnelle de cette solution permet de mettre en œuvre une exploitation unique, sur deux salles, de n’en voir qu’une et de n’en administrer qu’une !

Cette solution repose sur un ensemble d’éléments du marché (hyperviseurs, serveurs et baies de disques) et ce, quels que soient les éditeurs ou constructeurs.

  • meeting dans un bureau

    Slide title

    Write your caption here
    Button

Deux pré-requis doivent être respectés

  • Un lien de type FC (Fiber Channel) doit relier les deux salles ; ce qui n’est pas forcément contraignant. En effet, de plus en plus d’opérateurs proposent des solutions en FC et notamment dans les grandes agglomérations. Cela l’est encore moins lorsque l’on reste dans un même périmètre limité à l’entreprise sur un ou plusieurs bâtiments.
  • L’utilisation d’un boîtier prenant en charge la mise en oeuvre de la protection. Dans le cadre de notre démonstration, c’est l’Hyperswap d’IBM qui est utilisé.

Bien entendu, l’hyperviseur va jouer un rôle primordial. Toutefois, aucun pré-requis ne s’impose à ce niveau. L’hyperdisponibilité fonctionnera avec du VMware, de l’Hyper-V, du VIO ou des hyperviseurs sous Linux.

Etre multi-OS et permettre la cohabitation de plusieurs hyperviseurs avec l’hyperdisponibilité est une des forces de la solution. Ainsi, la solution permet de gérer des environnements Windows et d’autres OS comme l’Aix ou l’IBM i ou encore toute autre solution sous Linux.

Enfin, le savoir-faire pour mettre en œuvre la solution sera l’élément clé. Même si son exploitation ne demande pas de compétences pointues, sa mise en œuvre est une étape cruciale qui mérite d’être particulièrement soignée.

VMware (par exemple) et ses différents modules doivent

impérativement être paramétrés en prenant en compte la solution dans sa globalité (serveur, disques, réseau). La solution hyperswap revêt également des spécificités qui doivent être respectées.

En conclusion, l’hyperdisponibilité permet de mettre en œuvre PCA/PRA dans tout type d’infrastructure pour atteindre un RPO = 0 et un RTO = 0. Il ne s’agit pas d’une solution monolithique mais bien d’une solution taillée sur mesure. Dans certains cas, cette solution peut être bâtie à partir d’une infrastructure existante.

En place chez un certain nombre de nos clients*, aujourd’hui, nous vous proposons d’observer la réaction en temps réel de notre solution face aux différents incidents à laquelle nous pouvons la soumettre. Panne d’alimentation, pannes matérielles, tout y est simulé pour que vous puissiez observer et vous rendre compte du comportement de l’infrastructure de démonstration telle qu’elle pourrait fonctionner chez vous.

Une démo chez vous ?

Vous souhaitez une démo en temps réelle chez vous ? Pour cela envoyez moi un mail sur hyperdisponibilite@hyperdisponibilité.fr pour prendre contact et nous organiserons ensemble la démonstration de cette solution, chez vous si vous le souhaitez.

* Les sites référents équipés peuvent être visités. Pour cela, merci de nous contacter.

Hyperdisponibilité : exemples de fonctionnement


Infrastructure Par William SYDNEY-SMITH

Exemples de fonctionnement de l’hyperdisponibilité

  • fonctionnement hyperdisponibilite

    Slide title

    Write your caption here
    Button

L’exemple pris, d’une exploitation croisée, repose sur deux ESX seulement. L’objectif est double : mettre en évidence à la fois la capacité de cette solution à s’adapter à toutes tailles d’entreprise mais aussi d’aller assez finement dans le fonctionnement de l’HYPERDISPONIBILITÉ.

Le fonctionnement de l’HYPERDISPONIBILITÉ est simple :

Grâce aux liens entre les deux salles, les écritures sur les disques sont opérées de manière simultanée sur les DEUX salles. L’une est réalisée en primaire, la seconde en auxiliaire.

Les caches sont flashés afin d’assurer une situation identique de manière synchrone sur les deux baies de disques.

Ensuite, les fonctionnalités de VMWARE et de la fonction HYPERSWAP des baies de stockage Storwize vont permettre de gérer les différentes situations de panne ou de perte de ressources suite à un sinistre pour atteindre un RPO = 0 et un RTO = 0.

  • scenario 1

    Slide title

    Write your caption here
    Button

La panne sur un des deux serveurs va enclencher une série de réactions de la part du vCenter et du SAN de la salle 2.

  • suite du scenario 1

    Slide title

    Write your caption here
    Button

L’ESX de la salle 1 tombe en panne. Les liens entre le SAN de la salle 1 et l’ESX de la salle 1 sont coupés. Les liens entre l’ESX 2 de la salle 2 et le SAN de la salle 1 restent actifs.

Le vCenter réagit et déplace les VMs de la salle 1 vers l’ESX de la salle 2. Les liens entre les VMs déplacées et les SAN sont les mêmes que ceux de l’ESX 2.

100% de la charge de travail sont pris en charge par l’ESX de la salle 2.

Aucune intervention humaine n’a été nécessaire.

Les utilisateurs qui travaillaient sur une application hébergée sur l’ESX 1 ont pu subir un très court temps de blocage de l’exploitation (inférieur à une minute), si l’application hébergée sur l’ESX 1 n’était pas exploitée en fault tolérance. La mise en oeuvre de la fonction fault tolérance de VMware pour une VM permet d’assurer un RTO = 0 pour cette VM seulement.

  • suite du scneraio 1 deuxieme partie

    Slide title

    Write your caption here
    Button

La panne sur l’ESX de la salle 1 a été solutionnée par le service de maintenance du constructeur. Il est remis en fonction. La fonction HYPERSWAP de la baie de disques de la salle 2 détecte de nouveau le serveur de la salle 1.

Le vCenter retrouvant l’ESX 1, grâce à la fonction DRS de VMWARE, rebascule les VMs attribuées à la salle 1. En même temps, l’HYPERSWAP redéfinit les liens des VMs basculées vers la salle 1.

Le retour à la normale se fait sans intervention humaine.

  • hyperdisponibilté scenario 2

    Slide title

    Write your caption here
    Button

La baie de disques de la salle 1 devient indisponible suite à une panne bloquante. Toutefois, l’ESX 1 reste opérationnel.

  • scenario 2 suite

    Slide title

    Write your caption here
    Button

Le lien primaire est perdu mais l’exploitation continue grâce au lien auxiliaire du SAN de la salle 2.

Le lien auxiliaire est passé primaire. L’hyperswap crée un lien auxiliaire sur le SAN de la salle 2.

Il n’y a eu aucune interruption perçue par les utilisateurs.

Il n’y a eu aucune intervention humaine.

  • fonctionnement hyperdisponibilite suite

    Slide title

    Write your caption here
    Button

Lorsque la baie de disques de la Salle 1 est remise en fonction, l’HYPERSWAP la détecte et lance un processus de réplication vers le SAN de la salle 1 afin de la mettre à niveau.

Un fois ce processus terminé, les liens primaire/auxiliaire sont rétablis afin d’assurer le retour à la normale.

Aucune intervention humaine n’est nécessaire.

Hyperdisponibilité : exemples de transformation


Infrastructure Par William SYDNEY-SMITH

Exemples de transformation

  • transformation

    Slide title

    Write your caption here
    Button

Un grand nombre d’entreprises ont déjà abordé le sujet du PRA ; parfois depuis bien longtemps. Les solutions mises en place le plus souvent reposent sur une approche simple : une data center de production protégé par un data center de secours.

  • principes de l'hyperdisponibilite

    Slide title

    Write your caption here
    Button

Avec l’HYPERDISPONIBILITÉ l’organisation des ressources change. Et, l’ensemble de celles-ci seront vues comme s’il n’y avait qu’une seule exploitation, qu’une seule administration d’un seul data Center.

Nous vous proposons d’étudier un exemple de transformation d’un Data Center unique, dans une PME, effectuée au moment du renouvellement du matériel.

  • exemples

    Slide title

    Write your caption here
    Button

L’existant est représenté ici par trois ESX avec une baie de disques et une solution de sauvegarde.

Jusqu’à maintenant, l’entreprise ne pouvait pas envisager de mettre en œuvre un PRA qui aurait représenté un investissement équivalent au Data Center de production.

Avec l’HYPERDISPONIBILITÉ, nous pouvons proposer un budget qui comprendrait la mise en œuvre d’une solution de PCA/PRA sur deux salles avec un minimum d’investissement.

  • Slide title

    Write your caption here
    Button

Dans la solution qui nous intéresse, les deux salles seront sur le même site géographique de l’entreprise, à une distance inférieure à 100 mètres.

La diminution du nombre de serveurs est rendue possible par une très faible consommation de CPU des ESX et un nombre réduit de machines virtuelles, environ une soixantaine.

Les processeurs de dernière génération vont permettre d’apporter plus de puissance sur deux ESX qu’avec la solution actuelle.

Le prix de la mémoire permet aussi de prévoir une grande capacité mémoire par serveur afin de s’assurer qu’un serveur seul pourra prendre en charge 100% des VMs.

Les liens entre les deux salles seront en 10 Gigabits Ethernet et en 16 Gigabits FC.

  • Slide title

    Write your caption here
    Button

Supprimer un ESX = les processeurs retenus pour la nouvelle configuration doivent au total (pour deux serveurs Bi pro) dégager plus de performance que la somme des processeurs des trois ESX existants.

La capacité mémoire de chaque ESX doit permettre l’exploitation de 100% des VMs.

  • Slide title

    Write your caption here
    Button

Par exemple, s’il y avait eu 3 ESX de chaque côté, dans un seul cluster. En cas de panne d’un des ESX, le vCenter et DRS auraient pris le relais pour répartir les VMs qui étaient hébergées sur cette ESX et les répartir en fonction de la charge, sur un ou plusieurs ESX dans la même salle ou sur les deux salles.

La fonction Hyperswap aurait quant à elle géré les modifications de liens.

  • mise en cluster hyperdisponibilite

    Slide title

    Write your caption here
    Button

La mise en cluster des deux ESX et la mise en cluster des deux SAN vont permettre d’utiliser la fonctionnalité de la baie Storwize : l’Hyperswap.

La solution d’HYPERDISPONIBILITÉ peut alors être installée et paramétrée.

Le fonctionnement de l’HYPERDISPONIBILITÉ est simple :

Grâce aux liens entre les deux salles, les écritures sur les disques sont opérées de manière simultanée sur les DEUX salles. L’une est réalisée en primaire, la seconde en auxiliaire.

Les caches sont flashés afin d’assurer une situation identique de manière synchrone sur les deux baies de disques.

Ensuite, les fonctionnalités de VMWARE et de la fonction HYPERSWAP des baies Storwize vont permettre de gérer les différentes situations pour atteindre un RPO = 0 et un RTO = 0.

  • Slide title

    Write your caption here
    Button

Lexique

PCA : plan de continuité d’activité. Il protège des pannes.

PRA : plan de reprise d’activité (Disaster Recovery en anglais). Il permet une reprise après un sinistre (feu, inondation, etc.)

Share by: