System Availability

Alle tot nu toe omschreven technieken zorgen ervoor dat binnen een datacenter, data en systemen hoger beschikbaar kunnen worden gemaakt. Maar wat nu als er stroomuitval, brand of overstroming in dat datacenter plaatsvindt? Er zijn meerdere scenario's mogelijk die helpen om data veilig te stellen tegen dergelijke catastrofes. Daarbij zijn de hoeveelheid data die verloren mag gaan (Recovery Point Objective, RPO) en hoelang systemen down mogen zijn (Recovery Time Objective, RTO) de belangrijkste factoren bij het ontwerpen van de juiste oplossing.

Uitwijklocatie
Allereerst, om te kunnen uitwijken naar een andere locatie moet de data daar beschikbaar zijn. Welke methode de juiste is hangt af van de gestelde eisen voor de replicatie. Als er geen data verloren mag gaan is synchrone replicatie de enige mogelijkheid. Dit is ook de duurste oplossing. Met asynchrone replicatie kan het dataverlies klein zijn maar nooit nihil. Het nadeel van storage replicatie is dat het buiten de applicaties omgaat en daarmee niet consistent is. Als de data corrupt raakt, wordt deze corruptie ook direct naar de uitwijklocatie gerepliceerd.

Als de data eenmaal beschikbaar is op de uitwijklocatie dan moeten er systemen zijn ingericht die deze plek kunnen benaderen en de diensten kunnen aanbieden. Servers voor uitwijk kunnen fysiek of virtueel zijn, net zoals op de hoofdlocatie. Over het algemeen is het met fysieke servers lastiger om de diensten weer correct te laten functioneren dan met virtuele. De belangrijkste reden hiervoor is dat virtuele machines hardware onafhankelijk zijn en zonder downtime kunnen worden verplaatst van het ene fysieke systeem naar het andere. Als de uitval van de hoofdlocatie langer duurt, moeten veranderingen aan de data door gebruikers en applicaties ook weer worden geback-upt. Dat betekent dat een uitwijklocatie die de productie volledig kan overnemen, een eigen volledige infrastructuur nodig heeft, inclusief back-up.

 

pqr dynamisch datacenter