Blog

RTO & RPO : Comprendre leurs rôles dans un Plan de Reprise d'Activité (PRA)

L’essentiel à retenir

En cas de cyberattaque ou de sinistre, deux indicateurs déterminent la survie informatique de votre entreprise : le RTO (durée maximale d’indisponibilité tolérée) et le RPO (volume maximal de données perdues accepté). Mal définis, ils condamnent votre PRA à l’échec. Bien calibrés, ils transforment la résilience en avantage concurrentiel.

  • Selon Gartner, une indisponibilité IT coûte en moyenne 5 600 €/minute aux entreprises.
  • 75 % des organisations ont subi une cyberattaque impactant leurs données en 2023 (Veeam).
  • Ce guide vous explique comment calculer vos RTO/RPO, la formule MTD et les 3 erreurs à éviter absolument.

Sommaire de l’article

RTO, RPO, WRT, MTD : tout comprendre pour bâtir un plan de reprise d’activité aligné sur vos enjeux métiers.

Qu’est ce que le RTO ?

Le RTO ou Recovery Time Objective, correspond au délai maximal acceptable pour restaurer les fonctions critiques après une interruption. En d’autres termes, c’est le temps que votre organisation peut tolérer sans que ses activités soient significativement impactées.

Un RTO trop long expose l’entreprise à des pertes financières directes et immédiates. Selon le Ponemon Institute lors d’une étude menée il y a déjà 10 ans (étude « Cost of Data Center Outages », 2016, menée sur 63 datacenters américains, consultable ici), le coût moyen d’une indisponibilité IT non planifiée s’élevait à 8 851 dollars par minute, soit plus de 740 000 dollars par incident. Un chiffre toujours en hausse qui illustre pourquoi le RTO n’est pas qu’un objectif technique mais un KPI économique à surveiller de très près.

  • Un RTO trop long peut donc entraîner des pertes financières importantes et un impact négatif sur la satisfaction client.
  • Il nécessite une évaluation approfondie des priorités métiers et des processus critiques pour définir des délais réalistes et alignés sur les objectifs de l’entreprise.

À titre d’exemple, un RTO de 4 heures est souvent toléré pour des fonctions support, tandis qu’un RTO de 15 minutes est imposé dans les environnements financiers ou hospitaliers. Aussi, la définition du RTO doit s’appuyer sur une analyse d’impact métier, réalisée en amont avec les directions métiers.

Qu’est ce que le RPO ?

Le RPO ou Recovery Point Objective, mesure la « fraîcheur » des données à restaurer. Il définit la durée écoulée entre la dernière sauvegarde exploitable et le moment de l’incident.

  • Un RPO mal défini peut entraîner la perte de données cruciales, compromettant la prise de décision et la continuité des opérations.
  • Le RPO dépend de la fréquence des sauvegardes et des besoins spécifiques en matière de protection des données.

Si votre RPO est fixé à 4 heures, vous acceptez de perdre jusqu’à 4 heures de production de données en cas d’incident. Un RPO proche de zéro implique une réplication quasi-temps-réel, techniquement exigeante et coûteuse, réservée aux systèmes critiques.

Étude de référence

Selon le Veeam Data Protection Trends Report 2024, les cyberattaques représentent la première cause de pannes et d’interruptions d’activité pour les organisations. Bien que les entreprises augmentent leurs dépenses en matière de protection, moins d’un tiers d’entre elles estiment pouvoir se remettre rapidement d’une attaque mineure.

Dans ce contexte, définir un RPO réaliste n’est plus optionnel. Ce qu’il faut savoir également, c’est que le RPO est directement lié à votre politique de sauvegarde. Plus les sauvegardes sont fréquentes, plus le RPO peut être réduit, à condition que les sauvegardes soient testées et stockées selon la règle 3-2-1-1-0 recommandée par les experts en continuité d’activité.

RTO, RPO et WRT : la formule qui change tout

Bien définir le RTO et le RPO est essentiel, mais il ne faut pas oublier le WRT (Work Recovery Time), qui correspond au temps nécessaire pour vérifier et rendre les services opérationnels après la restauration.

RTO + WRT = MTD (Maximum Tolerable Downtime) : Le MTD représente la durée maximale pendant laquelle vos services peuvent être inopérants sans causer des dommages irréversibles.

Cette formule est souvent négligée dans les PRA des PME et ETI françaises. Une erreur courante consiste à fixer un RTO ambitieux (ex. : 2 heures) sans évaluer le WRT réel, qui peut dépasser le RTO lui-même si les équipes ne sont pas formées aux procédures de vérification post-restauration. En termes d’interaction, un faible RTO combiné à un WRT efficace minimise l’impact global d’une crise sur votre entreprise.

Indicateur Définition Exemple Remarque
RTO Durée max. d’indisponibilité tolérée 4 heures Viser un seuil inférieur à 4h
RPO Volume max. de données perdues accepté 2 heures de production Plus il est court, moins il y a de perte de données
WRT Temps de vérification et de remise en service 1 heure À minimiser
MTD Durée max. avant dommages irréversibles = RTO + WRT 5 heures Seuil critique

Pourquoi ces indicateurs sont cruciaux pour un PRA ?

En France, le contexte réglementaire renforce la nécessité de prendre ces indicateurs au sérieux. Aussi, la directive NIS2, entrée en vigueur en octobre 2024, impose aux entités de démontrer leur capacité à se remettre d’un incident majeur, à commencer par :

  • Un alignement avec les objectifs métiers : le RTO et le RPO doivent être définis en collaboration avec des équipes métiers pour garantir qu’ils répondent aux besoins réels de l’organisation.
  • L’optimisation des ressources : ces indicateurs permettent de prioriser les investissements dans les infrastructures IT et les outils nécessaires.
  • Des tests et des ajustements réguliers : ils servent de base pour évaluer l’efficacité des tests de reprise et ajuster les stratégies en fonction des évolutions du système information.
Diagramme RTO RPO WRT MTD : objectifs de reprise après sinistre informatique

Comment calculer son RTO et son RPO en 4 étapes ?

La définition du RTO et du RPO doit reposer sur une méthodologie structurée, alignée sur les réalités métiers et validée par les décideurs de l’entreprise.

Étape 1 : Réaliser une Business Impact Analysis (BIA)

La BIA identifie les processus critiques de l’entreprise et quantifie l’impact d’une interruption dans le temps : impact financier, impact réglementaire, impact réputationnel. Pour chaque processus, on détermine le niveau de criticité (P1, P2, P3), le seuil de tolérance à l’interruption et le volume de données générées par unité de temps.

Étape 2 : Cartographier les dépendances du SI

Un processus métier critique dépend souvent de plusieurs composants IT comme les serveurs applicatifs, les bases de données, les connexions réseau ou l’annuaire Active Directory. La cartographie des dépendances permet de définir des RTO et RPO cohérents pour chaque couche de l’infrastructure.

Étape 3 : Valider avec les directions métiers et la direction générale

Le RTO et le RPO engagent l’entreprise juridiquement et financièrement. Ils doivent être validés par la direction générale, les directions métiers et bien sûr la DSI. Cette validation garantit que les indicateurs reflètent des engagements réalistes, budgétés et testables.

Étape 4 : Tester, mesurer, ajuster

Les tests de reprise (DR drills) doivent être réalisés au minimum une fois par an (idéalement deux fois) dans des conditions représentatives. Chaque test doit mesurer l’écart entre les objectifs théoriques et les résultats réels, et donner lieu à un plan de remédiation.

Plan de reprise externalisé avec Veeam et adista

Le RTO et le RPO sont des objectifs à atteindre grâce à des outils, des processus et une expertise opérationnelle. En tant que partenaire Veeam Platinium, adista garantit à ses clients des niveaux de service (SLA) alignés sur leurs RTO et RPO contractuels, avec une disponibilité de 99,90 % sur des datacenters souverains français.

adista s’appuie donc sur Veeam Cloud Connect pour vous proposer un Plan de Reprise d’Activité externalisé, managé par nos experts.

Voici 2 solutions pour répondre à vos enjeux principaux : 

Garantir la reprise du SI

  • Stockage des données sur 1 DC souverain
  • Disponibilité 99,90%
  • Licence Veeam Cloud Connect pour Backup Copy/serveur déclaré
  • Ressources vServer par gabarit
  • Allocation Volume par To
  • Assistance au déclenchement en réel H24

 Sécuriser la survie de votre entreprise

  • Stockage des données sur 1 DC souverain
  • Disponibilité 99,90%
  • Licence Veeam Cloud Connect pour Backup Copy/serveur déclaré
  • Ressources vServer par Gabarit
  • Allocation Volume par To
  • EDR Managé sur serveurs On-Prem
  • Contrôle des jobs de Réplication
  • Test de déclenchement annuel
  • Assistance au déclenchement en réel H24

RTO, RPO et PRA sont étroitement liés

Le RTO et le RPO sont des composantes essentielles d’une stratégie de reprise d’activité réussie. Une définition claire et alignée sur les priorités métiers est indispensable pour limiter les impacts d’un sinistre et garantir la résilience de l’organisation.

En intégrant pleinement ces notions dans votre PRA, vous construisez un cadre solide pour sécuriser vos activités, protéger vos données critiques et préserver la confiance de vos clients et partenaires.

FAQ : Vos questions sur le RTO et le RPO

Quelle est la différence entre RTO et RPO ?

Le RTO (Recovery Time Objective) définit le temps maximal acceptable pour restaurer un système après une panne. Le RPO (Recovery Point Objective) définit la quantité maximale de données que l’entreprise peut se permettre de perdre, exprimée en durée. Un RTO de 4 heures signifie que le système doit être opérationnel dans les 4 heures suivant l’incident. Un RPO de 2 heures signifie que les données perdues ne doivent pas dépasser 2 heures de production.

Comment définir un bon RTO pour mon entreprise ?

Un RTO réaliste se définit en trois étapes : (1) réaliser une Business Impact Analysis pour identifier les processus critiques ; (2) quantifier l’impact financier et opérationnel d’une interruption heure par heure ; (3) valider le RTO avec la direction générale et les responsables métiers, en cohérence avec le budget de reprise disponible.

Qu’est-ce que le MTD et en quoi diffère-t-il du RTO ?

Le MTD (Maximum Tolerable Downtime) est la durée totale maximale d’indisponibilité avant que les dommages deviennent irréversibles. Il inclut le RTO (restauration technique) et le WRT (Work Recovery Time : vérification et remise en production). La formule est : MTD = RTO + WRT.

Le PRA externalisé avec adista garantit-il mon RTO et mon RPO ?

Oui. Dans le cadre d’un DRaaS (Disaster Recovery as a Service) avec adista, les niveaux de service (SLA) sont contractualisés et alignés sur vos RTO et RPO définis ensemble lors du cadrage. adista s’appuie sur Veeam Cloud Connect et ses datacenters souverains pour garantir une disponibilité de 99,90 % et une assistance au déclenchement en réel 24h/24.

Partager

Inscrivez vous à la Newsletter

Restez au courant de nos dernieres actualités !