Quando um sistema crítico sai do ar, a gravidade do incidente depende de duas variáveis: quanto tempo a empresa consegue operar sem ele e qual volume de dados pode ser perdido sem comprometer a integridade da operação. Essas variáveis têm definição técnica precisa: RTO e RPO. Sem calculá-las para cada sistema, qualquer plano de disaster recovery se torna uma aposta, não uma estratégia.
RTO: o tempo máximo aceitável de recuperação
RTO, ou Recovery Time Objective, é o intervalo máximo tolerável entre o momento da falha e o retorno completo do sistema à operação. Não se trata de quanto tempo a equipe de TI leva para começar a agir, mas de quanto tempo o negócio suporta com aquele sistema indisponível antes que o impacto se torne crítico.
Para um ERP que processa pedidos, emite notas fiscais e alimenta o controle de estoque, o RTO pode ser de poucos minutos, porque cada minuto parado afeta diretamente o faturamento e a cadeia logística. Para um sistema de relatórios gerenciais, o RTO pode ser de algumas horas, já que o impacto operacional imediato é menor. O ponto essencial é que cada sistema da empresa tenha seu próprio RTO definido com base no impacto real que a sua indisponibilidade gera.
RPO: o volume máximo aceitável de perda de dados
RPO, ou Recovery Point Objective, define a quantidade máxima de dados que a empresa aceita perder em caso de falha. Ele está diretamente vinculado à frequência com que os dados são copiados ou replicados.
Se o RPO de um sistema é de 1 hora, o backup ou a replicação precisa ocorrer no mínimo a cada 60 minutos. Se for de 15 minutos, a replicação precisa ser quase contínua. Quando o RPO não está formalizado, a empresa só descobre a defasagem entre o último backup e o momento da falha na hora da restauração. Em operações onde o ERP gera centenas de transações por hora, essa diferença pode significar reprocessamento manual, inconsistências fiscais e perda de receita.
Por que esses indicadores precisam vir antes da solução
Sem RTO e RPO definidos, não é possível dimensionar corretamente a arquitetura de recuperação. Um ambiente que exige retorno em 15 minutos demanda replicação em tempo real e failover automatizado. Um ambiente com tolerância de 4 horas pode operar com backups periódicos e procedimentos manuais de restauração. A diferença de custo e complexidade entre esses dois cenários é significativa.
Para a diretoria financeira, RTO e RPO são a base para calcular o custo de indisponibilidade versus o investimento em continuidade. Quando o gestor de TI apresenta esses números, a conversa sobre disaster recovery deixa de ser técnica e passa a ser uma decisão de proteção financeira.
Como calcular RTO e RPO na prática
O processo parte do mapeamento dos sistemas críticos da operação. Para cada um, é preciso responder qual o impacto financeiro de cada hora de indisponibilidade, quantos colaboradores e processos são afetados diretamente, qual o volume de dados e transações gerados por hora e quanto tempo o negócio suporta sem aquele sistema antes que as consequências se tornem irreversíveis.
Com essas respostas, os sistemas podem ser classificados por camada de criticidade, e cada camada recebe RTO e RPO proporcionais ao seu impacto na operação e no faturamento.
Como a Opus Tech apoia essa definição
A Opus Tech inclui a análise de criticidade no processo de onboarding, mapeando sistemas, avaliando dependências e definindo RTO e RPO adequados para cada ambiente. O Smart Mirror oferece disaster recovery com replicação entre os data centers de Curitiba e Miami, ajustando a frequência de cópia e o tempo de recuperação à realidade de cada operação. O Smart Safe complementa com backup automatizado e políticas de retenção configuráveis.
Se a sua empresa ainda não formalizou esses indicadores, converse com a Opus Tech para mapear a criticidade dos seus sistemas e dimensionar a proteção adequada para cada camada.