O que é recuperação de desastres?

A recuperação de desastres é o processo pelo qual uma organização antevê e aborda os desastres relacionados à área de tecnologia. O processo de preparação e recuperação de qualquer evento que impeça que uma workload ou sistema cumpra seus objetivos de negócios em seu local principal de implantação, como quedas de energia, fenômenos naturais ou problemas de segurança. As metas de recuperação de desastres são medidas com objetivos de ponto de recuperação (RPO) e objetivos de tempo de recuperação (RTO). As falhas tratadas pela recuperação de desastres tendem a ser mais raras do que aquelas cobertas pela alta disponibilidade e são eventos de desastre em maior escala. A recuperação de desastres inclui os procedimentos e políticas da organização para a rápida recuperação quando ocorrem eventos como esses.

O que torna a recuperação de desastres importante?

Um desastre é um problema inesperado que resulta em lentidão, interrupção ou pane da rede em um sistema de TI. As indisponibilidades ocorrem por vários motivos, inclusive os seguintes exemplos:

  • Um terremoto ou incêndio
  • Falhas de tecnologia
  • Incompatibilidades de sistema
  • Erro humano 
  • Acesso deliberado sem autorização por terceiros

Esses desastres interrompem as operações dos negócios, causam problemas no fornecimento de serviços aos clientes e resultam em perda de receita. Um plano de recuperação de desastres ajuda as organizações a responder prontamente a eventos disruptivos e fornece benefícios importantes.

Garantia da continuidade dos negócios

Quando há um desastre, ele pode afetar negativamente todos os aspectos da empresa, além de costumar ser um evento caro. Ele também interrompe as operações habituais dos negócios, já que a produtividade da equipe é reduzida devido ao acesso limitado às ferramentas necessárias para o trabalho. Um plano de recuperação de desastres incita a retomada rápida de sistemas e dados reserva, permitindo que as operações possam continuar de acordo com o cronograma. 

Aprimoramento da segurança do sistema

A integração de proteção de dados, backup e processos de restauração em um plano de recuperação de desastres limita o impacto de ransomware, malware ou outros riscos de segurança para os negócios. Por exemplo, os backups de dados na nuvem têm diversos recursos integrados de segurança para limitar atividades suspeitas antes que ela afetem os negócios. 

Aumento da retenção de clientes

Em caso de desastre, os clientes questionam a confiabilidade dos serviços e práticas de segurança de uma organização. O nível de frustração do cliente é diretamente proporcional ao tempo que um desastre afeta uma empresa. Um bom plano de recuperação de desastres reduz esse risco ao treinar os funcionários para lidar com consultas dos clientes. Os clientes ganham confiança ao observar que os negócios estão adequadamente preparados para lidar com qualquer desastre. 

Redução dos custos de recuperação

Dependendo da gravidade, um desastre causa perda de receita e de produtividade. Um plano robusto de recuperação de desastres evita perdas desnecessárias, já que os sistemas voltam ao normal logo após o incidente. Por exemplo, soluções de armazenamento em nuvem são um método econômico para o backup de dados. Você pode gerenciar, monitorar e manter os dados enquanto a empresa opera normalmente. 

Como a recuperação de desastres funciona?

A recuperação de desastres tem como foco fazer os aplicativos voltarem a funcionar minutos após uma paralisação. As organizações abordam os três componentes a seguir.

Prevenção

Para reduzir a probabilidade de um desastre relacionado a tecnologias, os negócios precisam de um plano para garantir que todos os principais sistemas tenham o maior nível possível de confiabilidade e segurança. Como seres humanos não são capazes de controlar desastres da natureza, a prevenção só é aplicável a problemas de rede, riscos de segurança e erros humanos. Você precisa implementar as ferramentas e técnicas certas para a prevenção de desastres. Por exemplo, um software de testes de sistema que verifique automaticamente todos os novos arquivos de configuração antes de aplicá-los poderá prevenir erros e falhas de configuração. 

Antecipação

A antecipação inclui a previsão de possíveis desastres futuros, o conhecimento das consequências e o planejamento adequado dos procedimentos de recuperação de desastres. A previsão do que pode vir a acontecer é desafiadora, mas você pode criar uma solução de recuperação de desastres com base no conhecimento obtido de situações anteriores e por meio de análises. Por exemplo, a realização do backup na nuvem de todos os dados cruciais aos negócios em antecipação a futuras falhas de hardware em dispositivos on-premises é uma abordagem pragmática para o gerenciamento de dados.

Mitigação

A mitigação dita como uma empresa responde após um cenário de desastre. Uma estratégia de mitigação busca reduzir o impacto negativo sobre procedimentos comerciais normais. Todas as principais partes interessadas sabem o que fazer em caso de desastre, inclusive as etapas a seguir.

  • Atualização da documentação
  • Realização de testes frequentes de recuperação de desastres
  • Identificação de procedimentos operacionais manuais em caso de uma paralisação
  • Coordenação de uma estratégia de recuperação de desastres com o pessoal correspondente

Quais são os principais elementos de um plano de recuperação de desastres?

Um plano efetivo de recuperação de desastres contém os elementos básicos abaixo. 

Comunicação interna e externa

A equipe responsável pela criação, implementação e gerenciamento do plano de recuperação de desastres precisa se comunicar sobre suas funções e responsabilidades. Em caso de um desastre, a equipe deve saber quem é responsável por qual tarefa e como se comunicar com funcionários, clientes e colegas. 

Cronograma de recuperação

A equipe de recuperação de desastres precisa decidir sobre metas e prazos relacionados à retomada da operação normal dos sistemas após um desastre. Os cronogramas de alguns setores podem ser mais demorados do que outros, enquanto alguns setores exigem o retorno ao funcionamento normal em questão de minutos. 

O cronograma deve abordar os dois objetivos a seguir.

Objetivo tempo de recuperação

O objetivo de tempo de recuperação (RTO) é uma métrica que determina a quantidade máxima de tempo decorrida antes que você conclua uma recuperação de desastres. Seus RTOs podem variar de acordo com os sistemas e a infraestrutura de TI afetados.

Objetivo de ponto de recuperação

Um objetivo de ponto de recuperação (RPO) é a quantidade máxima de tempo aceitável para perda de dados após um desastre. Por exemplo, se o seu RPO for de minutos ou horas, você precisará fazer o backup constante de seus dados para locais de espelhamento em vez de apenas uma vez ao fim do dia.

Backups de dados

O plano de recuperação de desastres determina como você faz o backup dos seus dados. As opções incluem armazenamento em nuvem, backups com suporte de fornecedores e backups de dados internos fora da sede. Para responder a eventos de desastres naturais, os backups não devem ser feitos no local. A equipe deve determinar quem fará o backup dos dados, quais informações serão incluídos nos backups e como implementar o sistema.

Teste e otimização 

É necessário testar seu plano de recuperação de desastres ao menos uma ou duas vezes por ano. Você pode documentar e corrigir qualquer lacuna identificada durante esses testes. De modo semelhante, você deve atualizar todas as estratégias de segurança e proteção de dados com frequência a fim de prevenir acesso acidental não autorizado.

Como criar uma equipe de recuperação de desastres?

Uma equipe de recuperação de desastres inclui uma equipe colaborativa de especialistas, como especialistas em TI e pessoas em funções de liderança, que serão cruciais para a equipe. A equipe deve ter alguém que cuide das áreas abaixo.

Gerenciamento de crise

A pessoa responsável pelo gerenciamento de crise implementa imediatamente o plano de recuperação de desastres. Ela se comunica com outros membros da equipe e clientes, e coordena o processo de recuperação de desastres. 

Continuidade de negócios

O gerente de continuidade de negócios garante que o plano de recuperação de desastres esteja alinhado aos resultados da análise de impacto comercial. Ele inclui o planejamento de continuidade de negócios na estratégia de recuperação de desastres. 

Avaliação e recuperação de desastres

Os gerentes de avaliação de impactos são especialistas em infraestrutura de TI e aplicativos de negócios. Eles avaliam e consertam infraestrutura de rede, servidores e bancos de dados. Também gerenciam outras tarefas de recuperação de desastres, como nos exemplos a seguir.

  • Integrações com aplicativos
  • Manutenção de consistência de dados
  • Configuração e definições de aplicativo

Quais são os melhores métodos de recuperação de desastres?

Durante o planejamento da recuperação de desastres, os negócios implementam um ou mais dos métodos a seguir.

Backup

Fazer o backup de dados é um dos métodos mais fáceis de recuperação de desastres que todas as empresas implementam. O backup de dados importantes envolve o armazenamento de dados fora do local, na nuvem ou em um drive removível. Você deve fazer o backup dos dados com frequência a fim de mantê-lo atualizado. Por exemplo, ao fazer o backup na AWS, as empresas obtêm uma infraestrutura escalável que protege todos os tipos de dados. 

Recuperação de desastres em datacenter

Em caso de alguns tipos de desastres naturais, o equipamento certo pode proteger seu datacenter e contribuir para uma recuperação rápida de desastres. Por exemplo, ferramentas de supressão de incêndios ajudam equipamentos e dados a sobreviver às chamas, enquanto fontes secundárias de energia facilitam a continuidade dos negócios em caso de falta de energia. Da mesma forma, os datacenters da AWS têm sistemas inovadores que os protegem contra riscos artificiais e naturais.

Virtualização 

As empresas fazem o backup dos dados e operações usando máquinas virtuais (VMs) fora do local e que não são afetadas por desastres físicos. Com a virtualização como parte o plano de recuperação de desastres, os negócios automatizam alguns processos e conseguem se recuperar mais rapidamente de um desastre natural. A transferência contínua de dados e workloads para VMs como o Amazon Elastic Compute Cloud (Amazon EC2) é essencial para uma virtualização efetiva. 

Recuperação de desastres como serviço

Serviços de recuperação de desastres como o AWS Elastic Disaster Recovery podem transferir o processamento computacional e as operações comerciais cruciais de uma empresa para seus próprios serviços de nuvem em caso de desastre. Dessa forma, é possível manter operações normais no local do provedor mesmo que os servidores on-premises estejam inativos. O Elastic Disaster Recovery também protege contra a inatividade de regiões da nuvem. 

Local vazio

Em caso de um desastre natural, uma empresa transfere as operações para outra localização física raramente usada, chamada de local vazio. Assim, os funcionários têm um local para trabalhar e as funções comerciais podem continuar normalmente. Esse tipo de recuperação de desastres não protege nem recupera dados importantes, sendo necessário usar outros métodos de recuperação de desastres junto com esse.    

Como a AWS pode ajudar com a recuperação de desastres?

O Elastic Disaster Recovery é um serviço de recuperação de desastres que reduz o tempo de inatividade e a perda de dados com a recuperação rápida e confiável de aplicações on-premises e baseadas na nuvem. Ele é capaz de diminuir seu RPO para segundos e o RTO para apenas alguns minutos. Você pode recuperar as operações rapidamente após eventos inesperados, como problemas de software ou falhas de hardware do datacenter. O serviço também é uma solução flexível, permitindo que você adicione ou remova servidores de replicação e teste vários aplicativos sem conjuntos de habilidades especializadas.

O Elastic Disaster Recovery contém os benefícios abaixo.

  • Redução dos custos ao remover recursos ociosos dos locais de recuperação, de modo que você só paga pelo local completo de recuperação de desastres quando necessário.
  • Conversão de aplicativos baseados na nuvem para execução nativa na AWS.
  • Restauração dos aplicativos em minutos para o estado mais atualizado ou com base em um ponto anterior no tempo em caso de incidentes de segurança.

Comece a usar a recuperação de desastres na AWS criando uma conta da AWS hoje mesmo. 

Próximas etapas na AWS

Confira outros recursos relacionados a produtos
Saiba mais sobre os serviços de recuperação de desastres 
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastre-se 
Comece a criar no console

Comece a criar no Console de Gerenciamento da AWS.

Faça login