O que é um armazenamento de dados?
Um armazenamento de dados é um repositório digital que armazena e protege as informações em sistemas de computador. Um armazenamento de dados pode ser um armazenamento conectado à rede, armazenamento em nuvem distribuído, um disco rígido físico ou armazenamento virtual. Ele pode armazenar dados estruturados, como tabelas de informações, e dados não estruturados, como e-mails, imagens e vídeos. As organizações usam armazenamentos de dados para reter, compartilhar e gerenciar informações nas unidades de negócios.
Por que um armazenamento de dados é importante?
Você pode usar um armazenamento de dados para salvar informações de forma confiável em sistemas de computador e evitar a perda de dados. Os sistemas de computador armazenam informações em dispositivos de armazenamento persistentes. O armazenamento persistente não é volátil, o que significa que o armazenamento retém os dados mesmo depois que o dispositivo é desligado. Isso garante que o sistema do computador tenha acesso aos mesmos dados após ser ligado novamente.
As empresas usam armazenamentos de dados para gerenciar, categorizar e otimizar dados para operações, análises, relatórios e retenção de dados, o que é importante para a conformidade regulamentar. Os armazenamentos de dados têm vários casos de uso, como dados criados e consumidos por aplicações, arquivamento de dados, análise de dados e recuperação de desastres.
Devido às complexidades dos requisitos de dados, as empresas usam diferentes tipos de infraestrutura de armazenamento de dados para fornecer acessibilidade, redundância, governança e transparência. Por exemplo, as organizações usam O Amazon Elastic File System (Amazon EFS) para um sistema de arquivos sem servidor e o Amazon Simple Storage Service (Amazon S3) para armazenamento de objetos.
Quais são alguns termos relacionados a armazenamentos de dados?
No contexto do armazenamento de dados, vários termos são frequentemente usados de forma intercambiável, mas têm significados ligeiramente diferentes. Veja alguns exemplos a seguir.
Banco de dados
Um banco de dados é um sistema de armazenamento organizado. A maioria dos bancos de dados é baseada na arquitetura de banco de dados relacional. O Relational Database Management System (RDBMS – Sistema de gerenciamento de bancos de dados relacionais) permite que os usuários armazenem dados em tabelas associadas a pontos de dados específicos. As organizações usam bancos de dados para armazenar dados transacionais, como registros contábeis, de vendas e administrativos.
Leia sobre bancos de dados relacionais »
Armazenamentos de dados em comparação com bancos de dados
As discussões sobre armazenamentos de dados envolvem diferentes métodos para armazenar e recuperar informações. Um banco de dados é um método que permite que as aplicações armazenem, compartilhem e recuperem dados facilmente. Ao contrário dos sistemas de arquivos, um banco de dados adere a regras específicas de como os dados são organizados, formatados e armazenados no banco de dados.
Data warehouse
Um data warehouse é uma extensa coleção de informações relacionadas a negócios adquiridas de várias fontes. As empresas usam data warehouses para dar suporte à business intelligence e análise de dados. Analistas de negócios e cientistas de dados obtêm insights acionáveis de um data warehouse.
Armazenamentos de dados em comparação com data warehouses
Banco de dados é um termo abrangente que inclui diferentes hardwares, tecnologias, formatos e arquiteturas para armazenar e recuperar informações. Um data warehouse é um tipo específico de armazenamento de dados para consolidar dados analíticos para empresas. Por exemplo, a GE Renewable Energy usa o AWS Redshift para obter novos insights sobre seus dados coletados.
Como funciona um armazenamento de dados?
Um dispositivo de armazenamento de dados físicos é a tecnologia subjacente por trás de um armazenamento de dados. Você pode ler e gravar informações no dispositivo em formatos específicos, como arquivos, tabelas ou blocos. O dispositivo pode ser local, remoto ou na nuvem. Grandes armazenamentos de dados são normalmente distribuídos em vários dispositivos físicos em diferentes localizações geográficas. Os sistemas e serviços de software abstraem as operações subjacentes do armazenamento de dados.
Damos alguns exemplos de dispositivos físicos abaixo. Diferentes tipos de dispositivos de armazenamento de dados fornecem vários graus de segurança e redundância.
Unidades flash e SSD
Um Solid State Drive (SSD – Unidade de estado sólido) é uma tecnologia de semicondutor que permite a gravação e leitura de dados em chips de memória flash. A tecnologia de armazenamento flash estava disponível comercialmente em pen-drives antes de se tornar uma alternativa aos Hard Disk Drives (HDDs – Unidades de disco rígido). Comparado a um HDD, um SSD físico não tem partes móveis, o que significa que ele tem uma performance mais rápida e uma vida útil mais longa.
Array de armazenamento híbrido
A matriz de armazenamento híbrido é uma configuração de armazenamento físico que consiste em um SSD e um HDD. Enquanto um SSD oferece uma operação de baixa latência, custa muito mais armazenamento por unidade do que um HDD. Portanto, as organizações usam uma matriz de armazenamento híbrida para equilibrar performance, capacidade e custo.
RAID
RAID significa uma matriz redundante de discos independentes. É uma tecnologia que mantém os mesmos dados em vários lugares em um SSD.
Quais são os diferentes formatos de armazenamento de dados?
Os armazenamentos de dados são projetados para processar e organizar dados em diferentes formatos.
Armazenamento de arquivos
O armazenamento de arquivos organiza as informações armazenadas em uma hierarquia de arquivos e pastas de cima para baixo. Os computadores usam o armazenamento de arquivos para facilitar o armazenamento, a pesquisa e a recuperação de informações para os usuários. Você pode usar o sistema de armazenamento de arquivos para armazenar e organizar praticamente qualquer tipo de dados. Embora o armazenamento de arquivos seja fácil de usar, é difícil escalar horizontalmente devido à sua arquitetura fortemente conectada.
Leia sobre armazenamento de arquivos »
Armazenamento em blocos
O armazenamento em bloco divide os dados em várias partes de segmentos de tamanho uniforme chamados blocos. O sistema de armazenamento em blocos armazena diferentes blocos de dados em diferentes dispositivos físicos. Ele recuperará e remontará as peças quando os usuários solicitarem dados específicos. Ele usa um sistema de mapeamento para localizar os dados solicitados com base nos metadados do bloco. Metadados são informações adicionais que ajudam usuários ou aplicações a encontrar informações específicas no armazenamento.
Leia sobre o armazenamento em blocos »
Armazenamento de objetos
O armazenamento de objetos armazena dados não estruturados em um repositório escalável e autossuficiente que pode ser hospedado em diferentes servidores. Cada bloco de dados que pertence a um objeto é descrito em seus metadados. Por exemplo, um objeto pode armazenar conteúdo de mídia social, vídeos, e-mails e arquivos de áudio. As aplicações procuram informações no armazenamento de objetos usando atributos de metadados específicos, como resolução de vídeo, duração e localização.
Quais são os diferentes tipos de armazenamentos de dados?
Existem vários tipos diferentes de armazenamento de dados, cada um com configuração e características exclusivas.
Armazenamento de conexão direta
O armazenamento de conexão direta (DAS) consiste em dispositivos de armazenamento que se conectam fisicamente a um computador. Por exemplo, uma configuração DAS conecta um disco rígido, disco óptico ou unidade flash a um computador. A criação de cópias de backup no DAS é bastante simples, mas o compartilhamento de dados com outros computadores é difícil.
Armazenamento conectado à rede
O armazenamento conectado à rede (NAS) é um dispositivo de armazenamento dedicado a arquivos que disponibiliza dados continuamente para que as aplicações e os usuários colaborem efetivamente por uma rede. Os dispositivos NAS são servidores especializados que lidam apenas com armazenamento de dados e solicitações de compartilhamento de arquivos. Eles fornecem serviços de armazenamento rápidos, seguros e confiáveis para redes privadas.
Rede de área de armazenamento
Uma Storage Area Network (SAN – Rede de área de armazenamento) é uma infraestrutura de armazenamento de dados de alta velocidade que usa diferentes tipos de mídia e protocolos de armazenamento. As empresas usam a SAN para dimensionar o armazenamento em bloco com facilidade e economia. A SAN usa virtualização de armazenamento para ocultar a complexidade da infraestrutura de vários dispositivos.
Armazenamento na nuvem
O armazenamento em nuvem é uma infraestrutura de armazenamento distribuído hospedada e gerenciada por provedores de nuvem. É mais escalável, flexível e acessível remotamente em comparação com o armazenamento on-premises. Por exemplo, os usuários podem se conectar aos serviços de armazenamento da Nuvem AWS desde que tenham uma conexão com a Internet e estejam autorizados a acessar os dados. O armazenamento em nuvem também é econômico, pois os usuários pagam apenas pela capacidade utilizada.
Armazenamento na nuvem híbrida
O armazenamento em nuvem híbrida permite que as empresas separem dados entre serviços de armazenamento on-premises e em nuvem. O armazenamento em nuvem híbrida ajuda as empresas a migrar da arquitetura legada para um ambiente de nuvem mais seguro e de baixo custo.
Como a AWS pode ajudar com seus requisitos de armazenamento de dados?
A AWS fornece várias dezenas de serviços de armazenamento em nuvem para atender aos seus requisitos de armazenamento de dados. Além disso, você tem a opção de hospedar o que quiser em suas instâncias do Amazon Elastic Compute Cloud (Amazon EC2). Para escolher o melhor serviço de armazenamento em nuvem da AWS para suas necessidades, você precisa:
- Segmentar seu sistema em workloads.
- Identificar um mecanismo de armazenamento de dados que seja mais adequado para uma determinada workload, não um único armazenamento de dados para todo o sistema.
- Otimizar ainda mais por custo e performance para encontrar o serviço de armazenamento de dados mais adequado para você.
Por exemplo, o Amazon Relational Database Service (Amazon RDS) é uma escolha popular para organizações que desejam configurar e dimensionar bancos de dados relacionais. Ele fornece às aplicações um armazenamento de dados em nuvem de alta disponibilidade para armazenar dados operacionais persistentes. O Amazon RDS oferece uma solução de provisionamento de banco de dados autogerenciada que libera os desenvolvedores da tediosa configuração da infraestrutura de armazenamento.
Comece a usar armazenamentos de dados na AWS inscrevendo-se em uma conta da AWS hoje mesmo.
Próximas etapas para datastores
Obtenha acesso instantâneo ao nível gratuito da AWS.