. Organize as responsabilidades do banco de dados para grandes dados antes de implantar - Tudo Sobre Tecnologia

Há uma abundância de grandes soluções de tecnologia de banco de dados. A parte difícil é chegar ao que funciona melhor na situação de sua empresa. 
big_data2_iStock.jpg
Hadoop , HBase , bancos de dados relacionais, SQL (Structured Query Language ) e NoSQL ( não só structured query language ) têm sido mencionadas em estratégias de banco de dados para grandes volumes de dados. Mas depois de algum tempo, não consegue ser tantas opções que as empresas encontram-se sobrecarregados.
A boa notícia é que uma abundância de grandes soluções de tecnologia de banco de dados de dados existe. A parte difícil é conseguir através de todas estas soluções para chegar ao que funciona melhor na situação de sua empresa.
Planejadores de base de dados, invariavelmente descobrem que seus grandes dados deve fazer duas coisas bem do ponto de vista do banco de dados:
  1. Processar todos os grandes volumes de dados que são coletados em um ambiente de grupo, e
  2. Fornecer acesso rápido a esses dados on-line para o que pode ser de centenas ou até milhares de usuários ao mesmo tempo.
Nesse sentido, o grande volume de dados não é diferente de outros dados: algumas tecnologias de banco de dados são mais adequados para a massa (batch), o processamento, enquanto outros se especializam em um rápido acesso online.
Primeiro, vamos começar com o maciço processamento paralelo dos dados.

Processamento paralelo massivo

Hadoop é o software que surgiu para preencher esse nicho. É barato e escalável, porque pode processar em paralelo commodities plataformas de computação x86. Hadoop quebra os dados em pedaços que são processados ​​paralelamente e depois replicado entre os servidores. O resultado é rápido processamento em lotes de dados e também de replicação que virtualmente "failproofs" um sistema de dados grande.
Hadoop pode lidar com os petabytes e até exabytes de dados de grandes empresas que agora acham que tem de gerir. Ele usa MapReduce como um grande mecanismo de consulta de dados que os cientistas de dados podem explorar uma vez que os dados são processados ​​em HDFS ( Hadoop Distributed File System arquivos). Claro que, estas são questões de lote.


Acesso rápido

Para chegar ao ponto de oferecer grandes consultas de dados que estão online e mais próximo do tempo real, as empresas precisam de outras abordagens ao lado do banco de dados Hadoop com sua orientação batch. Para preencher o vazio, existem produtos NoSQL no mercado, tais como Cassandra , HBase , MongoDB , etc Estes produtos podem complementar lote Hadoop processamento pegando onde Hadoop sai de cena, uma vez que pode tira-se importantes peças de dados de consulta elegíveis a partir de arquivos do Hadoop e agregá-los em um banco de dados altamente pesquisável e acessível, que pode atender aos requisitos de desempenho e as necessidades de acesso de muitos usuários on-line simultâneos.
GHS-pictograma-acid.svg.png
 No entanto, como Hadoop, NoSQL soluções também têm as suas próprias falhas. Você pode dizer que eles não conseguem o "ACID" ( atomicidade, consistência, isolamento, durabilidade ) teste para banco de dados que os administradores de banco de dados corporativos procurar, e que os DBAs ter concedido sempre que trabalhar com bancos de dados SQL tradicionais.
O ACID significa para o seu banco de dados é que os dados que são operados sempre é concluída, ou não executar. Além disso, nenhuma transação é meio acabado nunca deixou; transações são mantidos isolados uns dos outros até que eles terminem, eo banco de dados controla todas as operações de dados para permitir a recuperação completa de qualquer falha do servidor.
Hoje, NoSQL não vem com garantias ACID, então isso é uma grande preocupação do ponto de vista de DBA. É também por isso que os provedores de soluções NoSQL estão a trabalhar arduamente para curar o problema.

Então, o que você faz?

Hadoop está ficando bem estabelecida como um mecanismo de processamento de facto lote para grandes volumes de dados, e praticamente todos os fornecedores de solução de tecnologia também abraçou. Isto torna mais lógico para as empresas a incorporar Hadoop em suas grandes estratégias de banco de dados de dados para processamento em lote.
Questões remanescentes realmente estão do lado de consulta on-line de grandes volumes de dados, consultas on-line eo que precisa para produzir.
Se os requisitos corporativos são para consultas de dados grandes em tempo quase real, e se haverá muitas dessas consultas ao mesmo tempo, NoSQL pode valer a pena o sacrifício de algumas das garantias de desempenho de banco de dados DBAs preferem. Por outro lado, se as demandas de consulta em tempo quase real de seus usuários tendem a ser pouco frequente, com uma base de usuários que se limita a apenas alguns indivíduos, marts e data warehouses tradicionais compatíveis com consultas SQL pode ser apropriada. Em alguns casos, as empresas poderiam encontrar-se em ambos os ambientes, optando por implantar o SQL em algumas circunstâncias e NoSQL em outros.

Mary Shacklett

Sobre Mary Shacklett

Mary E. Shacklett é presidente da Transworld Dados, uma empresa de pesquisa tecnológica e desenvolvimento de mercado. Antes de fundar a empresa, Mary foi Vice-Presidente Sênior de Marketing e Tecnologia da TCCU, Inc., uma empresa de serviços financeiros, o vice-presidente da ...

0 comentários Goocle+ 0 Facebook

Postar um comentário

 
Tudo Sobre Tecnologia © 2013-2020. Todos os direitos reservados. Tudo Sobre Tecnologia. Desenvolvido por TST
Topo