O que é data warehousing?
O data warehousing é o armazenamento eletrônico de uma grande quantidade de informações por uma empresa ou organização. O data warehousing é um componente vital da inteligência de negócios que emprega técnicas analíticas em dados de negócios.
O conceito de data warehousing foi introduzido em 1988 pelos pesquisadores da IBM Barry Devlin e Paul Murphy. A necessidade de armazenar dados evoluiu à medida que os sistemas de computador se tornaram mais complexos e lidaram com quantidades crescentes de dados. Um livro-chave sobre armazenamento de dados é "Building the Data Warehouse", da WH Inmon, que foi publicado pela primeira vez em 1990 e foi reimpresso várias vezes desde então.
Como o Data Warehousing funciona
O data warehousing é usado para fornecer mais informações sobre o desempenho de uma empresa, comparando dados consolidados de várias fontes heterogêneas. Um data warehouse é projetado para executar consultas e análises em dados históricos derivados de fontes transacionais.
Depois que os dados são incorporados ao armazém, eles não são alterados e não podem ser alterados, pois um data warehouse executa análises em eventos que já ocorreram, concentrando-se nas alterações nos dados ao longo do tempo. Os dados armazenados devem ser armazenados de maneira segura, confiável, fácil de recuperar e fácil de gerenciar.
Há certas etapas que são tomadas para criar um armazém de dados. O primeiro passo é a extração de dados, que envolve a coleta de grandes quantidades de dados de vários pontos de origem. Após a compilação dos dados, eles passam pela limpeza dos dados, o processo de pesquisar os dados em busca de erros e corrigir ou excluir os erros encontrados.
Os dados limpos são então convertidos de um formato de banco de dados para um formato de armazém. Depois de armazenados no armazém, os dados passam por classificação, consolidação, resumo, etc., para que sejam mais coordenados e fáceis de usar. Com o tempo, mais dados são adicionados ao armazém à medida que as múltiplas fontes de dados são atualizadas.
Principais Takeaways
- O data warehousing é o armazenamento eletrônico de uma grande quantidade de informações por uma empresa ou organização. Um data warehouse é projetado para executar consultas e análises de dados históricos derivados de fontes transacionais para fins de inteligência de negócios e mineração de dados. insights sobre o desempenho de uma empresa comparando dados consolidados de várias fontes heterogêneas.
Considerações especiais: mineração de dados
As empresas podem armazenar dados para uso em exploração e mineração de dados, procurando padrões de informações que os ajudarão a melhorar seus processos de negócios. Um bom sistema de data warehousing também pode facilitar o acesso de diferentes departamentos dentro de uma empresa.
Por exemplo, um data warehouse pode permitir que uma empresa avalie facilmente os dados da equipe de vendas e ajude a tomar decisões sobre como melhorar as vendas ou otimizar o departamento. A empresa pode optar por se concentrar nos hábitos de consumo de seus clientes para posicionar melhor seus produtos e aumentar as vendas.
Com o data warehousing, a empresa pode reunir dados históricos dos gastos de seus clientes nos últimos 20 anos, por exemplo, e executar análises nesses dados. As informações resultantes podem fornecer informações sobre as preferências de seus consumidores; a hora do dia, mês ou ano com maiores vendas; ou cliente com maior gasto no ano.
O armazenamento e gerenciamento eficazes de dados também são os que tornam possíveis os processos, como iniciar reservas de viagens e usar caixas eletrônicos.
O processo de mineração de dados é dividido em cinco etapas:
- As organizações coletam dados e os carregam em seus armazéns de dados, armazenando e gerenciando os dados, em servidores internos ou na nuvem.Analistas de negócios, equipes de gerenciamento e profissionais de tecnologia da informação acessam os dados e determinam como eles querem organizá-los. O software do aplicativo classifica os dados com base nos resultados do usuário. O usuário final finalmente apresenta os dados em um formato fácil de compartilhar, como um gráfico ou tabela.
Data Warehousing vs. Bancos de Dados
Um data warehouse não é necessariamente o mesmo conceito que um banco de dados padrão. Um banco de dados é um sistema transacional configurado para monitorar e atualizar dados em tempo real para ter apenas os dados mais recentes disponíveis. Um data warehouse é programado para agregar dados estruturados durante um período de tempo. Por exemplo, um banco de dados pode ter apenas o endereço mais recente de um cliente, enquanto um data warehouse pode ter todos os endereços em que o cliente viveu nos últimos 10 anos.
