Dicionário de Dados Tradicional vs Analítico

Dicionário de Dados Tradicional vs Analítico

Anteriormente explicamos com detalhes o que é um dicionário de dados de Data Analytics, apresentamos seu conceito e diferenças quando comparados com dicionário de dados tradicionais.

Uma das principais diferenças entre dicionários tradicionais e de Data Analytics é que os dicionários analíticos integram conhecimentos negócio em diferentes níveis de granularidade, removendo ambiguidades sem priorizar requisitos de sistemas. Isso não deve reduzir a importância dos dois tipos de dicionários em seus contextos. (Joni Hoppen)

Embora a finalidade de ambos os dicionários seja a mesma, ambos buscam unificar e padronizar informações sobre os dados guardados em sistemas de informação.

Portanto, neste artigo vamos apresentar um comparativo entre os dois tipos de dicionário de dados e o seu papel nas atividades das empresas.

Dicionários Tradicionais

Os modelos tradicionais, são mais complexos e detalhados e fazem parte de de processos maduros e boas práticas de engenharia de software, informando até o tamanho do texto permitido em cada coluna. Por exemplo, a coluna nome do paciente tem um limite de 50 caracteres.

Estas informações são relevantes para garantir o planejamentos da infraestrutura ou stack tecnológico, tais como escolha de uma linguagem de programação, o tipo de integração de sistemas e diversas atividades que garantem a operação diária da empresa.

Contudo, quando se planeja utilizar a Inteligência Artificial e algoritmos de mineração de dados, estas informações podem ser irrelevantes e adicionam grande complexidade ao processo de análise.

Dicionários de Data Analytics (dados analíticos)

Para que um modelo tradicional de dicionário (mais completo) seja adequado aos processos de Data Analytics na criação de datasets (o que é um dataset?), ele precisa ser ajustados aos perfis profissionais que irão consumir a informação.

Os clientes dos dicionários analíticos são, sobretudo, cientistas de dados e analistas de negócios que possuem um grande interesse na assertividade das predições/prescrições dos modelos estatísticos e integração com o modelo de negócio.

Em data analytics, os dicionários estão mais focados nos significado das linhas (registros) dos datasets e das colunas das tabelas (variáveis, fatores, características) para que pessoas envolvidas pensem sobre o problema de negócio (o que se quer analisar) na forma mais prática e simplificada possível.

Tabela comparativa

Na tabela a seguir, apresentamos algumas sugestões de atividades e os clientes dos dicionários tradicionais da engenharia de software e dos dicionários analíticos.

AtividadeTradicional
(Tecnologia da Informação)
Dicionário de Analytics
(Escritório de Ciência de dados)
Ambos
Integração de sistemasX  
Modelagem de bancos de dados;X  
Migração de sistemasX  
Higienização de dados  X
Criação de modelos, exploratórios,  preditivos e prescritivos. X 
Geração de relatórios analíticos  X
Dados transacionaisX  
Dados analíticos X 
Tabela comparativa de atividades e dicionários de dados

Modelo de dicionário de dados grátis

Neste artigo (o que são dicionários de dados analíticos?) é possível baixar um modelo de dicionário que vai direto ao ponto.

Quem é a Aquarela Analytics?

A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial na indústria e em grandes empresas. Por meio da plataforma Vortx e da metodologia DCIM (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial),  Auren (energia), Scania e Grupo Randon (automotivo), SolarBR Coca-Cola (alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Telefônica Vivo (Telecomunicações), dentre outros. Fique atento às novas publicações diárias da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!

Autor

Dramas comuns na implementação da cultura de Data Analytics

Dramas comuns na implementação da cultura de Data Analytics

Nos últimos 4 anos, nós da Aquarela fizemos um levantamento sobre o mercado de análise de dados e sua cultura dentro das organizações. Descobrimos alguns padrões interessantes sobre os dramas mais comuns que conduzem à dificuldade de retornar os investimentos de data analytics. Menos de 4% dos projetos de analytics retornam o investimento. Como o tempo é cada vez mais curto, tanto para quem escreve como para quem lê, seguem as informações resumidas sobre esses padrões.

Padrões e dramas comuns na análise de dados dentro das empresas

Piá do Excel

O piá do Excel (guri, rapaz ou menino – dependendo da região do país), é um tipo típico nas empresas. Sua função é ser uma prótese cognitiva que concatena informação e memoriza fórmulas e processos para tornar refém todas as pessoas ao seu redor. Por isso ele é muito respeitado, admirado e conhecido. Sua saída implica, em alguns casos, em pânico, confusão e até pressão alta.

Capoeiras Cognitivas

A dança/luta física e ritmada da capoeira é uma atividade mental altamente valorizada e necessária para conseguirmos administrar tantas informações de tantas formas e em tão pouco tempo para gerar uma conclusão relevante ao final. A capoeira cognitiva é importante para administrar a parálise (paralisia por excesso de análise)

Uma andorinha não faz verão

Tipicamente se busca uma única resposta para todos os problemas. A única forma de se resolver problemas sistêmicos é atacando-os de forma sistêmica com a menor dependência possível do piá do Excel. Geralmente acontece o inverso causando problemas para ambos.

Problemas de causa e efeito

Todo analista de dados precisa validar suas hipóteses e refletir bastante sobre a relação de causa e efeito das decisões. Por exemplo, o bom analista de dados sabe que uma andorinha não faz verão. Sabe que todas elas juntas também não, pois o verão é causando por outros fatores.

Desalinhamentos entre software e software (isso mesmo Software e Software)

Compramos o melhor piano da loja e na próxima semana vamos mostrar suas composições aos clientes que já estão confirmando a presença no evento.

Altere a palavra piano por software, composições por relatório e evento por reunião imaginando que nunca houve um piano na empresa e que poucos funcionários estudaram música. Sair mudando softwares e processos sem uma orientação arquitetural de análise é um risco parecido.

Como resolver essas questões dentro da sua própria empresa?

Temos a visão que o processo de análise de dados deve ser amarrado à cultura organizacional e compartilhada com todos dos papéis e em todos os níveis da empresa. 

Com a proposta de auxiliar nessa busca, de forma introdutória, mas estruturada e tangível, elaboramos a metodologia DCIM (Data Culture Introduction Metodology) a qual é apresentada no curso “Introdução à Cultura de Data Analytics com IA” com um foco bastante introdutório e didático, que faz os alunos aprenderem colocando a mão na massa e resolvendo problemas informacionais imediatamente.

Os técnicos e gestores podem se beneficiar melhorando sua comunicação sobre estratégias de dados de acordo com os níveis de maturidade de dados da gestão da empresa. A importância destas habilidades estão relatadas no artigo “O Profissional de Data Science na visão da Aquarela”.

Quem é a Aquarela Analytics?

A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial na indústria e em grandes empresas. Por meio da plataforma Vortx e da metodologia DCIM (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial),  Auren (energia), Scania e Grupo Randon (automotivo), SolarBR Coca-Cola (alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Telefônica Vivo (Telecomunicações), dentre outros. Fique atento às novas publicações diárias da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!

Autores