Anteriormente explicamos com detalhes o que é um dicionário de dados de Data Analytics, apresentamos seu conceito e diferenças quando comparados com dicionário de dados tradicionais.

Uma das principais diferenças entre dicionários tradicionais e de Data Analytics é que os dicionários analíticos integram conhecimentos negócio em diferentes níveis de granularidade, removendo ambiguidades sem priorizar requisitos de sistemas. Isso não deve reduzir a importância dos dois tipos de dicionários em seus contextos. (Joni Hoppen)

Embora a finalidade de ambos os dicionários seja a mesma, ambos buscam unificar e padronizar informações sobre os dados guardados em sistemas de informação.

Portanto, neste artigo vamos apresentar um comparativo entre os dois tipos de dicionário de dados e o seu papel nas atividades das empresas.

Dicionários Tradicionais

Os modelos tradicionais, são mais complexos e detalhados e fazem parte de de processos maduros e boas práticas de engenharia de software, informando até o tamanho do texto permitido em cada coluna. Por exemplo, a coluna nome do paciente tem um limite de 50 caracteres.

Estas informações são relevantes para garantir o planejamentos da infraestrutura ou stack tecnológico, tais como escolha de uma linguagem de programação, o tipo de integração de sistemas e diversas atividades que garantem a operação diária da empresa.

Contudo, quando se planeja utilizar a Inteligência Artificial e algoritmos de mineração de dados, estas informações podem ser irrelevantes e adicionam grande complexidade ao processo de análise.

Dicionários de Data Analytics (dados analíticos)

Para que um modelo tradicional de dicionário (mais completo) seja adequado aos processos de Data Analytics na criação de datasets (o que é um dataset?), ele precisa ser ajustados aos perfis profissionais que irão consumir a informação.

Os clientes dos dicionários analíticos são, sobretudo, cientistas de dados e analistas de negócios que possuem um grande interesse na assertividade das predições/prescrições dos modelos estatísticos e integração com o modelo de negócio.

Em data analytics, os dicionários estão mais focados nos significado das linhas (registros) dos datasets e das colunas das tabelas (variáveis, fatores, características) para que pessoas envolvidas pensem sobre o problema de negócio (o que se quer analisar) na forma mais prática e simplificada possível.

Tabela comparativa

Na tabela a seguir, apresentamos algumas sugestões de atividades e os clientes dos dicionários tradicionais da engenharia de software e dos dicionários analíticos.

AtividadeTradicional
(Tecnologia da Informação)
Dicionário de Analytics
(Escritório de Ciência de dados)
Ambos
Integração de sistemasX  
Modelagem de bancos de dados;X  
Migração de sistemasX  
Higienização de dados  X
Criação de modelos, exploratórios,  preditivos e prescritivos. X 
Geração de relatórios analíticos  X
Dados transacionaisX  
Dados analíticos X 
Tabela comparativa de atividades e dicionários de dados

Modelo de dicionário de dados grátis

Neste artigo (o que são dicionários de dados analíticos?) é possível baixar um modelo de dicionário que vai direto ao ponto.

Quem é a Aquarela Advanced Analytics?

Somos pioneiros em Advanced Analytics na indústria brasileiro, aplicando tecnologias e metodologias (download e-book gratuito) de Inteligência Artificial, aprendizado de Máquina e Web Semântica.

Por meio de nossa plataforma Vortx, criamos e entregamos valor de negócios para grandes clientes na indústria e de serviços tais como Embraer, Grupo Randon e outros.

Entre em contato conosco para discutir sua estratégia de dados também não perca nossos conteúdos exclusivos, assinando nossa newsletter!