Tendências educacionais no pós Covid-19

Tendências educacionais no pós Covid-19

Em nossa visão como desenvolvedores de tecnologia para educação, Aquarela e Studos, entendemos que o uso intensivo de tecnologias de informação e inteligência artificial nos processos educacionais se farão cada vez mais presentes.

Este novo cenário ocorre tanto do ponto de vista da estratégia em planos de expansão comercial, precificação de matriculas e aquisição de escolas quanto em nível de operação, com recomendações personalizadas de ensino de acordo com o perfil do estudante, da escola, do conteúdo e da região do país.

Em um cenário pós Covid19, teremos uma crescente digitalização do ensino, apoiada pela capilaridade da internet e dos dispositivos móveis, e sobre tudo, dos novos hábitos.

Resumo das tendências:

  1. A evolução exponencial das plataformas digitais, que via internet, estarão e continuarão democratizando o ensino, seja pelos computadores pessoais ou pelos dispositivos móveis.
  2. A computação em nuvem, que permite uma capacidade quase infinita de processamento e armazenamento a custos on-demand e muito mais baratos que manter a infraestrutura;
  3. IA atuando na otimização contínua dos itens digitais responsáveis pela geração de valor dos modelos de negócio. 

Oportunidades da IA para Educação.

Com vistas a tendência, preparamos um resumo das oportunidades reais deste novo ambiente educacional.

Educação personalizada de alto impacto 

Criação de treinos personalizados para os alunos com base nas dificuldades de aprendizagem, dosando a proficiência dos itens com base em diversas variáveis como: percentual de acerto, metas estipuladas, perfil do usuário, quantidade de questões resolvidas por período e agrupamento de semelhantes.

A Studos já dispõe de mais de 90 mil questões catalogadas com mais de 32 milhões de respostas em seu app (Studos APP). Alguns desses dados já revelam padrões importantes da educação nacional, que hoje é estimada em 180 mil escolas públicas/privadas espalhadadas nos 5 mil municípios brasileiros.

O objetivo de todos os trabalhos em dados é conseguir um alto grau de acurácia e precisão na personalização das informações, de modo que os(as) alunos(as) possam praticar com menos questões e ter melhores resultados, já que o sistema busca encontrar e preencher as lacunas mais importantes da visão de mundo de cada indivíduo. Desta forma, o impacto desta solução será medido em:

  • Redução dos índices de evasão das escolas públicas ou privadas.
  • Redução nos níveis de stress estudantil.
  • Aumento do desempenho educacional das escolas a nível nacional.

Precificação dinâmica e inteligente

A precificação dinâmica na educação (O que é precificação dinâmica) já é uma realidade no Brasil, e deverá ter impulso nos projetos de transformação digital.

Na Aquarela, por exemplo, após alguns anos de pesquisa, desenvolvemos uma solução de Smart Pricing Educacional, que tem a função principal de otimizar os recursos educacionais por meio do ajuste de preço/bolsa de estudo em relação a oferta e demanda de turmas, intensidade de concorrência, qualidade das escolas, e estimações precisas de marketshare, fatores sócio econômicos e outras centenas de variáveis. A inteligência artificial escolhe, em tempo real, o peso de cada fator na formação do preço, criando o valor ideal para cada caso.

O nível de sofisticação operacional, já comum em sistemas de e-commerce e venda de passagens áreas, começará a fazer parte também da rotina das novas escolas alinhadas a indústria 4.0

Automação de tarefas administrativas

Um educador passa uma quantidade enorme de tempo classificando tarefas e testes. A IA pode intervir e fazer um trabalho rápido dessas tarefas, e ao mesmo tempo, oferecer recomendações sobre como fechar as lacunas do processo de aprendizado.

Embora as máquinas já possam classificar testes de múltipla escolha, elas estão muito perto de poder avaliar respostas escritas também. À medida que a IA entra em ação para automatizar as tarefas administrativas, abre mais tempo para os professores passarem com cada aluno.

Os professores terão mais tempo para se concentrarem em habilidades de ensino mais específicas para o ser humano, como inteligência emocional e criatividade. (StudyInternational)

Mapeamento de fluxos educacionais

A Inteligência Artificial pode fazer uma identificação quantificada do fluxo da logística educacional das escolas, desenhando os caminhos de sucesso e insucesso de alunos.

Essas tecnologias extraídas da área de logística, permitirão identificar gargalos operacionais, de modo que os gestores poderão atuar com grande precisão nos pontos mais importantes do fluxo, e também estimar quantativamente o impacto da remoção destas etapas.

Expansão educacional baseada em IA

Com a riqueza do dados disponíveis publicamente (e harmonizados estrategicamente), se torna possível utilizar a inteligência artificial para encontrar oportunidades de investimento educacionais em quase todos os pontos do país com apenas algumas iterações.

Hoje, é possível entender desde o fluxo de alunos entre os municípios até questões e tendências regionais. Assim, a inteligência artificial pode, por exemplo, buscar lugares com alto desempenho escolar, ampliando assim as oportunidades de expansão por meio de aquisições estratégicas. (Ver mais em geo-marketing de expansão)

Conclusões e recomendações

Neste artigo, compartilhamos um pouco de nossa visão das tendências da educação com base em nosso conhecimento prático baseado em dados. Não abordamos questões de sobre realidade virtual aumentada e educação a distância EAD que, apesar de também serem uma tendência, já há muito material disponível.

Portanto, concluímos que:

  • Teremos um futuro educacional que será cada vez mais digital, personalizado e ubíquo.
  • Existe muito potencial para que a educação brasileira seja melhorada com apoio de tecnologia de dados, porém o desafio tecnológico é todavia grande. Neste sentido escrevemos já anteriormente um artigo comentando sobre esta questão (Como escolher o melhor fornecedor de Analytics?).
  • Grandes mudanças estão ocorrendo na educação, tanto na forma de disponibilização de conteúdos como no comportamento e nos processos.
  • Os gestores desta nova educação deverão ter cada vez mais dados, maior uso de IA para tomada de decisão e uma visibilidade cada vez mais profunda da grande e complexa cadeia de distribuição de conhecimento dos mais de 70 milhões de estudantes brasileiros.

Quem é a Aquarela Analytics?

A Aquarela Analytics é pioneira e referência nacional na aplicação de Inteligência Artificial na indústria e em grandes empresas. Por meio da plataforma Vortx e da metodolgia DCIM (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania e Grupo Randon (automotivo), SolarBR Coca-Cola (alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Votorantim (energia), dentre outros. Fique atento às novas publicações diárias da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal! 

Autores

Inteligência Artificial aplicada às obras do Estado de Santa Catarina

Inteligência Artificial aplicada às obras do Estado de Santa Catarina

Em setembro de 2017 realizamos um curso em parceria com o SENAC/Palhoça de Introdução à cultura de dados. Neste evento, ao invés de utilizarmos dados sintéticos ou de problemas de outros países, optamos por trabalhar com dados das obras administradas pela gestão pública, com o propósito de ajudar no aprendizado dos alunos, mas também gerar valor à comunidade. Em nossa visão, integrar estudantes, profissionais, empresas e governo é uma prática que deveria ser disseminada no país.

Na sequência está o resumo deste trabalho realizado a pelo menos 40 mãos. Vale aqui também pontuar os seguintes apoios:

  • Time da fazenda estadual de Santa Catarina, responsável pelo portal da transparência, e a equipe responsável pela gestão do Sistema Integrado de Controle de Obras Públicas (SICOP), que prontamente nos atenderam para escolher, explicar e disponibilizar um conjunto de dados no formato adequado para as análises. Além disso, acompanharam os resultados iniciais e repassaram feedbacks essenciais para o amadurecimento do estudo.
  • Time da Wegov  que ajudou a fazer a ponte entre a Aquarela e Fazenda ainda no ano passado (2016).

Nota:
Este artigo foi publicado inicialmente no dia 16 de outubro de 2017, tendo sido revisado dia 26 de janeiro de 2018, após feedback enviado à Aquarela pela Fazenda/SC. A Fazenda pontuou alguns equívocos na apresentação dos dados que estavam elevando os valores de algumas agregações das obras. Este era o caso, por exemplo, da agregação dos dados por municípios, que inicialmente havia sido feita, mas foi substituída por uma nova tabela (Tabela 1) com o detalhamento no nível do Contrato, não do município – o mesmo contrato pode se referir a mais de um município. As análises de clusterização não foram alteradas, pois os padrões permanecem os mesmos, mas foram adicionados detalhes na interpretação dos clusters com base no feedback recebido. Assim, ressaltamos a importância de um governo transparente e agradecemos o retorno que tivemos da Fazenda do Estado de Santa Catarina.

Agora vamos para as análises!

Organização das análises

Objetivo

Utilizar técnicas avançadas de análise de dados para a descoberta de padrões de obras públicas do estado de Santa Catarina, tornando-as acessíveis à população em complemento ao portal da transparência do governo.

Perguntas chaves

  1. Quais são os maiores contratos de obras públicas no estado de Santa Catarina?
  2. Como são distribuídos os gastos por áreas (saúde, educação, transportes, etc) ao longo dos anos e entre os municípios?
  3. Quais são as características mais comuns das obras no estado?

Os dados das obras estaduais

O conjunto de dados (dataset) escolhido foi disponibilizado pelo portal da transparência do governo de Santa Catarina neste link. Ao todo foram 6.663 registros de obras públicas estaduais desde 2005. Os dados brutos podem ser baixados na sequência deste relatório em formato .CSV.

Análise parte 1: gráfico interativo, tabelas e rankings

Para responder as duas primeiras perguntas-chave levantadas, a seguir mostramos o gráfico da latitude e longitude das obras realizadas no Estado de Santa Catarina nos últimos 5 anos, bem como tabelas que resumem e viabilizam filtros nos dados. No gráfico, escolha o ano que deseja analisar para atualizar o gráfico. As cores dos círculos representam as áreas das obras. Os tamanhos dos círculos são definidos pelo Valor Total da obra, que contempla a soma do valor original de contrato mais valores aditados no decorrer do projeto.

Vale ressaltar que a visualização a seguir não ocorre em tempo real, mas sim de forma estática, utilizando dataset cedido pela Fazenda do Estado de Santa Catarina atualizado para outubro de 2017.

Visualização por ano e por situação das obras nos últimos 5 anos (2012-2017)

Veja por exemplo, que no ano de 2014 (copa e eleições presidenciais) o Estado de Santa Catarina teve muito mais obras do que nos outros anos demonstrados no gráfico. Ou ainda, veja as obras que estão paralisadas (com referência em outubro de 2017), ano a ano, desde 2012. Os detalhes e motivos de cada uma dessas situações dependem de uma análise mais detalhada que contemple outros datasets e um olhar dos auditores e especialistas responsáveis.

Respostas às duas primeiras perguntas-chave

Primeiramente, ao realizarmos uma ordenação por valor das obras na Tabela 1 (agregada por contratos), conseguimos responder quais são as obras com maiores volumes de investimentos em obras públicas no estado de Santa Catarina. Na sequência, as descrições das cinco maiores obras:

  • Restauração e Reabilitação da Ponte Hercílio Luz – Florianópolis/SC – R$ 275 milhões – Ano 2014;
  • Ampliação da Capacidade da Rodovia SC-486 trecho: Antônio Heil (BR-101 – Brusque) – R$ 155 milhões – Ano 2014;
  • Implantação e pavimentação SC-108 trecho: Acesso norte de Blumenau – R$ 141 milhões – Ano 2014;
  • Centro de Eventos Balneário Camboriú – R$ 114 milhões – Ano 2014;
  • Pavimentação SC-477 – Volta Grande – Dr. Pedrinho / Moema (Volta Triste) – Inicio Variante – R$ 114 milhões – Ano 2014.

Acerca da segunda pergunta-chave levantada, sobre como são distribuídos os gastos públicos por áreas (saúde, educação, etc) ao longo dos anos, conseguimos obter a resposta realizando filtros no gráfico dinâmico e interativo apresentado anteriormente, mas também pela Tabela 2. Ao ordenarmos às obras por Valor Total e por áreas percebe-se que as 5 áreas com maiores gastos são: transporte rodoviário; educação; agricultura; justiça e cidadania e saúde. Já as 5 áreas que receberam menos investimentos nos últimos 5 anos foram (da menor para a maior): saneamento; meio ambiente e recursos hídricos; habitação; infraestrutura administrativa; e transporte aeroviário.

Análise parte 2: perfil das obras por clusterização com o VORTX

Para responder à quarta pergunta-chave, sobre as características mais comuns das obras do estado de SC, realizamos análises de inteligência artificial com o VORTX. O VORTX é uma ferramenta de clusterização da Aquarela, que encontra padrões nos dados. A partir daí identificamos pontos comuns nas obras de cada cluster.

a. Análise genérica de clusterização

Ao rodarmos o VORTX para todo o dataset foram encontrados 17 clusters, cuja distribuição geográfica pode ser visualizada no gráfico a seguir. Na parte esquerda do gráfico são identificados os clusters: os números representam a identificação de cada cluster e o tamanho dos círculos representa a proporção de itens que compõem determinado cluster em relação ao todo. Já na parte direita do gráfico as obras são apresentadas sobre o mapa de Santa Catarina. Os números em cima dos círculos, neste caso, representam a quantidade de obras naquela região. A presença dos clusters ao longo do estado é identificada no mapa, pelas cores.

Clustering obras de Santa CAtarina
Distribuição das dos grupos de obras do estado

b. Análise dos clusters mais distintos dos demais

O VORTX encontrou alguns clusters interessantes, como um cluster outlier (veja mais sobre o que é um outiler), que separou as obras da reforma da ponte Hercílio Luz das demais. Este cluster é identificado pelo número 16 na imagem a seguir. O valor total elevado e o alto número de dias de duração do projeto foram alguns dos fatores que levaram o algoritmo a segregar esta obra separadamente.

Foco nas obras outliers
Foco em obras fora do padrão estadual.

Outro cluster interessante é o de número 7, que é um dos mais distintos dos demais, e é composto apenas por projetos paralisados, sendo todas elas classificadas como “Transporte Rodoviário”. São trabalhos, em média, longos (563 dias de tempo de contrato), mas acabam durando muito mais do que o previsto, pois ficam paralisadas por mais 653 dias, em média. Na figura a seguir é possível ver a distribuição geográfica destas obras ao longo do mapa de Santa Catarina.

Pesagem das variáveis e estatísticas dos groupos
Estatísticas sumarizadas por grupo e peso de influência das variáveis.

Resumo das características dos principais clusters

O algoritmo do VORTX realiza a clusterização mesmo sem conhecer de obras públicas. Ou seja, o modelo trabalha com Inteligência Artificial e modelos estatísticos e aprende quais projetos possuem características mais similares umas das outras. Porém, depois da definição dos clusters o analista de dados precisa fazer uma análise item por item para identificar medidas que possam ser tomadas.

Neste caso, para facilitar a compreensão resumimos alguns dos pontos principais sobre os clusters mais representativos das obras públicas do estado de Santa Catarina:

  • Cluster 1: composto apenas por obras de edificação para a área de educação, que já estão concluídas e que custaram em média R$ 1 milhão. São projetos com duração contratual média de 164 dias, com mais 100 dias médios de acréscimo e cerca de 6 dias de paralisação das obras.
  • Cluster 2: obras de transporte rodoviário que estão concluídas ou em andamento, com valor médio de R$ 8,6 milhões. A média de dias de contrato é de 326, com média de 80 dias aditados e paralisação de 46 dias.
  • Cluster 3: projetos de edificação de variadas áreas (educação, segurança pública, justiça e cidadania, transporte rodoviário e saúde), com valor total médio de R$ 2 milhões, concluídas ou em andamento. A duração de contrato é de 186 dias em média, com mais 163 dias de acréscimo e 13 dias de paralisação.
  • Cluster 4: composto predominantemente (90%) por contratos de edificação em praticamente todas as áreas, mas com predominância em agricultura e educação. O valor total médio é de R$ 6 milhões. A média de dias contratuais é de 200 dias, com acréscimo de 158 dias e paralisação de 45 dias. Um ponto que chama a atenção neste cluster é que existem alguns valores repetidos de aditivos negativos em diferentes obras. Um exemplo é o valor de R$ – 1.631.220,30, que se repete em obras de várias cidades. Este valor refere-se, de acordo com nota da Fazenda/SC repassada à Aquarela, ao valor de supressão referente ao atraso na entrega de matéria prima para o projeto, devido ao período de recesso de férias e ao longo período de chuvas do total do Contrato, que foi de R$ 6,78 milhões. Outro caso similar de obras do mesmo cluster foi de um contrato referente a construção de cisternas em vários municípios do Estado, no valor total de R$ 6,5 milhões, com R$ 1,6 milhões de aditivo negativo.
  • Cluster 5: cluster bastante composto por obras de diversas áreas, mas com predominância para defesa civil, educação e saúde. A maior parte está em andamento. São obras públicas  menores, com valor médio de R$ 150 mil.
  • Cluster 6: contratos classificados como “projetos”, composto por obras pequenas – média de R$ 176 mil –, todas concluídas e pertencentes às áreas de Segurança Pública e Educação. Duração aproximada de 100 dias, com 33 dias aditados e apenas 3 dias médios de paralisação.
  • Cluster 7: cluster já comentado, composto totalmente por obras paralisadas na área de transporte rodoviário, com valor total médio de R$ 8 milhões por obra. São obras com duração original de contrato de 563 dias, mas que ficam em média 653 dias paralisadas.
  • Cluster 8: são contratos classificados como consultoria em transporte rodoviário, de obras em andamento ou concluídas. São valores bastante elevados: R$ 36 milhões em média. Os dias originais de contrato são 353 em média, com cerca de 129 dias aditados e 111 dias paralisados.

Conclusão

Nesta análise procuramos responder três perguntas que foram levantadas em curso da Aquarela junto ao SENAC/Palhoça. Diversas outras questões foram também elucidadas em um primeiro momento, mas para fins de delimitação reduzimos o número de perguntas-chave. Apresentamos gráficos e tabelas interativas e também resultados de análise com o VORTX.

As obras possuem divisões marcantes, visualizadas com forte distinção pelo algoritmo do VORTX. Um dos pontos mais interessantes é que todos os clusters são bem distribuídos ao longo do mapa de Santa Catarina. Ou seja, com exceção do projeto da ponte Hercílio Luz e de Florianópolis como um todo – que contém uma alta concentração de projetos –, não parece haver uma distinção regional entre os clusters.

Existe sim uma maior distinção em relação à área do projeto, status do contrato, e a outras variáveis numéricas, como: valor total do contrato, valor aditado, dias de contrato e dias paralisados.

Por fim, vale destacar que aqui apresentamos os dados e realizamos alguns insights. Porém, a partir deste ponto cabe uma análise mais detalhada sobre os aspectos levantados, que deve ser feita pelos especialistas no assunto em questão.

Entenda mais sobre os passos e a importância de uma análise de dados em nosso E-book “Guia de introdução à cultura de Data Analytics“.

Quem é a Aquarela Analytics?

A Aquarela Analytics é pioneira e referência nacional na aplicação de Inteligência Artificial na indústria e em grandes empresas. Por meio da plataforma Vortx e da metodolgia DCIM (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania e Grupo Randon (automotivo), SolarBR Coca-Cola (alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Votorantim (energia), dentre outros. Fique atento às novas publicações diárias da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal! 

Autores

Inteligência Artificial nas Quotas Parlamentares

Inteligência Artificial nas Quotas Parlamentares

2018 é um ano importante para o futuro do Brasil, e assim como você caro leitor, nós também temos uma grande preocupação: 

Será que finalmente levaremos o hexa nesta copa?

Brincadeiras a parte, 2018 é ano de eleição, momento no qual vamos decidir quem será nosso presidente pelos próximos 4 anos. Sabemos que as opções não são as melhores até o momento, mas não vamos perder a fé em mudar o nosso país, certo? Neste post, pegamos carona no momento político e, aliando-se ao projeto “Serenata de amor”, traçamos o perfil dos gastos de dinheiro público feitos por nossos deputados. (Veja como o projeto aconteceu em Floripa) 

Utilizamos o VORTX (nossa plataforma de Inteligência Artificial) e ferramentas complementares como R, Python e Java, para encontrar padrões na forma como nosso dinheiro é gasto pelos deputados brasileiros. Perceba que até o momento não falamos em predição ou prescrição baseada em dados, outro ponto que este artigo mostrará é o fato de que Machine Learning também pode ser empregada na procura de padrões de comportamento, sem fazer nenhuma predição.

Dados de entrada

Mais de 1,5 milhões de notas fiscais emitidas de reembolso de 1158 deputados federais desde 2009 — Destes sobraram 1,138 que possuíam informações sobre a idade e o sexo — Fonte (https://serenatadeamor.org/).

O que queríamos descobrir?

  • Qual a idade provável de um cidadão se tornar deputado(a) federal?
  • Quais as características e as proporções de cada perfil parlamentar?
  • Qual o perfil de parlamentares mais gastões e quais os deputados mais econômicos? Como está a distribuição regional?
  • Quais os principais fatores associados aos gastos dos perfis descobertos?
  • Se existe uma relação entre a idade dos parlamentares com o gasto de suas cotas parlamentares?

Resultados utilizando Inteligência Artificial.

Depois de fazer uma série de enriquecimentos da base original, formatamos os dados no modelo requerido pela plataforma VORTX chegando assim aos seguintes resultados e validações.

Probabilidade de ser deputado por idade

Abaixo está o desenho e os cálculos da distribuição probabilística de alguém se tornar deputado de acordo com sua idade.

  • Probabilidade de ser parlamentar com menos de 30 anos é de 1,5%
  • Probabilidade de ser parlamentar com mais de 30 anos é de 98,5%
  • Probabilidade de ser parlamentar com menos de 80 anos é de  97,5%
  • Probabilidade de ser parlamentar com mais de 80 anos é  2,5%
  • Estar entre 30 e 80 é de 96% e fora dessa faixa 4%
Idade mínima = 23. Idade média = 56,87. Idade máxima = 98. Desvio padrão (taxa de variabilidade de idades) = 12,20.

Abaixo está o ranking dos deputados que fogem para baixo do padrão da curva normal, ou seja, os “deputados federais ninjas” que chegaram lá com 1,5% de chances.

Quadro de deputados federais mais novos desde 2009.

Proporções do perfil de gasto da quota parlamentar

No quadro abaixo vemos o perfil comportamental gerado pelo VORTX de todos os deputados analisados, sendo 3 grupos predominantes (1, 2 e 3) contém mais de 90% de todos os parlamentares. Os menos representativos chamados de 4, 5 e 6 são comportamentos anormais. O agrupamento 2 é formado apenas por mulheres ao passo que os demais, apenas por homens. Com isso vemos que existe diferenças consideráveis do comportamento por gênero.

Grupo 1 = 87,61%. Grupo 2 = 10,11%. Grupo 3 = 1,93%. Grupo 4 = 0,18% . Grupo 5 = 0,09% grupo 6 = 0,09%.

Perfil dos parlamentares gastões vs econômicos + região de atuação.

Abaixo apresentamos os sumários estatísticos dos grupos identificados pela ferramenta de forma automática.

A primeira coluna da esquerda é o gasto médio em reais dos parlamentares. Imaginando que quanto maior a média, maior o custo deste para os cofres públicos, então temos o grupo 1 com a média mais alta: acima de R$ 1,2 mil, e os mais econômicos disposto no grupo 3, com gastos abaixo dos R$ 250,00.

As mulheres do grupo 2 tendem a gastar R$157.21 menos que os homens do grupo 1. A proporção dos deputados com baixo custo é gritantemente menor do que os grupos principais.

A título de conhecimento, abaixo dos nomes estão a nota do grau de influência que a coluna tem na variação do valor médio.

Ao contrário do que muitos pensam, encontrar padrões que já conhecemos é fundamental para saber se a ferramenta está interpretando corretamente a realidade, ou seja, felizmente o VORTX que não conhece nada de política ou quotas parlamentares, descobriu uma coisa que já se esperava: que os deputados(as) com médias maiores apresentam uma taxa maior de compras parceladas.

Assim, o VORTX coloca ela como a primeira variável da esquerda para direita com nota 8.7 de influência. Seguida pela contagem do número de fornecedores.

Como parte da estratégia da análise, optamos por não considerar (não entregar para o algoritmo) a informação do estado e/ou partido dos deputados(as), tornando assim a análise sem qualquer viés que não sejam simplesmente o comportamento administrativo de cada um.

Uma vez que conseguimos atrelar a geolocalização dos parlamentares, a ferramenta desenha automaticamente a segmentação diretamente no mapa. Assim, é possível sintetizar os padrões e claro, depois descer (drill down) até encontrar os registros específicos de cada caso.

Ainda respondendo a questão 3, abaixo está um apontamento regional dos deputados que mais e menos gastam.

Em amarelo está a contagem absoluta, ou seja, quantos deputados de baixo custo existem em cada estado. Os amarelos estão apenas em alguns estados do país.
Mapa dos parlamentares do grupo 4 com a maior média de gastos. A letra é a primeira letra da variável que havíamos chamado de “ponto”.

Uma dúvida comum dos analistas é saber se os resultados fecham com a realidade do dado bruto.

Este processo é muito importante em todo e qualquer tipo de análise de machine learning. Assim, fizemos alguns recortes da base sobre os resultados da entrega da inteligência artificial para verificar se os achados faziam sentido ou não.

Abaixo está uma das variáveis consideradas mais fortes no padrão de comportamento do uso das quotas. Com esta visualização podemos afirmar que deputados(as) com o menor custo médio apresentam uma quantidade muito maior de fornecedores do que todos os outros grupos.

Esta variável é tão mais influente do que a idade do parlamentar que a segunda foi excluída automaticamente do modelo pela máquina.

Cada ponto representa um parlamentar. As cores estão relacionadas ao grupo criado pela inteligência artificial.

Na figura abaixo, podemos concluir também que não é possível fazer uma relação do comportamento de gasto por partido político já que há uma grande pluralidade de partidos nos diferentes perfis.

Seria muito interessante, por exemplo, se algum partido tivesse uma política de redução dos gastos bem definida de modo que o grupo 3 tivesse apenas a cor deste partido ou fosse a cor predominante.

Cada ponto representa um parlamentar. As cores são o seu partido político. O eixo X representa o grupo que ele pertence de acordo com a inteligência artificial.

Já na visualização abaixo temos uma informação interessante.

Quando estávamos levantado as perguntas de análise com a equipe de voluntários no evento  Serenata Capítulo Floripa. tínhamos uma intuição bastante forte de que os parlamentares mais jovens tivessem uma tendência a gastar menos, imaginando que houvesse uma melhor conscientização da importância da economia do dinheiro público.

O resultado foi exatamente este, só que no sentido oposto. Verificamos que existe uma pequena tendência (muito fraca) da idade interferir no comportamento dos gastos.

Os deputados(as) mais velhos tendem a gastar menos em média. Uma ressalva, a idade é baseada na diferença em anos da data de nascimento com a data desta pesquisa. Além alguns deputados já são falecidos(as).

Cada ponto representa um parlamentar, os homens são os pontos verdes e as mulheres os pontos vermelhos.

Brasil, todo dia um 7×1

Sabemos que o sentimento possa ser de frustração, afinal, descobrir que nem mesmo os deputados jovens estão conscientes do seu papel político-social é um tanto quanto desanimador.

Mas para que aconteça mudança, temos que encarar a realidade, por esta razão que o projeto Serenata de amor foi criado, agregando o uso de Inteligência Artificial feita no Brasil com a necessidade de mudarmos nosso cenário político. 

Não deixem de seguir a Rosie no Twitter, robô criada pelo projeto que Twitta gastos suspeitos em tempo real, acompanhando de perto como nossos políticos gastam nosso dinheiro.

Acreditamos na mudança e na capacidade do povo brasileiro de inovar com tecnologia, acompanhe em nosso blog outros casos de uso de IA para predição e clusterização com dados públicos, e apoie o projeto Serenata de amor. Só assim faremos um Brasil mais inteligente e menos burocrático.

Quem é a Aquarela Analytics?

A Aquarela Analytics é pioneira e referência nacional na aplicação de Inteligência Artificial na indústria e em grandes empresas. Por meio da plataforma Vortx e da metodolgia DCIM (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania e Grupo Randon (automotivo), SolarBR Coca-Cola (alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Votorantim (energia), dentre outros. Fique atento às novas publicações diárias da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal! 

Autor