Aquarela

Aquarela Analytics branco

Inteligência Artificial na descoberta dos fatores chaves do IDH

Neste post mostramos mais um caso de estudo utilizando a Inteligência Artificial VORTX com dados reais. Aqui demonstramos como a abordagem de descoberta de cenários pode ajudar a tomada de decisão de forma profunda em vários setores. Para conhecer algumas áreas com grande potencial de aplicação, veja este artigo com 14 áreas sugeridas. Nesta análise em específico levamos em consideração perguntas típicas de gestores:

Quais os fatores que mais impactam no meu resultado?

Qual configuração ideal dos fatores (das variáveis) para se atingir o cenário com melhor desempenho?

Neste caso selecionamos 65 índices nacionais de 188 países para descobrir quais deles tem maior peso em relação ao Índice de Desenvolvimento Humano e quais cenários são criados pelas máquina. Para validar a precisão do algoritmo, plotamos no mapa os países de acordo com seu cenário.

As perguntas-chave desta análise:

  1. Quantos cenários de Índice de Desenvolvimento Humano existem no mundo e em quais cenários os países estão alocados?
  2. Entre os 65 índices, quais deles têm maior influência na variação do IDH?
  3. O que é o DNA de um cenário e como eles são utilizados para análise?

Bom, antes de ver os resultados, vejam todas variáveis analisadas abaixo. Então, tente descobrir intuitivamente quais seriam as repostas para pergunta 2. Esta é uma tarefa muito importante para a validação cenários. OK?

As variáveis selecionadas para análise foram:

  1. Índice de Desenvolvimento Humano IDH-2014
  2. Coeficiente de Gini 2005-2013
  3. Taxa de natalidade entre adolescentes de 15-19 por 100k 2010-2015
  4. Registro de nascimento abaixo de 5 anos 2005-2013
  5. Crescimento das emissões de dióxido de carbono anual médio
  6. Emissões de dióxido de carbono per capita 2011 (toneladas)
  7. Alteração percentual de florestas florestas 1900-2012
  8. Alteração de uso de dispositivos móveis 2009-2014
  9. Índice de preços do consumidor 2013
  10. Crédito interno fornecido pelo setor financeiro 2013
  11. Índice doméstico de preços 2009-2014
  12. Índice de volatilidade doméstica de alimentos 2009-2014
  13. Taxa de electrificação da população (distribuição elétrica)
  14. Anos de escolaridade esperados – Anos
  15. Exportações e importações percentual GPD – 2013
  16. Taxa de suicídio feminino para cada 100k pessoas
  17. Investimento estrangeiro direto entradas líquidas porcentagem do PIB 2013
  18. Área de floresta Percentual da área total de terras 2012
  19. Combustíveis fósseis percentual do total 2012
  20. Retiradas de água doce 2005
  21. Índice de Desigualdade de gênero 2014
  22. Despesa das administrações públicas – o crescimento anual 2005 2013
  23. Despesa das administrações públicas –  Percentual do PIB 2005-2013
  24. PIB 2013
  25. PIB per capta
  26. Formação bruta de capital fixo do PIB 2005-2013
  27. RNB – Rendimento Nacional Bruto per capita – 2011 Dólares
  28. Pessoas desabrigadas devido a desastres naturais 2005 2014 por milhões de pessoas
  29. Taxa de homicídios por 100 mil pessoas 2008-2012
  30. Mortalidade Infantil 2013 por milhares
  31. Entrada de turistas internacionais por milhares 2013
  32. Mobilidade internacional de estudantes em escolarização superior 2013
  33. Usuários de internet percentagem da população 2014
  34. Violência por parceiro íntimo 2001-2011
  35. Expectativa de vida à ao nascimento em anos
  36. Taxa de suicídio masculino 100k pessoas
  37. Taxa de mortalidade materna por 100 nascidos vivos 2013
  38. Média de anos de escolaridade – Anos
  39. Assinantes de telefonia móvel para cada 100 pessoas 2014
  40. Esgotamento dos recursos naturais
  41. Taxa de migração por 1k pessoas 2010-2015
  42. Médicos por 10k pessoas
  43. População afetada por desastres naturais média anual por milhão de pessoas 2005-2014
  44. Percentual da população vivendo em área degradada de terras 2010
  45. População percentual com ensino secundário 2005-2013
  46. Ensino Pré-primário 2008-2014
  47. Ensino Primária-2008-2014
  48. Taxa de abandono escolar no primário 2008-2014
  49. População carcerária para cada 100k pessoas
  50. Fluxos de capital privado porcentagem do PIB 2013
  51. Despesa pública em percentagem do PIB educação
  52. Percentual despesas de saúde pública do PIB 2013
  53. Proporção de alunos por professor na escola relação primária 2008-2014
  54. Refugiados por país de origem
  55. Remessas entradas PIB 2013
  56. Percentual de fontes renováveis 2012
  57. Despesa em Pesquisa e Desenvolvimento 2005-2012
  58. Percentual da população em edução secundária 2008-2014
  59. Percentual de Quotas de assentos no parlamento para mulheres 2014
  60. Percentual de estoque de imigrantes da população 2013
  61. Os impostos sobre o lucro de renda e ganho de capital 205 2013
  62. População com educação terciária -2008-2014
  63. Receita tributária total do PIB 2005-2013
  64. Taxa de tuberculose por milhares 2012
  65. Menores de cinco anos Mortalidade 2013 milhares

Fonte dos dados

Abaixo foram as organizações responsáveis por calcular e disponibilizar os indicadores:

  • UNDESA 2015,
  • Instituto de Estatística da UNESCO de 2015,
  • United Divisão de Estatística das Nações de 2015,
  • Banco Mundial de 2015,
  • FMI de 2015.

Para aqueles com dúvidas sobre a classificação deste estudo e as diferenças entre BI (Business Intelligence, Mineração de dados e Big Data) recomendamos este artigo 7 características para diferenciar BI, Data Maning e Big Data

Após pressionar o botão do VORTX Discoverer:

Na esquerda observa-se que os 15 diferentes cenários descobertos dos quais os 3 primeiros correspondem a mais de 94% do total. Quanto mais escuro o grupo, maior é seu índice IDH (cenário 3 e 4). Já na direita está a distribuição do IDH em uma visualização de histograma isolando apenas o fator IDH. O eixo Y mostra a densidade ou quantidade de países em relação ao eixo X que é o IDH variando de 0.35 até 1.00. Assim, vemos que a maioria dos países apresenta IDH na faixa de 0,65 e 0,75, ao passo que são poucos os países acima de 0,90.

Quais países pertencem a quais cenários?

Screen Shot 2016-09-15 at 20.21.36

Podemos ver que o cenário de alto IDH está na Europa mais Canadá, Austrália, Japão e outros. Nota-se no entanto que os EUA apesar de não fazer parte deste grupo ele apresenta um alto IDH formado por características que não são compartilhadas com nenhum outro país. A América Latina é homogênea com exceção do Haiti.

Quais os fatores que mais influenciam o IDH?

Nas imagens abaixo está a relação dos fatores e o grau de influência na formação dos cenários de baixo e alto IDH. O único fator excluído por baixa correlação foi “Violência por parceiro íntimo 2001-2011”.

Taxa de desigualdade de gênero vs IDH

Curiosamente, entre os top 10 fatores, surge o índice de desigualdade de gênero que leva em consideração a diferença entre os direitos e obrigações entre homens e mulheres. Este indicador comparando os países de alto IDH contra os de baixo IDH. Uma possível explicação para esse fato pode ser que países mais avançados geram cada vez mais renda com menor trabalho físico, ao contrário dos países menos desenvolvidos que ainda são fortemente dependentes da agricultura e indústria pesada. Possivelmente estes fatores afetem diretamente o papel da mulher na sociedadee.

EUA vs Demais países com alto IDH

Reunindo todos os fatores em apenas uma visualização, temos o contraste das diferenças sistêmicas entre dois cenários que atingiram um alto nível de desenvolvimento humano. Para se entender a dinâmica desta visualização é necessário imaginar que o eixo X se altera automaticamente para a escala de cada índice quando o cursor do mouse é acionado. Como aqui temos apenas uma imagem estática, deixamos a escala do IDH selecionada.

Insights e conclusões do estudo

As possibilidades geradas por meio das de algoritmos de mineração de Dados – leia aqui sobre o que é Data Mining – são várias e nos concentramos em algumas perguntas para limitar o escopo. Durante esta pesquisa, interessante foi ver a máquina confirmando ou não algumas hipóteses e intuições anteriores, sobre tudo na questão 2. É importante mencionar que não medimos a causalidade entre os fatores, os resultados mostram correlações sistêmicas apenas, o que é um grande passo para definição de prioridades de gestão. Abaixo estão alguns que chamaram a atenção:

  • Desigualdade de gênero desempenhando um papel forte e correlação inversa no Índice de Desenvolvimento Humano enquanto estamos vivendo uma transição da era industrial para a informação onde o conhecimento supera as diferenças físicas dos gêneros.
  • Pesquisa e desenvolvimento possui alta influência no IDH assim como a eletricidade.
  • Os Estados Unidos têm seu próprio cenário devido às suas características sistêmicas únicas.
  • Despesa pública geral e despesa pública com educação apresentaram baixa influência.

Aplicações empresariais

Aplicando as mesmas perguntas que tivemos no início do artigo, agora vamos ver como eles se pareceriam para diferentes cenários de negócios:

Vendas

  • Quantos cenários existem para suas vendas? Qual segmento de cliente pertence a cada cenário?
  • Entre vários fatores de negócios, quais deles têm maior influência para definir uma receita Alta ou Baixa?
  • Qual é o DNA (características) de um cenário de receita alta e baixa?

 Indústria

  • Quantos cenários de produção / manutenção existem para sua linha de produção? Quais processos pertencem a cada cenário?
  • Entre vários fatores de produção, quais deles têm maior influência para definir um resultado Alto ou Baixo ou um custo / manutenção alto ou baixo?
  • Qual é o DNA (características) de um cenário de produção / manutenção alto e baixo?

 Saúde

  • Quantos cenários de pacientes existem para uma doença ou condição médica específica? Quais pacientes pertencem a cada cenário?
  • Entre várias características do paciente, quais delas têm maior influência para resultar em níveis altos ou baixos de uma doença ou condição médica específica?
  • Qual é o DNA (características) dos cenários de boa e má condição médica?

Em suma, esperamos que este artigo possa ajudar a esclarecer um pouco mais sobre as novas possibilidades de análises geradas por inteligência artificial em uma abordagem diferente com dados importantes e reais.

Um grande diferencial desta análise é o fato de não ter sido necessário adicionar nenhum parâmetro para a máquina, todos esses insights foram extraídos automaticamente da planilha com os dados formatados – leia aqui sobre o que é dataset.

Quem é a Aquarela Analytics?

A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial corporativa na indústria e em grandes empresas. Por meio da plataforma Vorteris, da metodologia DCM e o Canvas Analítico (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania, Mercedes-Benz, Grupo Randon (automotivo), SolarBR Coca-Cola (varejo alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Auren, SPIC Brasil (energia), Telefônica Vivo (telecomunicações), dentre outros.

Acompanhe os novos conteúdos da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!

Autores

2 Comments

  1. Kleyn Guerreiro disse:

    Seria possível disponibilizar a planilha de dados? Bom artigo!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Send this to a friend