7 tendências em ciência de dados

7 tendências em ciência de dados

O site Exploding Topics trouxe recentemente um compilado das 7 maiores tendências percebidas por eles sobre a área de ciência de dados. A plataforma mapeia temas que estão se tornando tendências, mas que ainda não ganharam grande visibilidade ou viralizaram. Confira os tópicos e fique de olho no que possivelmente irá acontecer na área nos próximos tempos.

1 – Explosão no número de vídeos e fotos utilizando Deep Fake

O deep fake se utiliza de inteligência artificial para manipular ou criar conteúdos simulando outra pessoa. Por exemplo: trocar rostos em vídeos, tornar imagens estáticas animações ou produzir áudios com a voz da pessoa com base em outros áudios previamente gravados. O termo “deep fake” sofreu um avanço nas pesquisas de 900% desde 2017. 

Ainda relacionado ao assunto, o termo “voice phishing”, ou seja, a criação de áudios falsos de pessoas com sua própria voz,  também aumentou os números de pesquisas em 227% nos últimos anos.

Isso nos levanta um alerta, pois essa tecnologia já foi utilizada para a aplicação de alguns golpes por todo o mundo, já que os conteúdos produzidos são muitas vezes muito realistas e pessoas podem se utilizar indevidamente desse avanço.

2 – Aumento aplicações com Python

A linguagem Python é amplamente utilizada dentro da área de ciência de dados e é muito versátil. Ela pode ser usada para a implantação de diversas tecnologias e aplicações, além de existirem inúmeras bibliotecas prontas e gratuitas para serem utilizadas. O número de pesquisas por “python” cresceu 150% nos últimos 10 anos e é atualmente ranqueada como a terceira linguagem de programação mais popular, com expectativas de alcançar o topo desta lista até 2025 e já a linguagem que mais recebe perguntas mensalmente no Stack Overflow.

3 – Maior demanda por soluções em IA de ponta a ponta

Empresas que trabalham com inteligência artificial, como a startup recentemente comprada pela Google, Dataiku, ou a Aquarela Analytics estão sendo cada vez mais procuradas. Elas  auxiliam outras empresas e indústrias a lidar com grandes quantidades de dados e a construir modelos de machine learning para tratá-los.  As pesquisas por “Dataiku” cresceram 156% desde 2017, aumentando ainda mais depois da aquisição pelo Google. Outras empresas que que também estão à frente quando se trata de inovações com Inteligência Artificial é a Deep Mind, também comprada pela Google e que utiliza IA para traduzir e restaurar textos antigos, e a OpenAI, que cria imagens a partir de descrições feitas com linguagem natural.

4 –  Companhias estão contratando mais Cientistas de Dados

A quantidade de dados coletados por redes sociais e equipamentos IoT cresce a cada dia, aumentando, assim, a demanda por cientistas de dados. Para garantir o tratamento desses dados e a transformação deles em informações úteis, surge cada vez mais a necessidade de profissionais qualificados da área. Por causa desta realidade, o termo “cientista de dados” cresceu 93% em aparições online desde 2017. Outro fato interessante sobre o assunto é o surgimento de novos termos para profissionais que trabalham com dados, ou seja, subdivisões do cargo de cientista de dados, como Analista de Dados, Engenheiro de Dados, Arquiteto de Dados e outros.

5 – Cientistas de dados utilizando o Kaggle

Para quem é da área da ciência de dados isso pode não ser uma novidade. Entretanto, a plataforma Kaggle vem crescendo e sendo cada vez mais utilizada pelos cientistas de dados. Assim, tornou-se quase uma rede social para os profissionais, que a utilizam para tirar dúvidas, compartilhar suas soluções, buscar ajuda para soluções de problemas etc. O número de pesquisas pela plataforma cresceu 55% nos últimos 5 anos. Além disso, ela é utilizada por mais de 5 milhões de usuários em 194 países.

6 – Aumento de interesse na proteção dos dados dos consumidores

Após as últimas polêmicas sobre o uso indevido de dados de usuários de grandes plataformas, intensificou-se a preocupação e procura sobre o tema e questões sobre privacidade e proteção de dados. No Brasil, por exemplo, houve a implantação da LGPD. A partir disso, o número de pesquisas pelo termo “privacidade de dados” cresceu 125% nos últimos 10 anos.

7 – Modos de burlar aplicações de IA

Houve um grande aumento no número de pesquisas sobre o assunto. A ideia deste tipo de ação é provocar “ilusões de óptica” nas aplicações de Machine Learning por meio da utilização de padrões que confundem o funcionamento de Inteligências Artificiais que fazem reconhecimento facial ou adicionando dados que possam resultar em erros. Algumas das motivações para esse tipo de intervenção seria para o cometimento de atividades criminosas ou então para encontrar possíveis erros e realizar melhorias no funcionamento dessas aplicações.

Tendências em ciência de dados – Considerações finais

A tecnologia é uma das áreas que mais produz inovações, e também uma das que mais exige a atenção dos profissionais do setor em relação às tendências, aos temas em alta e às novidades que estão sendo testadas e implementadas. Portanto, estar atualizado sobre as tendências de mercado é algo muito importante e estratégico. 

Os tópicos aqui abordados são previsões para os próximos 3 ou 4 anos, considerando a popularidade dos termos em ferramentas de busca ou de social listening com dados coletados em anos passados. Outro ponto importante é considerarmos que nem toda ação humana é previsível, podendo ser influenciada por grandes eventos e fatores internos e externos ao tema em discussão, mas tendências baseadas em dados como essa lista nos ajudam a traçar um possível panorama de como será o futuro da área de ciência de dados. 


Quer saber mais sobre como funcionam as atividades de previsão? Confira nosso artigo sobre previsão de demanda

Quem é a Aquarela Analytics?

A Aquarela Analytics é pioneira e referência nacional na aplicação de Inteligência Artificial na indústria e em grandes empresas. Por meio da plataforma Vortx e da metodolgia DCIM (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania e Grupo Randon (automotivo), SolarBR Coca-Cola (alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Votorantim (energia), dentre outros. Fique atento às novas publicações diárias da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal! 

Autores