O site Exploding Topics trouxe recentemente um compilado das 7 maiores tendências percebidas por eles sobre a área de ciência de dados. A plataforma mapeia temas que estão se tornando tendências, mas que ainda não ganharam grande visibilidade ou viralizaram. Confira os tópicos e fique de olho no que possivelmente irá acontecer na área nos próximos tempos.
1 – Explosão no número de vídeos e fotos utilizando Deep Fake
O deep fake se utiliza de inteligência artificial para manipular ou criar conteúdos simulando outra pessoa. Por exemplo: trocar rostos em vídeos, tornar imagens estáticas animações ou produzir áudios com a voz da pessoa com base em outros áudios previamente gravados. O termo “deep fake” sofreu um avanço nas pesquisas de 900% desde 2017.
Ainda relacionado ao assunto, o termo “voice phishing”, ou seja, a criação de áudios falsos de pessoas com sua própria voz, também aumentou os números de pesquisas em 227% nos últimos anos.
Isso nos levanta um alerta, pois essa tecnologia já foi utilizada para a aplicação de alguns golpes por todo o mundo, já que os conteúdos produzidos são muitas vezes muito realistas e pessoas podem se utilizar indevidamente desse avanço.
2 – Aumento aplicações com Python
A linguagem Python é amplamente utilizada dentro da área de ciência de dados e é muito versátil. Ela pode ser usada para a implantação de diversas tecnologias e aplicações, além de existirem inúmeras bibliotecas prontas e gratuitas para serem utilizadas. O número de pesquisas por “python” cresceu 150% nos últimos 10 anos e é atualmente ranqueada como a terceira linguagem de programação mais popular, com expectativas de alcançar o topo desta lista até 2025 e já a linguagem que mais recebe perguntas mensalmente no Stack Overflow.
3 – Maior demanda por soluções em IA de ponta a ponta
Empresas que trabalham com inteligência artificial, como a startup recentemente comprada pela Google, Dataiku, ou a Aquarela Analytics estão sendo cada vez mais procuradas. Elas auxiliam outras empresas e indústrias a lidar com grandes quantidades de dados e a construir modelos de machine learning para tratá-los. As pesquisas por “Dataiku” cresceram 156% desde 2017, aumentando ainda mais depois da aquisição pelo Google. Outras empresas que que também estão à frente quando se trata de inovações com Inteligência Artificial é a Deep Mind, também comprada pela Google e que utiliza IA para traduzir e restaurar textos antigos, e a OpenAI, que cria imagens a partir de descrições feitas com linguagem natural.
4 – Companhias estão contratando mais Cientistas de Dados
A quantidade de dados coletados por redes sociais e equipamentos IoT cresce a cada dia, aumentando, assim, a demanda por cientistas de dados. Para garantir o tratamento desses dados e a transformação deles em informações úteis, surge cada vez mais a necessidade de profissionais qualificados da área. Por causa desta realidade, o termo “cientista de dados” cresceu 93% em aparições online desde 2017. Outro fato interessante sobre o assunto é o surgimento de novos termos para profissionais que trabalham com dados, ou seja, subdivisões do cargo de cientista de dados, como Analista de Dados, Engenheiro de Dados, Arquiteto de Dados e outros.
5 – Cientistas de dados utilizando o Kaggle
Para quem é da área da ciência de dados isso pode não ser uma novidade. Entretanto, a plataforma Kaggle vem crescendo e sendo cada vez mais utilizada pelos cientistas de dados. Assim, tornou-se quase uma rede social para os profissionais, que a utilizam para tirar dúvidas, compartilhar suas soluções, buscar ajuda para soluções de problemas etc. O número de pesquisas pela plataforma cresceu 55% nos últimos 5 anos. Além disso, ela é utilizada por mais de 5 milhões de usuários em 194 países.
6 – Aumento de interesse na proteção dos dados dos consumidores
Após as últimas polêmicas sobre o uso indevido de dados de usuários de grandes plataformas, intensificou-se a preocupação e procura sobre o tema e questões sobre privacidade e proteção de dados. No Brasil, por exemplo, houve a implantação da LGPD. A partir disso, o número de pesquisas pelo termo “privacidade de dados” cresceu 125% nos últimos 10 anos.
7 – Modos de burlar aplicações de IA
Houve um grande aumento no número de pesquisas sobre o assunto. A ideia deste tipo de ação é provocar “ilusões de óptica” nas aplicações de Machine Learning por meio da utilização de padrões que confundem o funcionamento de Inteligências Artificiais que fazem reconhecimento facial ou adicionando dados que possam resultar em erros. Algumas das motivações para esse tipo de intervenção seria para o cometimento de atividades criminosas ou então para encontrar possíveis erros e realizar melhorias no funcionamento dessas aplicações.
Tendências em ciência de dados – Considerações finais
A tecnologia é uma das áreas que mais produz inovações, e também uma das que mais exige a atenção dos profissionais do setor em relação às tendências, aos temas em alta e às novidades que estão sendo testadas e implementadas. Portanto, estar atualizado sobre as tendências de mercado é algo muito importante e estratégico.
Os tópicos aqui abordados são previsões para os próximos 3 ou 4 anos, considerando a popularidade dos termos em ferramentas de busca ou de social listening com dados coletados em anos passados. Outro ponto importante é considerarmos que nem toda ação humana é previsível, podendo ser influenciada por grandes eventos e fatores internos e externos ao tema em discussão, mas tendências baseadas em dados como essa lista nos ajudam a traçar um possível panorama de como será o futuro da área de ciência de dados.
Quer saber mais sobre como funcionam as atividades de previsão? Confira nosso artigo sobre previsão de demanda.
Quem é a Aquarela Analytics?
A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial na indústria e em grandes empresas. Por meio da plataforma Vortx e da metodologia DCIM (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Auren (energia), Scania e Grupo Randon (automotivo), SolarBR Coca-Cola (alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Telefônica Vivo (Telecomunicações), dentre outros. Fique atento às novas publicações diárias da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!
Autores
Analista de Marketing na Aquarela Analytics. Graduada em Moda pela UDESC e cursando MBA em Marketing pela USP/Esalq.
Cientista de dados python na Aquarela Advanced Analytics, cursando Mestrado em Informática na Puc Minas com foco em Machine Learning, pesquisador acadêmico no grupo de pesquisa IMScience, formado em Engenharia de Computação pela Puc Minas e premiado com Destaque Acadêmico pela Sociedade Brasileira de Computação. Possui experiência na área de Machine Learning, Deep Learning, Multi-Agent Learning e Data Science, assim como Python e SQL. Realizou intercâmbio para a França cursando Engenharia de Software, participou do grupo de pesquisa LICAP (Laboratório de Inteligência Computacional Aplicada). Sempre buscando ampliar conhecimento com cursos externos para poder aprender e aplicar na área em que atua. Possui facilidade de trabalhar em grupo, e espírito de liderança.