5 Desafios Principais na Era Atual de Big Data

5 Desafios Principais na Era Atual de Big Data

5 Desafios Principais na Era Atual de Big Data

A transformação digital criará trilhões de dólares em valor. Embora as estimativas variem, o Fórum Econômico Mundial em 2016 estimou um aumento de US $ 100 trilhões em negócios e valor social global até 2030. Devido à IA, a PwC estimou um aumento de US $ 15,7 trilhões e a McKinsey estimou um aumento de US $ 13 trilhões no PIB global anual até 2030. No momento, estamos no meio de um renascimento da IA, impulsionado por grandes dados e avanços no aprendizado de máquina e no aprendizado profundo. Esses avanços oferecem oportunidades e desafios às empresas, dependendo da velocidade com que se adaptam a essas mudanças.

As empresas modernas enfrentam 5 desafios principais na era atual de Big Data

1. Lidando com uma multiplicidade de sistemas de origem corporativos

A empresa média Fortune 500 possui algumas centenas de sistemas de TI corporativos, todos com seus diferentes formatos de dados, referências incompatíveis entre fontes de dados e duplicação.

2. Incorporar e contextualizar dados de alta frequência

O desafio fica significativamente mais difícil com o aumento do sensoriamento, resultando em entradas de dados em tempo real. Por exemplo, as leituras da temperatura de exaustão do gás para um compressor de baixa pressão offshore têm apenas um valor limitado por si só. Mas, combinados com temperatura ambiente, velocidade do vento, velocidade da bomba do compressor, histórico de ações de manutenção anteriores e registros de manutenção, esses dados em tempo real podem criar um sistema de alarme valioso para os operadores de plataformas offshore.

3. Trabalhando com lagos de dados

Hoje, armazenar grandes quantidades de dados diferentes, colocando tudo em um único local de infraestrutura, não reduz a complexidade dos dados, assim como deixa os dados em sistemas corporativos em silos.

4. Garantir a consistência dos dados, a integridade referencial e o uso contínuo downstream

Um quarto desafio de big data é representar todos os dados existentes como uma imagem unificada, mantendo essa imagem atualizada em tempo real e atualizando todas as análises posteriores que usam esses dados. As taxas de chegada de dados variam de acordo com o sistema, os formatos de dados dos sistemas de origem são alterados e os dados chegam fora de ordem devido a atrasos na rede.

5. Habilitando novas ferramentas e habilidades para novas necessidades

As equipes de TI e analítica da empresa precisam fornecer ferramentas que permitam aos funcionários com diferentes níveis de proficiência em ciência de dados trabalhar com grandes conjuntos de dados e executar análises preditivas usando uma imagem de dados unificada.

Vamos ver o que está envolvido no desenvolvimento e implantação de aplicativos de IA em escala

Montagem e preparação de dados

O primeiro passo é identificar os conjuntos de dados necessários e relevantes e montá-los. Muitas vezes, existem problemas com duplicação de dados, lacunas nos dados, dados indisponíveis e dados fora de sequência.

Engenharia de recursos

Isso envolve analisar os dados e elaborar sinais individuais que os cientistas de dados e especialistas em domínio acham que serão relevantes para o problema que está sendo resolvido. No caso de manutenção preditiva baseada em IA, os sinais podem incluir a contagem de alarmes de falha específicos nos últimos 7 dias, 14 dias e 21 dias, a soma dos alarmes específicos nos mesmos períodos finais; e o valor máximo de certos sinais do sensor nesses períodos finais.

Rotulando os resultados

Esta etapa envolve rotular os resultados que o modelo tenta prever. Por exemplo, em aplicativos de manutenção preditiva baseados em IA, os conjuntos de dados de origem raramente identificam rótulos de falhas reais, e os profissionais precisam inferir pontos de falha com base em uma combinação de fatores como códigos de falha e ordens de serviço do técnico.

Configurando os dados de treinamento

Para tarefas de classificação, os cientistas de dados precisam garantir que os rótulos sejam balanceados adequadamente com exemplos positivos e negativos para fornecer ao algoritmo classificador dados balanceados suficientes. Os cientistas de dados também precisam garantir que o classificador não seja influenciado por padrões artificiais nos dados.

Escolhendo e treinando o algoritmo

Atualmente, inúmeras bibliotecas de algoritmos estão disponíveis para cientistas de dados, criadas por empresas, universidades, organizações de pesquisa, agências governamentais e colaboradores individuais.

Implantando o algoritmo na produção

Os algoritmos de aprendizado de máquina, uma vez implantados, precisam receber novos dados, gerar resultados e tomar algumas ações ou decisões com base nesses resultados. Isso pode significar incorporar o algoritmo em um aplicativo corporativo usado por humanos para tomar decisões – por exemplo, um aplicativo de manutenção preditiva que identifica e prioriza equipamentos que necessitam de manutenção para fornecer orientação às equipes de manutenção. É aqui que o valor real é criado – reduzindo o tempo de inatividade do equipamento e os custos de manutenção por meio de uma previsão de falha mais precisa que permite manutenção proativa antes que o equipamento realmente falhe. Para que os algoritmos de aprendizado de máquina operem na produção, a infraestrutura de computação subjacente precisa ser configurada e gerenciada.

Melhoria contínua de loop próximo

Os algoritmos geralmente exigem reciclagem frequente pelas equipes de ciência de dados. À medida que as condições do mercado mudam, os objetos e processos de negócios evoluem e novas fontes de dados são identificadas. As organizações precisam desenvolver rapidamente, treinar e implantar novos modelos conforme as circunstâncias mudam.

Portanto, os problemas que precisam ser resolvidos para resolver os problemas de computação da IA ​​não são triviais. Computação elástica massivamente paralela e capacidade de armazenamento são pré-requisitos. Além da nuvem, há uma multiplicidade de serviços de dados necessários para desenvolver, provisionar e operar aplicativos dessa natureza. No entanto, o preço de perder uma mudança estratégica transformacional é alto. O cemitério corporativo está cheio de empresas outrora excelentes que não conseguiram mudar.

Fonte: Makeen Technologies