Uma empresa de varejo com atuação nacional iniciou um projeto para modernizar sua arquitetura de dados, substituindo repositórios legados e altamente fragmentados por uma solução escalável capaz de suportar alto volume de transações, dados provenientes de dispositivos IoT instalados em lojas físicas, registros de navegação no e-commerce e conteúdos não estruturados gerados pelo atendimento ao cliente.
Durante a implantação, constatou-se que diferentes áreas utilizavam soluções distintas de armazenamento — incluindo compartilhamentos em arquivo, volumes em bloco para sistemas transacionais e buckets de objetos na nuvem — sem governança unificada. Paralelamente, relatórios estratégicos estavam sendo prejudicados pela demora na consolidação de informações, revelando gargalos de desempenho. Em resposta, a equipe de TI decidiu criar um Data Lake corporativo integrado a um ambiente de processamento distribuído, a fim de suportar análises avançadas, alimentar modelos de IA e oferecer escalabilidade para os próximos anos. Contudo, desafios surgiram na definição do tipo de armazenamento adequado a cada necessidade, no desenho do pipeline de ingestão e na garantia de qualidade dos dados.
Considerando a situação hipotética, elabore um texto, no qual discorra, necessariamente, sobre os aspectos a seguir:
- A distinção entre armazenamento em objetos, blocos e arquivos, indicando as vantagens, limitações e casos de uso mais adequados de cada tipo, e analisando como essas escolhas impactam o desempenho e a integração dos dados no contexto da empresa [valor: 4,75 pontos].
- O papel do Data Lake e do processamento distribuído na arquitetura moderna de dados, explicando como essas tecnologias suportam análises de Big Data e modelos de IA, e indicando desafios típicos de ingestão, governança e qualidade dos dados [valor: 4,75 pontos].
CONTEÚDO EXCLUSIVO
Confira nossos planos especiais de assinatura e desbloqueie agora!
CONTEÚDO EXCLUSIVO
Confira nossos planos especiais de assinatura e desbloqueie agora!
Ops! Esta questão ainda não tem resolução em vídeo.
Questões Relacionadas
Fraude financeira detectada por anomalias em dados heterogêneos
Uma instituição financeira começou a registrar reclamações de clientes sobre transações não reconhecidas realizadas em seu aplicativo mobile. Embora os logs estruturados de autenticação indicassem atividade aparentemente legítima — incluindo uso de dispositivos conhecidos, locais compatíveis e credenciais corretas —, análises posteriores revelaram que dados não estruturados, como mensagens de atendimento, transcrições de ligações e registros semiestruturados em formato JSON, já apresentavam sinais precoces de irregularidades.
Ao integrar e cruzar diferentes fontes de dados, os analistas identificaram padrões de comportamento atí…
O intercâmbio de dados entre aplicações é o processo de transmitir e receber informações entre sistemas distintos, permitindo que eles operem em conjunto e compartilhem dados de forma integrada. Esse processo é essencial em cenários onde diferentes aplicações precisam colaborar para fornecer uma experiência coesa ou uma visão unificada dos dados.
Dois dos principais formatos de dados utilizados atualmente são JSON (JavaScript Object Notation), formato leve e fácil de ler, amplamente usado em APIs RESTful; e o XML (Extensible Markup Language), mais verboso que o JSON, mas permite esquemas complexos, sendo comum em Web Services SOAP.
A seguir, é apresentado um fragmento de código em XML:
<p…
No âmbito de ação de controle externo, equipe de auditoria identificou que determinado órgão público federal possui grandes bases de dados oriundas de sistemas de atendimento ao cidadão, gestão de benefícios e processos administrativos, mas faz uso limitado dessas informações para subsidiar decisões gerenciais e formulação de políticas públicas. Constatou-se, ainda, que o órgão pretende adotar técnicas de Descoberta de Conhecimento em Bancos de Dados (Knowledge Discovery in Databases – KDD) para extrair padrões e tendências de seus dados institucionais.
Considerando o contexto apresentado, elabore um texto dissertativo acerca da utilização de KDD no contexto da administração pública, com lin…



