O processo de descoberta de conhecimento em bancos de dados (KDD) é fundamental para a identificação de padrões e tendências valiosas dentro de grandes volumes de dados. A cada dia, novas fontes de dados são geradas, o que torna a tarefa de extrair informações relevantes mais desafiadora. KDD é um processo iterativo que envolve várias etapas, desde a coleta e preparação dos dados até a interpretação e validação dos padrões descobertos. O processo de KDD é um esforço multidisciplinar que envolve técnicas de mineração de dados, estatística, aprendizado de máquina e conhecimento específico do domínio.
Fayyad et al. Knowledge Discovery and Data Mining:
towards a unifying framework, 1996 (tradução livre).
Considerando que o fragmento de texto acima tem caráter unicamente motivador, redija um texto dissertativo em atendimento ao que se pede a seguir.
1 Aborde duas das principais etapas do processo de KDD e a importância de cada uma delas. [valor: 10,00 pontos]
2 Descreva duas técnicas de mineração de dados utilizadas durante o processo de KDD. [valor: 10,00 pontos]
3 Explique como a interpretação e validação dos padrões descobertos impactam a utilidade do conhecimento extraído para a tomada de decisões. [valor: 8,50 pontos]
CONTEÚDO EXCLUSIVO
Confira nossos planos especiais de assinatura e desbloqueie agora!
Ops! Esta questão ainda não tem resolução em texto.
Ops! Esta questão ainda não tem resolução em vídeo.
Questões Relacionadas
Fraude financeira detectada por anomalias em dados heterogêneos
Uma instituição financeira começou a registrar reclamações de clientes sobre transações não reconhecidas realizadas em seu aplicativo mobile. Embora os logs estruturados de autenticação indicassem atividade aparentemente legítima — incluindo uso de dispositivos conhecidos, locais compatíveis e credenciais corretas —, análises posteriores revelaram que dados não estruturados, como mensagens de atendimento, transcrições de ligações e registros semiestruturados em formato JSON, já apresentavam sinais precoces de irregularidades.
Ao integrar e cruzar diferentes fontes de dados, os analistas identificaram padrões de comportamento atí…
A startup EduMais+, especializada em educação online, oferece cursos personalizados para milhares de alunos no Brasil. Com o crescimento acelerado da base de usuários, a empresa enfrenta gargalos no desempenho e na escalabilidade de seu banco de dados relacional tradicional, que armazena:
- Dados cadastrais dos alunos e professores;
- Conteúdos dos cursos (vídeos, textos, exercícios);
- Registros de atividades dos alunos (acessos, respostas, progresso);
- Relacionamentos entre alunos, colegas de estudo, tutores e mentores;
- Histórico de interações em fóruns e chats.
Para sanar os problemas apontados, a equipe de desenvolvimento decidiu adotar solução baseada em banco de dados NoSQL usando, para tal…
A Alice, acrônimo de Analisador de Licitações, Contratos e Editais, é uma ferramenta desenvolvida pela CGU que analisa diariamente, de forma automatizada, os processos de compras e contratações públicas. Diante de potenciais riscos e inconsistências, dispara alertas para que seja possível atuar de forma preventiva e tempestiva em processos licitatórios publicados.
Atualmente a Alice realiza a análise a partir dos dados do Portal de Compras do Governo Federal (Compras.gov.br), do Portal de Compras do Banco do Brasil (Licitacoes-e), do Portal de Compras da Caixa Econômica Federal (Licitações Caixa), além das dispensas e inexigibilidades publicadas no Diário Oficial da União (DOU).

A ferrament…



