Um sistema de monitoramento de licitações públicas usando aprendizado de máquina supervisionado foi implementado em uma grande região para detectar padrões de irregularidades. Este sistema deve prever se uma licitação possui ou não indícios de irregularidade, baseado nos parâmetros abaixo:
I. Valor do Contrato: Um número decimal que representa o valor total do contrato.
II. Tipo de Contrato: Podendo ser ‘Serviços’ ou ‘Compras’.
III. Região: Região geográfica da licitação (‘Norte’, ‘Sul’, ‘Leste’, ‘Oeste’)
IV. Número de Participantes: Número de empresas que participaram do processo licitatório.
V. Histórico de Regularidade do Proponente (HI): Valor binário representando se o proponente possui histórico de contratos sem irregularidades (‘F’) ou com irregularidades (‘V’).
Após treinar o modelo com aproximadamente metade dos casos sendo licitações regulares e metade irregulares usando o modelo de árvores de decisão, ele é testado com 1000 licitações conhecidas, sendo 200 casos de licitações garantidamente com indícios de irregularidades (HI=’V’) e 800 casos de licitações garantidamente sem indícios(HI=’F’). Após ser executado, modelo indica que 100 licitações possuem irregularidades (HI=’V’) e 900 não possuem(HI=’F’).
Responda os itens a seguir:
1. Calcule a Precisão, Acurácia, Revocação e a Medida F1 do modelo;
2. Interprete a Precisão e a Acurácia obtidas, incluindo o que significa uma ser maior ou menor que a outra;
3. Aponte os pré-processamentos corretos que precisam ser feitos com os parâmetros de entrada para garantir a eliminação do BIAS e convergência do algoritmo?
4. Explique o que significa a entropia na árvore de decisão.
CONTEÚDO EXCLUSIVO
Confira nossos planos especiais de assinatura e desbloqueie agora!
Ops! Esta questão ainda não tem resolução em texto.
Ops! Esta questão ainda não tem resolução em vídeo.
Questões Relacionadas
Texto I
A programação orientada a objetos (POO) é um paradigma de programação que preza pela organização do código em torno de objetos, que representam entidades do mundo real e possuem características e comportamentos. Por esse motivo, é considerado um dos paradigmas mais populares e utilizados na indústria de desenvolvimento de software.
Texto II
O código-fonte a seguir mostra a versão cliente de uma aplicação estruturada na arquitetura cliente-servidor, desenvolvido em Python.

Considerando as informações apresentadas no texto e no código-fonte em Python, elabore um texto dissertativo e argumentativo sobre orientação a objetos e redes de computadores abordando, necessariamente, os seguin…
O Sistema Eletrônico de Informações (SEI) é um sistema desenvolvido pelo Tribunal Regional Federal da 4ª Região (TRF4) e é usado em diversas instituições públicas, como sistema de gestão de processos e documentos eletrônicos.

Figura 1. Tela de login da versão do SEI para desktops
A criação do Sistema se deu em 2009, objetivando maior agilidade ao trâmite de processos, prescindir do papel como suporte físico para documentos institucionais, gerar economia em termos de aquisição e guarda de papéis e documentos, serviços de postagem, bem como garantir maior transparência aos registros administrativos. Hoje é o sistema que deve ser preferencialmente adotado por toda a administração pública feder…
A Política de Dados Abertos do Poder Executivo Federal foi instituída pelo Decreto nº 8.777, de 11 de maio de 2016, e tem por objetivo a disponibilização na internet – por parte de órgãos e entidades da administração pública federal direta, autárquica e fundacional – de dados e informações acessíveis ao público que possam ser livremente lidos por máquina, usados, cruzados e reutilizados, fomentando-se o controle social, o desenvolvimento tecnológico, o aprimoramento da cultura de transparência pública e a inovação nos diversos setores da sociedade.
O Plano de Dados Abertos do Banco Central do Brasil (PDA/BC) estabelece o modelo de governança, diretrizes e orientações estratégicas e operacio…



