Em 2016, o Ipea publicou uma pesquisa denominada “Sobrenomes e Ancestralidade no Brasil” [1], que buscava determinar a ancestralidade dos sobrenomes dos brasileiros.
Na primeira fase do trabalho, foram obtidos 71.404 pares de sobrenomes-ancestralidade a partir de diversas fontes históricas. Em uma segunda fase, usando nomes de 46,8 milhões de brasileiros encontrados na Relação Anual de Informações Sociais (RAIS) Migra de 2013, foram obtidos dois sobrenomes para cada indivíduo, resultando em uma base com 530 mil sobrenomes únicos.
Nesse ponto, ficou claro que muitos sobrenomes únicos não estavam na base criada a partir da fonte histórica. O motivo principal eram erros de digitação. Então, foi aplicado um algoritmo de fuzzy matching que permitiu criar a correspondência entre a maioria (96,4%) desses sobrenomes aos sobrenomes da base. Os sobrenomes restantes, que não tinham correspondência com os da base, foram então tratados com um algoritmo de aprendizado de máquina.
O algoritmo de fuzzy matching escolhido usou o critério “optimal string alignment” (OSA), exigindo uma distância entre duas strings de, no máximo, 1 (um).
[1] MONASTÉRIO, L. Sobrenomes e Ancestralidade no Brasil. Rio de Janeiro: Ipea, 2016. (Texto para Discussão, n. 2229).
Considere esse contexto e redija um texto dissertativo contínuo de 35 a 45 linhas em que, de forma fundamentada, apresente:
• a ideia básica das técnicas de fuzzy matching aplicadas a strings;
• a explicação do que é o critério OSA, mencionando quais mudanças na string são consideradas por esse critério;
• a justificativa de o OSA ser considerado um bom critério nesse contexto;
• a indicação e a explicação de um outro algoritmo, ou critério, alternativo ao OSA que poderia ser utilizado nesse contexto, mencionando a diferença entre o algoritmo alternativo e o OSA;
• a justificativa de a distância máxima de 1 poder, nesse contexto, ser considerada um bom limite, indicando também os impactos da escolha de distâncias maiores.
CONTEÚDO EXCLUSIVO
Confira nossos planos especiais de assinatura e desbloqueie agora!
Ops! Esta questão ainda não tem resolução em texto.
Ops! Esta questão ainda não tem resolução em vídeo.
Questões Relacionadas
Texto I
A programação orientada a objetos (POO) é um paradigma de programação que preza pela organização do código em torno de objetos, que representam entidades do mundo real e possuem características e comportamentos. Por esse motivo, é considerado um dos paradigmas mais populares e utilizados na indústria de desenvolvimento de software.
Texto II
O código-fonte a seguir mostra a versão cliente de uma aplicação estruturada na arquitetura cliente-servidor, desenvolvido em Python.

Considerando as informações apresentadas no texto e no código-fonte em Python, elabore um texto dissertativo contínuo, entre 20 e 30 linhas, sobre orientação aos objetos e as redes de computadores abordando, neces…
Os produtos de software feitos por uma equipe de desenvolvimento demonstraram baixa qualidade no ambiente de produção. Devido a reclamações, foi feita uma auditoria que levantou os seguintes fatos:
- • a especificação das funcionalidades era muito informal;
- • durante os testes de integração, os componentes integrados não funcionavam como especificado, causando retrabalho pelos desenvolvedores de componentes;
- • todos os testes eram feitos à mão e, como isso demorava, nem sempre eram feitos todos os testes necessários;
- • não havia uma homologação das funcionalidades com o usuário antes do produto entrar em operação;
- • não havia uma reflexão da equipe de modo a entender como melhorar o seu proce…
Instruções a serem seguidas na construção das respostas:
Para responder aos itens desta questão, escreva, apenas, o código completo das classes Jogador e GerenteJogo. Isso inclui o código apresentado no enunciado e o código que fará parte da resposta que deve ser escrita (escreva esse código).
É possível acrescentar o código que quiser nas classes Jogador e GerenteJogo, mas não é permitido suprimir nem modificar as variáveis de instância que fazem parte do código do enunciado. Não é permitido, também, modificar as interfaces
Observado e Observador nem acrescentar ao código do enunciado novas classes e/ou interfaces.
Uma empresa disponibiliza um site na Web em que grupos de 3 a 6 pessoas pode…




