Em 2016, o Ipea publicou uma pesquisa denominada “Sobrenomes e Ancestralidade no Brasil” [1], que buscava determinar a ancestralidade dos sobrenomes dos brasileiros.
Na primeira fase do trabalho, foram obtidos 71.404 pares de sobrenomes-ancestralidade a partir de diversas fontes históricas. Em uma segunda fase, usando nomes de 46,8 milhões de brasileiros encontrados na Relação Anual de Informações Sociais (RAIS) Migra de 2013, foram obtidos dois sobrenomes para cada indivíduo, resultando em uma base com 530 mil sobrenomes únicos.
Nesse ponto, ficou claro que muitos sobrenomes únicos não estavam na base criada a partir da fonte histórica. O motivo principal eram erros de digitação. Então, foi aplicado um algoritmo de fuzzy matching que permitiu criar a correspondência entre a maioria (96,4%) desses sobrenomes aos sobrenomes da base. Os sobrenomes restantes, que não tinham correspondência com os da base, foram então tratados com um algoritmo de aprendizado de máquina.
O algoritmo de fuzzy matching escolhido usou o critério “optimal string alignment” (OSA), exigindo uma distância entre duas strings de, no máximo, 1 (um).
[1] MONASTÉRIO, L. Sobrenomes e Ancestralidade no Brasil. Rio de Janeiro: Ipea, 2016. (Texto para Discussão, n. 2229).
Considere esse contexto e redija um texto dissertativo contínuo de 35 a 45 linhas em que, de forma fundamentada, apresente:
• a ideia básica das técnicas de fuzzy matching aplicadas a strings;
• a explicação do que é o critério OSA, mencionando quais mudanças na string são consideradas por esse critério;
• a justificativa de o OSA ser considerado um bom critério nesse contexto;
• a indicação e a explicação de um outro algoritmo, ou critério, alternativo ao OSA que poderia ser utilizado nesse contexto, mencionando a diferença entre o algoritmo alternativo e o OSA;
• a justificativa de a distância máxima de 1 poder, nesse contexto, ser considerada um bom limite, indicando também os impactos da escolha de distâncias maiores.
CONTEÚDO EXCLUSIVO
Confira nossos planos especiais de assinatura e desbloqueie agora!
Ops! Esta questão ainda não tem resolução em texto.
Ops! Esta questão ainda não tem resolução em vídeo.
Questões Relacionadas
Brasil vira alvo de ataque DDoS que transforma
roteadores em bots
Por: Da Redação da Abranet – 05/06/2024
O Brasil é um dos principais alvos de ataque do malware CatDDoS, que explora mais de 80 falhas de segurança em softwares de roteadores, equipamentos de rede, entre outros, para se infiltrar nos dispositivos vulneráveis, cooptá-los e transformá-los em bots que conduzem ataques de DDoS (distributed denial-of-service ou ataque de negação em serviço, em português). O alerta é da consultoria de segurança digital, Solo Network.
O malware tem como alvo provedores de serviços em nuvem, serviços de educação, pesquisa científica, transmissão de informações, administração pública, construção …
1. Mínimo
2. Máximo
3. Média
4. f(Média), em que
f(n)=3+f(n-2)+f(n-1), quando n>=10
f(n)=1, quando n<10
Dados:
Utilize a linguagem de programação que desejar, dando maior importância à lógica do algoritmo. No entanto, não utilize funções de bibliotecas específicas, como cálculo da média em vetores. Desenvolva seu próprio raciocínio para o cálculo dos elementos solicitados.
Suponha que o vetor já esteja em memória, não sendo necessário, portanto, realizar a leitura dos números.
Em 2016, o Ipea publicou uma pesquisa denominada “Sobrenomes e Ancestralidade no Brasil” [1], que buscava determinar a ancestralidade dos sobrenomes dos brasileiros.
Na primeira fase do trabalho, foram obtidos 71.404 pares de sobrenomes-ancestralidade a partir de diversas fontes históricas. Em uma segunda fase, usando nomes de 46,8 milhões de brasileiros encontrados na Relação Anual de Informações Sociais (RAIS) Migra de 2013, foram obtidos dois sobrenomes para cada indivíduo, resultando em uma base com 530 mil sobrenomes únicos.
Nesse ponto, ficou claro que muitos sobrenomes únicos não estavam na base criada a partir da fonte histórica. O motivo principal eram erros de digitação. Então, foi…



