Algoritmo PSI: busca de tuplas duplicadas por meio de similaridade fonética e numérica

Tiago Luís de Andrade, Beatriz A. Acosta F. da Cruz

Resumo


Com o objetivo de garantir uma maior confiabilidade e consistência dos dados armazenados em banco de dados, este trabalho visa a detecção de registros duplicados por meio de similaridade fonética como tarefa inicial e integrante do processo de descoberta de conhecimento em bases de dados. A proposta é oferecer a possibilidade de atuar no processo sem a necessidade de conhecer o tema ou as características das informações armazenadas, mas sim oferecer recursos computacionais de identificação de tuplas duplicadas automaticamente e amparadas em aspectos fonéticos dos dados armazenados.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.


ISSN (online): 2447-5386