Estimando similaridade entre entidades quando apenas seus nomes estão disponíveis.
Nenhuma Miniatura disponível
Data
2018
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
A similaridade pode refletir a relação ou significado entre dois conceitos ou entidades,
por exemplo. Uma entidade pode ser algo físico ou lógico, podendo ser descrita em
função de atributos cujos valores informam as características específicas da entidade,
diferenciando-nas uma das outras, como por exemplo a entidade artigo científico e alguns
de seus atributos, nome, palavras-chaves, resumo. Estimar a similaridade entre entidades
desempenha um papel importante em várias tarefas, como, por exemplo, expansão de
consultas, desambiguação e recomendação de entidades. Identificar a similaridade entre
entidades por meio dos nomes, como entre títulos de artigos científicos, pode não ser viável
a partir, apenas, da comparação direta ou usando abordagens de similaridade baseadas em
conhecimento. A Web, por outro lado, traz uma grande variedade de dados sobre diversos
assuntos e é de livre acesso, sendo uma fonte de dados viável para auxiliar na verificação
de similaridade entre um par de nomes de entidades em diversos domínios. Neste trabalho,
é proposto um método para calcular a similaridade entre dois nomes de entidades, baseado
na comparação direta e nas características inferidas a partir de dados obtidos da Web com
modelagem de tópicos e com o auxílio de termos de gênero. Os experimentos mostram
que o método é capaz de verificar a similaridade entre nomes de entidades, mesmo entre
aqueles que compartilham poucos ou mesmo nenhum termo, superando o método utilizado
como baseline.
Descrição
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
Palavras-chave
Integração de dados - computação, Dados da web
Citação
SOUSA, Priscila Sad de. Estimando similaridade entre entidades quando apenas seus nomes estão disponíveis. 2018. 64 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2018.