El documento presenta un método de agrupamiento de valores similares para mejorar la consistencia en sistemas de búsqueda, abordando la redundancia de datos en bases de datos. Se describe un algoritmo de agrupamiento que utiliza distintas medidas de semejanza para agrupar términos que se refieren a lo mismo. Los resultados muestran una mejora significativa en la calidad de los datos al aplicar esta técnica.
Related topics: