Búsqueda borrosa

Una búsqueda difusa es un proceso que localiza páginas web que probablemente sean relevantes para un argumento de búsqueda, incluso cuando el argumento no se corresponde exactamente con la información deseada. Una búsqueda aproximada se realiza mediante un programa de coincidencia aproximada, que devuelve una lista de resultados basada en la relevancia probable, aunque las palabras de los argumentos de búsqueda y la ortografía no coincidan exactamente. Las coincidencias exactas y muy relevantes aparecen cerca de la parte superior de la lista. Se pueden dar calificaciones de relevancia subjetiva, generalmente como porcentajes.

Un programa de coincidencia aproximada puede funcionar como un corrector ortográfico y un corrector de errores ortográficos. Por ejemplo, si un usuario escribe "Misissippi" en Yahoo o Google (ambos utilizan la concordancia aproximada), se devuelve una lista de resultados junto con la pregunta "¿Quisiste decir Mississippi?" Se proporcionan ortografías alternativas y palabras que suenan igual pero se escriben de manera diferente. Un programa de coincidencia aproximada puede compensar errores comunes de escritura de entrada, así como errores introducidos por el escaneo de reconocimiento óptico de caracteres (OCR) de documentos impresos. El programa puede devolver resultados con contenido que contenga una palabra base específica junto con prefijos y sufijos. Por ejemplo, si se ingresa "planeta" como palabra de búsqueda, los resultados se producirán para sitios que contengan palabras como "protoplaneta" o "planetario". El programa también puede encontrar sinónimos y términos relacionados, funcionando como un tesauro en línea o una herramienta enciclopédica de referencias cruzadas. En el motor de búsqueda Ask Jeeves, si se ingresa la palabra "galaxia", se devuelven resultados como "Fotografía de galaxias", "Vía Láctea" y "La gira del sistema solar de los nueve planetas".

Los programas de coincidencia aproximada generalmente devuelven resultados irrelevantes y relevantes. Es probable que se produzcan resultados superfluos para términos con múltiples significados, solo uno de los cuales es el significado que el usuario pretende. Si el usuario solo tiene una idea vaga o general del tema, o no sabe exactamente qué buscar, la proporción de hits relevantes e irrelevantes tiende a ser baja. (Sin embargo, la proporción es aún menor cuando se usa un programa de coincidencia exacta en esta situación).

La búsqueda aproximada es mucho más poderosa que la búsqueda exacta cuando se usa para investigación e investigación. La búsqueda difusa es especialmente útil cuando se buscan términos desconocidos, en idiomas extranjeros o sofisticados, cuya ortografía correcta no se conoce ampliamente. La búsqueda aproximada también se puede utilizar para localizar a personas basándose en información de identificación incompleta o parcialmente inexacta.