El filtrado colaborativo es el proceso predictivo detrás de los motores de recomendación. Los motores de recomendación analizan información sobre usuarios con gustos similares para evaluar la probabilidad de que un individuo objetivo disfrute de algo, como un video, un libro o un producto. El filtrado colaborativo también se conoce como filtrado social.
El filtrado colaborativo utiliza algoritmos para filtrar los datos de las reseñas de los usuarios y hacer recomendaciones personalizadas para los usuarios con preferencias similares. El filtrado colaborativo también se utiliza para seleccionar contenido y publicidad para individuos en las redes sociales.
Los tres tipos de filtrado colaborativo que se utilizan habitualmente en los sistemas de recomendación son el basado en vecinos, el elemento a elemento y el basado en clasificación.
En el filtrado basado en vecinos, los usuarios se seleccionan por su similitud con el usuario activo. Esta similitud se determina mediante la coincidencia de usuarios que han publicado reseñas similares. Con base en la similitud anterior, se presume que los gustos y disgustos futuros también serán similares. A partir de la calificación promedio del grupo, se hacen recomendaciones para el usuario activo.
Un proceso de filtrado de artículo a artículo utiliza una matriz para determinar la semejanza de pares de artículos. Los procesos de elemento a elemento luego comparan la preferencia del usuario actual con los elementos de la matriz en busca de similitudes en las que basar las recomendaciones.
Un sistema de filtrado colaborativo basado en la clasificación recomienda cosas en función de cómo les gustó esa clasificación o género a usuarios similares. Se asume que los usuarios que disfrutan o no les gustan experiencias similares dentro de una clasificación también disfrutarán de otras dentro de esa clasificación.
Algunos sistemas de filtrado colaborativo se basan en la memoria, como los modelos vecinos y de elemento a elemento, que comparan similitudes de usuarios o elementos. Otros se basan en modelos y utilizan el aprendizaje automático para comparar elementos diferentes. Los sistemas basados en modelos pueden utilizar algoritmos como el proceso de decisión de Markov para predecir las calificaciones de los elementos que aún no se han revisado. Los sistemas híbridos incluyen funciones de filtrado basado en modelos y en memoria.
Los sistemas de recomendación se utilizan para proporcionar sugerencias para todo tipo de sitios web y servicios. Aún así, pueden encontrar una serie de dificultades. La escasez de calificaciones es uno de los principales obstáculos para la utilidad del filtrado colaborativo en sistemas con muchos elementos. Los artículos nuevos también tienden a ser difíciles de ofrecer recomendaciones. Bajo los nuevos sistemas de recomendación, es difícil brindar buenas recomendaciones antes de que suficientes usuarios hayan ingresado reseñas. Sin embargo, al mismo tiempo, demasiadas calificaciones de los usuarios pueden ser un desafío para algunos sistemas porque generan grandes conjuntos de datos.