La calidad de la información de los sitios disponibles en Internet es muy variable, por lo que no existe un control regulado en su publicación.
Aquí detallamos algunos aspectos a tener en cuenta en su evaluación:
- Calidad de los resultados mostrados: El usuario se centrará casi siempre en los primeros enlaces. Es importante para un buscador Web ofrecer los mejores resultados en las primeras posiciones. Para medir la calidad de estos resultados se analizan los siguientes factores:
- Número de enlaces relevantes: Número de páginas relacionadas con el tema buscado que aparecen en las primeras posiciones.
- Número de enlaces duplicados o muertos: Indica el número de enlaces rotos o duplicados, que no aportan ninguna utilidad al usuario.
- Número de páginas cubiertas por un servidor: Es mayor la probabilidad de contener la página buscada, cuantas más páginas contengan los buscadores en sus bases de dato
- Tiempo de respuesta : En general, el
usuario valora la rapidez con la que el motor de búsqueda obtiene los
resultados deseados, pues raramente esperará más de unos segundos hasta
tener los primeros resultados de la búsqueda.
- Estructura de la interfase y accesibilidad a la página de acceso al buscador.
- Servicios adicionales y tipo de servicios:
- Posibilidad de búsqueda avanzada
- Opciones de búsqueda
- Contadores
- Monitorización
- Campos abarcados
De todas las medidas propuestas para evaluar a los SRI, hay dos criterios que son los más utilizados:
- La exhaustividad o recall:
El valor asociado se obtiene de dividir el
número de documentos relevantes que satisfacen una consulta entre el
total de documentos relevantes contenidos en la base de datos.
Por ejemplo,
suponiendo que en la base de datos existen 40 documentos relevantes
para la consulta de un usuario y que el sistema de recuperación obtiene
20 documentos relevantes, por lo tanto la exhaustividad es de 20/40, es
decir 50%.
-
La precisión:
La precisión se obtiene de dividir el número
de documentos relevantes recuperados entre el número total de documentos
recuperados.
Por ejemplo, suponiendo que un SRI
contiene 40 documentos relevantes que satisfacen una consulta dada, y
el sistema de recuperación solamente obtiene 30 documentos, de los
cuales sólo 20 son relevantes; entonces la presición del sistema es de
20/30, es decir 67%.
Otros criterios de evaluación:
Son los relacionados con la estructura de datos y algoritmos de recuperación; éstos son:
-
La eficacia en la ejecución:
La eficacia en la ejecución es medida por el tiempo que toma un SRI para realizar una operación. Este parámetro es importante en un SRI,
debido a que un largo tiempo de recuperación, interfiere con la
utilidad del sistema, llegando a alejar a los usuarios del mismo si es
lento.
-
La eficiencia del almacenamiento.
La eficiencia del
almacenamiento es medida por el número de bytes que se precisan para
almacenar los datos. El espacio general, una medida común para medir la
eficacia del almacenamiento, es la razón del tamaño del índice de los
archivos más el tamaño de los archivos del documento sobre el tamaño de
los archivos del documento.
Los valores del espacio general que oscilan entre los valores 1,5 y 3 son típicos de los SRI basados en los archivos inversos.
Otros criterios de Evaluación:
Según Lancaster (1973) propuso que los criterios para la evaluación de los SRI deberían estar basados en los siguientes factores:
1) cobertura o alcance
2) exhaustividad
3) precisión
4) tiempo de respuesta
5) esfuerzo del usuario
6) formato de presentación
En todos los casos, la medida se basa en la relevancia
de los documentos recuperados, es decir, en qué tanto se ha satisfecho
la necesidad de información de los usuarios que hacen la consulta. Y
aunque siempre se dice que la relevancia es un criterio subjetivo debido
a que diferentes personas asignarían diferentes valores de relevancia a
un documento, siempre se toma en cuenta en cualquier método de
evaluación de los SRI.
No hay comentarios:
Publicar un comentario