Recuperación de información
Seguridad y recuperación de información
Recuperación de información:
Está indisolublemente
vinculado a la búsqueda de información y consiste en la localización de
recursos de información con el propósito de dar solución a necesidades de
información específicas.
Es el conjunto de tareas mediante las cuales el usuario localiza
y accede a los recursos de información que son pertinentes para la resolución
del problema planteado. En estas tareas desempeñan un papel fundamental los
lenguajes documentales, las técnicas de resumen, la descripción del objeto
documental, etc. [1]
Proceso donde se accede a una información previamente
almacenada, mediante herramientas informáticas que permiten establecer
ecuaciones de búsqueda específicas. Dicha información ha debido de ser
estructura previamente a su almacenamiento.
Antecedentes
Desde los tiempos remotos, el hombre ha tratado de representar
información a través de diversos medios. Los soportes han evolucionado; hoy en
día la información se representa también digitalmente. Unido a ello, el
crecimiento exponencial de la información en Internet, disponible en diversos
formatos y sistemas de información ha traído consigo una sobrecarga. Entonces
se hace cada vez más importante el procesar toda la información disponible para
que pueda ser recuperada y usada con diversos fines.
La Recuperación de Información es un área que ha venido
experimentando un creciente interés desde finales de la década de 1950. En la
actualidad adquiere una mayor importancia por el valor que tiene la información
como recurso para el desarrollo de procesos, para la adquisición de
conocimiento, para garantizar la sostenibilidad de las organizaciones actuales
ante los constantes cambios del entorno (clientes, competidores, legislaciones,
etc.). El éxito de cualquier operación dentro de una organización depende de la
información de calidad que dispongan lso decisores e individuos vinculados
directamente a la situación.
Herramientas para la recuperación de información
·
Internet (revistas
electrónicas, buscadores temáticos y multitemáticos,
directorios, metabuscadores)
·
Agentes
inteligentes
·
Índices
·
Tesauros
·
Palabras claves
·
Ecuaciones de
búsqueda
Técnicas de recuperación de información
Sistemas de
recuperación de lógica difusa:
Permite formular consultas con
frases normales y luego la máquina solo procesa las palabras que considera
relevantes, no tomando en cuenta signos de puntuación, artículos, conjunciones,
plurales, tiempos verbales, palabras comunes (que suelen aparecer en todos los
documentos). La recuperación se basa en proposiciones lógicas con valores de
verdadero y falso, teniendo en cuenta la localización de la palabra en el
documento.
Técnicas de
ponderación de términos:
La ponderación da un valor
adecuado a los criterios de búsqueda, dependiendo de los intereses del usuario,
por tanto la recuperación de información depende del valor asignado. El
documento más pertinente de búsqueda sería aquel que tenga representado todos
los términos de búsqueda y además el que más valor tenga repetidos más veces,
independientemente de donde se localice en el documento.
Técnica de clustering:
Es un modelo probabilístico que
permite las frecuencias de los términos de búsqueda en los documentos
recuperados. Se atribuyen unos valores (pesos) que actúan como agentes para
agrupar los documentos por orden de importancia, mediante algoritmos ranking.
Técnicas de
retroalimentación por relevancia:
Luego de determinar unos
criterios de búsqueda y observar los documentos recuperados se repete nuevamente
la consulta pero esta vez con los elementos interesantes, seleccionados de los
documentos primeramente recuperados.
Técnicas de stemming:
Elimina las posibles confusiones
semánticas que se puedan dar en la búsqueda de un concepto, para ello trunca la
palabra y busca solo por la raíz.
Técnicas lingüísticas:
Pretenden acotar de una manera
eficaz los documentos relevantes. Lo consigue mediante una correcta indización
en el proceso de tratamiento de los documentos con ayuda de índices, tesauros,
etc.; evitando las ambigüedades léxicas y semánticas alestablecer las
consultas.
Modelos de Recuperación de Información
Los modelos de recuperación de
información tratan de calcular el grado en que determinado elemento de
información responde a determinada consulta. Los tres modelos clásicos y con
mayor utilización son:
·
Booleano: basado en
la teoría de conjuntos y álgebra de Boole. Mide la correspondencia entre los
elementos de la consulta y los documentos.
·
Vectorial: fue
planteado y desarrollado por Gerard Salton. Opera mediante el álgebra de
vectores. Mide el grado en que divergen los vectores que representan la
consulta y los términos del documento.
·
Probabilístico: fue propuesto por
Robertson y Spark-Jones. Se basa en procesos estocásticos, operaciones de la
teoría de la probabilidad y el teorema de Bayes.Se calcula la probabilidad en
que el documento responde a la consulta. Frecuentemente utiliza
retroalimentación con el usuario.
Comentarios
Publicar un comentario