Grado en Información y Documentación: Introducción a la Recuperación de Información

SmoothestGhost avatar
SmoothestGhost
·
·
Download

Start Quiz

Study Flashcards

22 Questions

¿Cuál es la norma internacional que se utiliza para la construcción de tesauros?

ISO-UNE 25964.

¿Qué elementos forman parte de un tesauro según la ISO-UNE 25964? (Selecciona todo lo que corresponda)

Términos genéricos

Los términos genéricos en un tesauro son más concretos.

False

La norma ISO-UNE 25964 está relacionada con la creación de ______________ y su interoperabilidad con otros vocabularios.

tesauros

¿Qué implica la recuperación de información en el ámbito de la Documentación y las Ciencias de la Información?

Recuperar y acceder a la información de documentos.

El análisis documental consiste en capturar elementos identificativos del documento, definir conceptos para describir el tema y permitir la agrupación temática de documentos.

True

¿Qué proceso se lleva a cabo para definir uno o varios conceptos que describan el tema sobre el que trata un documento en un sistema de información?

Indización

La _______ permite la recuperación por elementos identificativos como el título, autor, editorial, año de publicación, entre otros.

catalogación

Relaciona los siguientes tipos de búsqueda con su descripción correspondiente:

Catalogación = Permite la recuperación por elementos identificativos Indización = Permite la búsqueda por materias

¿Qué son sinónimos? (Selecciona todas las respuestas correctas)

Arañas // Arácnidos

¿Qué tipo de relación jerárquica vincula un elemento con sus partes?

Relación jerárquica partitiva

¿Es preferible usar el término científico o el de más uso en un tesauro?

True

Relaciona los siguientes términos con sus descripciones:

Derecho (TG) = Derecho romano (TE) Vertebrados (TG) = Anfibios (TE) Propiedades termodinámicas = Entalpía // Entropía // Calor de absorción

¿Qué es una taxonomía?

Una estructura formada por un conjunto de categorías y subcategorías.

El término 'taxonomía' tiene su origen en la clasificación realizada por Linneo en el siglo XVIII.

True

¿Qué son las meronomías?

Estructuras conceptuales jerárquicas en las que los elementos están vinculados por relaciones parte-todo.

Un ________ es un vocabulario de un lenguaje de indización controlada que establece relaciones entre conceptos.

tesauro

Relaciona los tipos de tesauros con su descripción:

Generales//Especializados = Nivel de especialización Monodisciplinares//Multidisciplinares = Cobertura temática Principales//Auxiliares o marginales = Relevancia del tema Macrotesauros//Microtesauros = Jerarquización de temas

¿Qué son los postcoordinados en la indización de contenidos?

Términos que se combinan en la fase de recuperación y no siguen ningún orden predeterminado.

¿Qué es un tesauro y cuál es su principal función en la indización de contenido?

Un tesauro es un lenguaje constituido por listas estructuradas de descriptores que posibilitan la descripción analítica del contenido de los documentos. Su principal función es garantizar la univocidad de los conceptos para facilitar la recuperación documental.

Las folksonomías son listas estructuradas de conceptos que han sido seleccionados de manera automática para describir el contenido de los documentos analizados.

False

¿Qué es una lista de __________ _________?

listas de autoridades

Study Notes

Introducción a la Recuperación de Información

  • La recuperación de información es una tarea esencial en la Documentación y Ciencias de la Información.
  • Implica representar documentos para poder recuperarlos de manera efectiva.

Análisis Documental

  • El análisis documental es el proceso de síntesis que permite acceder y recuperar documentos en un sistema de información.
  • Consta de varios procesos:
    • Catalogación descriptiva: Captura de elementos identificativos del documento (título, autor, editorial, año de publicación, número de páginas, etc.).
    • Indización: Definir uno o varios conceptos que describan el tema sobre el que trata el documento.
    • Clasificación: Agrupación temática de documentos para una mejor organización lógica y física.

Problemas en la Indización y Recuperación de Información

  • La ambigüedad es un problema en la indización y recuperación de información debido a la homonimia, sinonimia y polisemia.
  • Los sistemas de información gestionan mal la ambigüedad y necesitan de herramientas que faciliten la indización y la recuperación de información.

Lenguajes Documentales

  • Un lenguaje documental es un sistema artificial de signos normalizados que facilita la representación formalizada del contenido de los documentos.
  • Definiciones de lenguaje documental:
    • Son sistemas artificiales de signos normalizados que facilitan la representación formalizada del contenido de los documentos.
    • Listas restringidas de términos estructurados que permiten representar y organizar el conocimiento que se tiene de un área específica.
    • Listas de términos válidos para denominar los conceptos de una disciplina, base de datos, biblioteca, repositorio, etc.

Historia de la Organización del Conocimiento

  • La organización del conocimiento se remonta a la antigüedad, con ejemplos como la Biblioteca de Asurbanipal y la Biblioteca Alejandrina.
  • En el siglo XIX, se desarrollaron clasificaciones como la de la Biblioteca del Congreso y la Clasificación Decimal Universal.
  • En la actualidad, se habla de la Web Semántica, que implica el desarrollo de herramientas específicas que permiten pasar de la búsqueda por palabras clave a la búsqueda por conceptos.

Características de los SOCs

  • Los SOCs (Sistemas de Organización del Conocimiento) se utilizan en el momento de la indización de documentos y en la recuperación de información.
  • Utilizan los signos del lenguaje natural, pero el significado que se les da está controlado.
  • Son lenguajes más precisos que el lenguaje natural.

Tipología de los SOCs

  • Según la naturaleza de los términos: Lenguajes codificados y lenguajes naturales.
  • Según el control del vocabulario: Libres y controlados.
  • Según el momento de combinación de términos: Precoordinados y postcoordinados.
  • Según su estructura: Jerárquicos, asociativos y sintácticos.
  • Según su nivel de análisis: Indización por materias, indización por conceptos y indización por palabras clave.

Herramientas para la Organización del Conocimiento

  • Listas de palabras clave: Lista no estructurada de conceptos que han sido seleccionados de manera automática para describir el contenido de los documentos analizados.
  • Listas de descriptores libres: Listado de términos ordenados alfabéticamente escogidos por el analista.
  • Folksonomías: Lista no estructurada de conceptos que ha sido generada de manera colaborativa por una comunidad de usuarios para describir el contenido de los documentos de un sistema determinado.
  • Listas de autoridades: Lenguaje documental controlado que recoge ordenados alfabéticamente todos los registros de autoridades presentes en un catálogo o base de datos bibliográfica.### Taxonomías y esquemas de clasificación
  • Una taxonomía es una estructura formada por un conjunto de categorías y subcategorías que permiten ordenar entidades de acuerdo a una serie de características que tienen en común.
  • Las taxonomías se componen de términos taxonómicos que se organizan en una estructura en forma de árbol que puede tener varios niveles de profundidad.
  • Existen diferentes tipos de taxonomías, como plana, jerárquica, polijerárquica, en red y facetada.

Listas de encabezamientos de materia

  • Están diseñadas tomando como base búsquedas reales en archivos manuales e informatizados.
  • Un encabezamiento de materia trata de representar el o los temas de un documento con la ayuda de una serie de términos relacionados entre ellos.

Tesauros

  • Un tesauro es un vocabulario de un lenguaje de indización controlada, que desdobra los conceptos en las unidades simples.
  • Los términos de un tesauro se coordinan posteriormente para evitar ambigüedades y se establecen relaciones jerárquicas, asociativas y de equivalencia.
  • Los tesauros deben cumplir condiciones como ser un lenguaje especializado, normalizado, basado en la poscoordinación y servir para indizar y recuperar documentos.

Características de los tesauros

  • Tipos de tesauros: generales, especializados, monodisciplinares, multidisciplinares, macrotesauros y microtesauros.
  • Elementos de los tesauros: descriptores, no descriptores, términos genéricos, términos específicos, términos relacionados y notas.
  • Notación de tesauros usando SKOS: preferente, alternativo, relacionado, genérico y específico.

Proceso de construcción de tesauros

  • El proceso de construcción de tesauros implica la compilación de corpus y términos, testeo, evaluación y publicación.
  • Existen prácticas colaborativas para la construcción de tesauros, como el flujo de procesos colaborativos en la construcción de tesauros en la perspectiva del linked open data.### Instituciones y Decisiones
  • Instituciones de investigación: especialistas de dominio y profesionales de la información
  • Decisiones: admisión y supresión de términos, verificación de términos y normalización de términos compuestos y simples

Fuentes de Información

  • Diccionarios especializados y enciclopedias
  • Léxicos especializados, sistemas de clasificación y monografías y manuales
  • Índices de libros, consulta con especialistas y otros tesauros
  • Bases de datos y documentos sueltos

Selección de Términos

  • El número de términos seleccionados depende de la extensión, complejidad del tema y necesidades del sistema de información
  • Términos se agruparán en familias según temas principales y marginales
  • Términos simples y compuestos: trabajar con términos simples aumenta el volumen del tesauro y la ambigüedad

Normalización de Términos

  • Dividir términos compuestos en simples cuando sean necesario
  • Utilizar sustantivos o frases nominales, sin adjetivos, adverbios ni verbos
  • No utilizar artículos, excepto en nombres propios
  • Uso de mayúsculas y minúsculas según reglas ortográficas

Norma ISO 25964

  • Diseño, creación y difusión de tesauros regulada por la norma ISO 25964
  • La norma se compone de dos partes: tesauros para la recuperación de la información y interoperabilidad con otros vocabularios

Formas Gramaticales Permitidas

  • Utilizar sustantivos o frases nominales, como sustantivos adjetivados o sintagmas preposicionales
  • Preferir sustantivos adjetivados a sintagmas preposicionales

Uso de Mayúsculas y Minúsculas

  • Utilizar minúsculas para definir términos, salvo en nombres propios
  • Eliminar guiones en palabras compuestas

Singular y Plural

  • Utilizar singular para nombres no contables (conceptos, propiedades, disciplinas)
  • Utilizar plural para nombres contables (grupos de seres vivos, entidades y objetos)

Coexistencia de Términos en Singular y Plural

  • Utilizar ambos para términos con diferente significado o cuando se diferencia entre técnica y producto

Orden de los Términos

  • Respetar el orden gramatical de las expresiones
  • Invertir términos en entornos digitales, no en papel

Nombres Propios

  • Evitar utilización de nombres propios, salvo que el tesauro sea la única fuente de validación

Términos Homónimos

  • Utilizar paréntesis para aclarar el significado
  • Omitir paréntesis cuando el significado es obvio en el contexto del tesauro

Notas

  • Utilizar notas de alcance para ofrecer información sobre el uso de los términos en el contexto del tesauro
  • Utilizar notas de definición para aclarar significados ambiguos

Definición de Relaciones

Relaciones de Equivalencia

  • Sinónimos y cuasisinónimos
  • Preferir términos científicos, de más uso o actualizados

Relaciones Jerárquicas

  • Relación jerárquica genéro/especie
  • Relación jerárquica partitiva
  • Relación jerárquica enumerativa
  • Relación polijerárquica

Aprende sobre la recuperación de información en el ámbito de la documentación y las ciencias de la información. Descubre cómo se representan los documentos para recuperarlos de manera efectiva.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Document Focus and Purpose
8 questions
Document Analysis Quiz
4 questions

Document Analysis Quiz

PropitiousGuitar avatar
PropitiousGuitar
Breastfeeding Document Details
10 questions
Use Quizgecko on...
Browser
Browser