Grado en Información y Documentación: Introducción a la Recuperación de Información
22 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Cuál es la norma internacional que se utiliza para la construcción de tesauros?

ISO-UNE 25964.

¿Qué elementos forman parte de un tesauro según la ISO-UNE 25964? (Selecciona todo lo que corresponda)

  • Términos genéricos (correct)
  • Términos relacionados (correct)
  • No descriptores (correct)
  • Descriptores (correct)
  • Los términos genéricos en un tesauro son más concretos.

    False

    La norma ISO-UNE 25964 está relacionada con la creación de ______________ y su interoperabilidad con otros vocabularios.

    <p>tesauros</p> Signup and view all the answers

    ¿Qué implica la recuperación de información en el ámbito de la Documentación y las Ciencias de la Información?

    <p>Recuperar y acceder a la información de documentos.</p> Signup and view all the answers

    El análisis documental consiste en capturar elementos identificativos del documento, definir conceptos para describir el tema y permitir la agrupación temática de documentos.

    <p>True</p> Signup and view all the answers

    ¿Qué proceso se lleva a cabo para definir uno o varios conceptos que describan el tema sobre el que trata un documento en un sistema de información?

    <p>Indización</p> Signup and view all the answers

    La _______ permite la recuperación por elementos identificativos como el título, autor, editorial, año de publicación, entre otros.

    <p>catalogación</p> Signup and view all the answers

    Relaciona los siguientes tipos de búsqueda con su descripción correspondiente:

    <p>Catalogación = Permite la recuperación por elementos identificativos Indización = Permite la búsqueda por materias</p> Signup and view all the answers

    ¿Qué son sinónimos? (Selecciona todas las respuestas correctas)

    <p>Arañas // Arácnidos</p> Signup and view all the answers

    ¿Qué tipo de relación jerárquica vincula un elemento con sus partes?

    <p>Relación jerárquica partitiva</p> Signup and view all the answers

    ¿Es preferible usar el término científico o el de más uso en un tesauro?

    <p>True</p> Signup and view all the answers

    Relaciona los siguientes términos con sus descripciones:

    <p>Derecho (TG) = Derecho romano (TE) Vertebrados (TG) = Anfibios (TE) Propiedades termodinámicas = Entalpía // Entropía // Calor de absorción</p> Signup and view all the answers

    ¿Qué es una taxonomía?

    <p>Una estructura formada por un conjunto de categorías y subcategorías.</p> Signup and view all the answers

    El término 'taxonomía' tiene su origen en la clasificación realizada por Linneo en el siglo XVIII.

    <p>True</p> Signup and view all the answers

    ¿Qué son las meronomías?

    <p>Estructuras conceptuales jerárquicas en las que los elementos están vinculados por relaciones parte-todo.</p> Signup and view all the answers

    Un ________ es un vocabulario de un lenguaje de indización controlada que establece relaciones entre conceptos.

    <p>tesauro</p> Signup and view all the answers

    Relaciona los tipos de tesauros con su descripción:

    <p>Generales//Especializados = Nivel de especialización Monodisciplinares//Multidisciplinares = Cobertura temática Principales//Auxiliares o marginales = Relevancia del tema Macrotesauros//Microtesauros = Jerarquización de temas</p> Signup and view all the answers

    ¿Qué son los postcoordinados en la indización de contenidos?

    <p>Términos que se combinan en la fase de recuperación y no siguen ningún orden predeterminado.</p> Signup and view all the answers

    ¿Qué es un tesauro y cuál es su principal función en la indización de contenido?

    <p>Un tesauro es un lenguaje constituido por listas estructuradas de descriptores que posibilitan la descripción analítica del contenido de los documentos. Su principal función es garantizar la univocidad de los conceptos para facilitar la recuperación documental.</p> Signup and view all the answers

    Las folksonomías son listas estructuradas de conceptos que han sido seleccionados de manera automática para describir el contenido de los documentos analizados.

    <p>False</p> Signup and view all the answers

    ¿Qué es una lista de __________ _________?

    <p>listas de autoridades</p> Signup and view all the answers

    Study Notes

    Introducción a la Recuperación de Información

    • La recuperación de información es una tarea esencial en la Documentación y Ciencias de la Información.
    • Implica representar documentos para poder recuperarlos de manera efectiva.

    Análisis Documental

    • El análisis documental es el proceso de síntesis que permite acceder y recuperar documentos en un sistema de información.
    • Consta de varios procesos:
      • Catalogación descriptiva: Captura de elementos identificativos del documento (título, autor, editorial, año de publicación, número de páginas, etc.).
      • Indización: Definir uno o varios conceptos que describan el tema sobre el que trata el documento.
      • Clasificación: Agrupación temática de documentos para una mejor organización lógica y física.

    Problemas en la Indización y Recuperación de Información

    • La ambigüedad es un problema en la indización y recuperación de información debido a la homonimia, sinonimia y polisemia.
    • Los sistemas de información gestionan mal la ambigüedad y necesitan de herramientas que faciliten la indización y la recuperación de información.

    Lenguajes Documentales

    • Un lenguaje documental es un sistema artificial de signos normalizados que facilita la representación formalizada del contenido de los documentos.
    • Definiciones de lenguaje documental:
      • Son sistemas artificiales de signos normalizados que facilitan la representación formalizada del contenido de los documentos.
      • Listas restringidas de términos estructurados que permiten representar y organizar el conocimiento que se tiene de un área específica.
      • Listas de términos válidos para denominar los conceptos de una disciplina, base de datos, biblioteca, repositorio, etc.

    Historia de la Organización del Conocimiento

    • La organización del conocimiento se remonta a la antigüedad, con ejemplos como la Biblioteca de Asurbanipal y la Biblioteca Alejandrina.
    • En el siglo XIX, se desarrollaron clasificaciones como la de la Biblioteca del Congreso y la Clasificación Decimal Universal.
    • En la actualidad, se habla de la Web Semántica, que implica el desarrollo de herramientas específicas que permiten pasar de la búsqueda por palabras clave a la búsqueda por conceptos.

    Características de los SOCs

    • Los SOCs (Sistemas de Organización del Conocimiento) se utilizan en el momento de la indización de documentos y en la recuperación de información.
    • Utilizan los signos del lenguaje natural, pero el significado que se les da está controlado.
    • Son lenguajes más precisos que el lenguaje natural.

    Tipología de los SOCs

    • Según la naturaleza de los términos: Lenguajes codificados y lenguajes naturales.
    • Según el control del vocabulario: Libres y controlados.
    • Según el momento de combinación de términos: Precoordinados y postcoordinados.
    • Según su estructura: Jerárquicos, asociativos y sintácticos.
    • Según su nivel de análisis: Indización por materias, indización por conceptos y indización por palabras clave.

    Herramientas para la Organización del Conocimiento

    • Listas de palabras clave: Lista no estructurada de conceptos que han sido seleccionados de manera automática para describir el contenido de los documentos analizados.
    • Listas de descriptores libres: Listado de términos ordenados alfabéticamente escogidos por el analista.
    • Folksonomías: Lista no estructurada de conceptos que ha sido generada de manera colaborativa por una comunidad de usuarios para describir el contenido de los documentos de un sistema determinado.
    • Listas de autoridades: Lenguaje documental controlado que recoge ordenados alfabéticamente todos los registros de autoridades presentes en un catálogo o base de datos bibliográfica.### Taxonomías y esquemas de clasificación
    • Una taxonomía es una estructura formada por un conjunto de categorías y subcategorías que permiten ordenar entidades de acuerdo a una serie de características que tienen en común.
    • Las taxonomías se componen de términos taxonómicos que se organizan en una estructura en forma de árbol que puede tener varios niveles de profundidad.
    • Existen diferentes tipos de taxonomías, como plana, jerárquica, polijerárquica, en red y facetada.

    Listas de encabezamientos de materia

    • Están diseñadas tomando como base búsquedas reales en archivos manuales e informatizados.
    • Un encabezamiento de materia trata de representar el o los temas de un documento con la ayuda de una serie de términos relacionados entre ellos.

    Tesauros

    • Un tesauro es un vocabulario de un lenguaje de indización controlada, que desdobra los conceptos en las unidades simples.
    • Los términos de un tesauro se coordinan posteriormente para evitar ambigüedades y se establecen relaciones jerárquicas, asociativas y de equivalencia.
    • Los tesauros deben cumplir condiciones como ser un lenguaje especializado, normalizado, basado en la poscoordinación y servir para indizar y recuperar documentos.

    Características de los tesauros

    • Tipos de tesauros: generales, especializados, monodisciplinares, multidisciplinares, macrotesauros y microtesauros.
    • Elementos de los tesauros: descriptores, no descriptores, términos genéricos, términos específicos, términos relacionados y notas.
    • Notación de tesauros usando SKOS: preferente, alternativo, relacionado, genérico y específico.

    Proceso de construcción de tesauros

    • El proceso de construcción de tesauros implica la compilación de corpus y términos, testeo, evaluación y publicación.
    • Existen prácticas colaborativas para la construcción de tesauros, como el flujo de procesos colaborativos en la construcción de tesauros en la perspectiva del linked open data.### Instituciones y Decisiones
    • Instituciones de investigación: especialistas de dominio y profesionales de la información
    • Decisiones: admisión y supresión de términos, verificación de términos y normalización de términos compuestos y simples

    Fuentes de Información

    • Diccionarios especializados y enciclopedias
    • Léxicos especializados, sistemas de clasificación y monografías y manuales
    • Índices de libros, consulta con especialistas y otros tesauros
    • Bases de datos y documentos sueltos

    Selección de Términos

    • El número de términos seleccionados depende de la extensión, complejidad del tema y necesidades del sistema de información
    • Términos se agruparán en familias según temas principales y marginales
    • Términos simples y compuestos: trabajar con términos simples aumenta el volumen del tesauro y la ambigüedad

    Normalización de Términos

    • Dividir términos compuestos en simples cuando sean necesario
    • Utilizar sustantivos o frases nominales, sin adjetivos, adverbios ni verbos
    • No utilizar artículos, excepto en nombres propios
    • Uso de mayúsculas y minúsculas según reglas ortográficas

    Norma ISO 25964

    • Diseño, creación y difusión de tesauros regulada por la norma ISO 25964
    • La norma se compone de dos partes: tesauros para la recuperación de la información y interoperabilidad con otros vocabularios

    Formas Gramaticales Permitidas

    • Utilizar sustantivos o frases nominales, como sustantivos adjetivados o sintagmas preposicionales
    • Preferir sustantivos adjetivados a sintagmas preposicionales

    Uso de Mayúsculas y Minúsculas

    • Utilizar minúsculas para definir términos, salvo en nombres propios
    • Eliminar guiones en palabras compuestas

    Singular y Plural

    • Utilizar singular para nombres no contables (conceptos, propiedades, disciplinas)
    • Utilizar plural para nombres contables (grupos de seres vivos, entidades y objetos)

    Coexistencia de Términos en Singular y Plural

    • Utilizar ambos para términos con diferente significado o cuando se diferencia entre técnica y producto

    Orden de los Términos

    • Respetar el orden gramatical de las expresiones
    • Invertir términos en entornos digitales, no en papel

    Nombres Propios

    • Evitar utilización de nombres propios, salvo que el tesauro sea la única fuente de validación

    Términos Homónimos

    • Utilizar paréntesis para aclarar el significado
    • Omitir paréntesis cuando el significado es obvio en el contexto del tesauro

    Notas

    • Utilizar notas de alcance para ofrecer información sobre el uso de los términos en el contexto del tesauro
    • Utilizar notas de definición para aclarar significados ambiguos

    Definición de Relaciones

    Relaciones de Equivalencia

    • Sinónimos y cuasisinónimos
    • Preferir términos científicos, de más uso o actualizados

    Relaciones Jerárquicas

    • Relación jerárquica genéro/especie
    • Relación jerárquica partitiva
    • Relación jerárquica enumerativa
    • Relación polijerárquica

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Aprende sobre la recuperación de información en el ámbito de la documentación y las ciencias de la información. Descubre cómo se representan los documentos para recuperarlos de manera efectiva.

    More Like This

    Information Retrieval: Term-Document Matrix
    22 questions
    Information Retrieval Indexing Concepts
    40 questions
    Information Retrieval c5-c8
    43 questions

    Information Retrieval c5-c8

    SincereProtactinium9600 avatar
    SincereProtactinium9600
    Information Retrieval Systems Quiz
    44 questions
    Use Quizgecko on...
    Browser
    Browser