Resumen de la Colección Digital PDF
Document Details
Uploaded by ExhilaratingBallad1804
Tags
Related
- Sesión Teórica #08 POO con C# (II) PDF
- Archivo de Villa: Historia, Fondos y Servicios PDF
- Museo Nacional de Escultura: Historia, Colecciones y Casas Museo. PDF
- Colecciones Reales: Formacion y Evolucion PDF
- Temario 2. MUSEOS Y COLECCIONES CONSERVADORES (2023) PDF
- Ley 23/1982, Reguladora del Patrimonio Nacional PDF
Summary
Este documento proporciona un resumen de la colección digital, incluyendo definiciones de objetos digitales, colecciones digitales y bibliotecas digitales. También describe distintos tipos de colecciones digitales, y los principios para crearlas. Se centra en las bases de los sistemas de organización de archivos y datos digitales.
Full Transcript
1. LA COLECCIÓN DIGITAL 1.1.Definiciones Objeto digital (Kahn y Wilensky) = desde un punto de vista tecnológico, instancia de un tipo de datos abstracto que tiene dos componentes, los datos y los metadatos. Los metadatos incluyen un identificador único para el objeto digital. Objeto digital (Voutssá...
1. LA COLECCIÓN DIGITAL 1.1.Definiciones Objeto digital (Kahn y Wilensky) = desde un punto de vista tecnológico, instancia de un tipo de datos abstracto que tiene dos componentes, los datos y los metadatos. Los metadatos incluyen un identificador único para el objeto digital. Objeto digital (Voutssás) = cualquier entidad documental: texto, imagen, sonido, etc., que ha sido codificada numéricamente bajo algún formato y ensamblada junto con un conjunto de metadatos, de tal forma que puede ser almacenada, buscada, encontrada y usada. Colección digital = conjunto de objetos digitales organizados y accesibles en línea. Colección digital (NISO) = una colección digital consiste en objetos digitales seleccionados y organizados para facilitar su descubrimiento, acceso y uso. Los objetos, los metadatos y la interfaz de usuario crean conjuntamente la experiencia de usuario de una colección. Biblioteca digital (Baeza-Yates y Ribeiro-Neto) = desde una perspectiva tecnológica, combinación de una colección de objetos digitales; las descripciones de esos objetos (metadatos); un conjunto de usuarios (clientes o público o usuarios); y sistemas que ofrecen una serie de servicios como la captura, indexación, catalogación, búsqueda, navegación, recuperación, entrega, archivo y preservación. Biblioteca digital (García Melero) = institución que selecciona, adquiere, cataloga, y custodia documentos textuales, icónicos, gráficos o sonoros, creados digitalmente o convertidos a formato numérico y los pone a acceso público a través de las redes de telecomunicaciones. Biblioteca digital (Díez Carrera) = conjunto bien ordenado de objetos digitales, a los que se puede acceder a través de las redes, y cumplen con los siguientes requisitos: están codificados, descritos y almacenados. La codificación se hace conforme a los estándares que permiten el intercambio, la exploración y el procesamiento de la información y de los contenidos. La descripción consiste en el uso de metadatos que, además de estructurar los contenidos, los indizan, clasifican y describen, para hacer posible su localización y recuperación de un modo eficaz y selectivo. El almacenamiento o alojamiento se hace en repositorios, bases de datos o directorios, dotados de sistemas de gestión para la organización, recuperación y exploración de los contenidos informativos compilados. Repositorio digital (Abadal) = sitio web que recoge, preserva y difunde la producción académica de una institución (o de una disciplina científica), permitiendo el acceso a los objetos digitales que contiene y a sus metadatos. Repositorios institucionales = creados por una institución académica o de investigación para reunir, preservar y difundir la producción científica de los miembros de la institución. Repositorios temáticos = realizan la misma función, pero sus contenidos se refieren a un área de conocimiento determinada. Repositorios centralizados = recogen la producción científica en abierto de investigadores de distintas instituciones y temáticas (Zenodo, repositorio europeo creado con el apoyo de la Comisión Europea que acoge datos multidisciplinares de investigación de cualquier comunidad científica, investigador o institución de investigación). 1.2.TIPOS DE COLECCIONES DIGITALES Según el alcance geográfico: local; nacional; internacional. Según la naturaleza de la colección: contenidos digitalizados; contenidos digitales nativos; contenidos textuales; contenidos multimedia, etc. Según la entidad promotora de la colección: instituciones públicas o privadas (fundamentalmente instituciones patrimoniales como archivos, bibliotecas y museos); consorcios y plataformas cooperativas; editores y/o agregadores comerciales. Según los contenidos de la colección: fondos de instituciones del patrimonio cultural; colecciones institucionales; fondos especializados temáticamente o tipológicamente. Según la tipología documental que contiene: textos digitales (de origen digital o digitalizados en formato imagen o texto), imágenes digitales, audio digital, vídeo digital, gráficos en 3D, realidad virtual, realidad aumentada. 1.3.Principios de creación de colecciones digitales A framework of guidance for building good digital collections (NISO, 2007): 1.º Una buena colección digital se crea según una política explícita de política de desarrollo. 2.º Las colecciones deben describirse de manera que el usuario pueda descubrir las características de la colección, incluido el alcance, el formato, las restricciones de acceso, la propiedad y cualquier información importante para determinar la autenticidad, la integridad y la interpretación de la colección. 3.º Una buena colección está “curada”, es decir, sus recursos son gestionados activamente durante todo su ciclo de vida. 4.º Una buena colección está ampliamente disponible y evita impedimentos innecesarios para su uso. Las colecciones deben ser accesibles para las personas con discapacidad, y utilizarse eficazmente junto con las tecnologías de adaptación. 5.º Una buena colección respeta los derechos de propiedad intelectual. 6.º Una buena colección cuenta con mecanismos para suministrar datos de uso y otros datos que permitan registrar medidas estandarizadas de utilidad. 7.º Una buena colección es interoperable. 8.º Una buena colección se integra en el flujo de trabajo propio de los usuarios. 9.º Una buena colección es sostenible en el tiempo. Directrices para proyectos de digitalización de colecciones y fondos de dominio público (IFLA, ICA, UNESCO, 2014): Incrementar el acceso: esta es la razón principal y la más obvia, cuando se sabe que hay una alta demanda por parte de los usuarios y la biblioteca o el archivo desean mejorar el acceso a una determinada colección. Mejorar los servicios para un grupo creciente de usuarios proporcionando un acceso de mayor calidad a los recursos de la institución en relación con la educación y la formación continua. Reducir la manipulación y el uso de materiales originales frágiles o utilizados intensivamente y crear una “copia de seguridad” para el material deteriorado como libros o documentos quebradizos. Ofrecer a la institución oportunidades para el desarrollo de su infraestructura técnica y para la formación técnica de su personal. Impulsar el desarrollo de recursos cooperativos, compartiendo intereses comunes con otras instituciones para crear colecciones virtuales e incrementar el acceso a nivel internacional. Buscar intereses comunes con otras instituciones para rentabilizar las ventajas económicas de un enfoque compartido. Aprovechar las oportunidades financieras, como, por ejemplo, la posibilidad de asegurar una inversión para implementar un programa, o un proyecto concreto capaz de generar un beneficio significativo. 1.4.Origen y evolución de las colecciones digitales 1971, Proyecto Gutenberg: primera biblioteca electrónica que pretendía ofrecer una colección universal de libros en formato electrónico. 1988: Primera vez que se menciona el término “biblioteca digital” en un informe de la Corporation for National Research Initiatives (CNRI). 1988, Catálogo Colectivo del Patrimonio Bibliográfico: descripción de libros y otros fondos bibliográficos depositados en bibliotecas e instituciones españolas públicas o privadas que forman parte del Patrimonio Histórico Español. 1992: Informatización y digitalización del Archivo de Indias. 1994: Popularización del término gracias a la Digital Libraries Initiative de la NASA, la National Science Foundation y el Departamento de Defensa americano. Evolución asociada a la de la web. 1995: se plantea la creación de la Bibliotheca Universalis que tenía por objetivo dar acceso a las principales obras culturales y científicas del mundo a través de la red. A pesar de los esfuerzos realizados, el proyecto no dio resultados concretos. 1996, Internet Archives: su objetivo es construir una biblioteca digital de objetos digitales (libros, música, películas, software, etc.), aunque tiene la particularidad de capturar páginas web con el fin de asegurar su preservación. 2004, Google Print Library (Google Books): su objetivo era digitalizar los fondos de las principales bibliotecas universitarias estadounidenses. 2006, Live Search Books: Microsoft en colaboración con bibliotecas de alto renombre. Cancelado el programa de digitalización en 2008. 2006, Hispana: recolecta los repositorios institucionales de las universidades españolas y las bibliotecas digitales de las Comunidades Autónomas, que ofrecen acceso a conjuntos crecientes de todo tipo de materiales del patrimonio bibliográfico español. 2007, Biblioteca Digital Hispánica: biblioteca digital de la BNE. Proporciona acceso a miles de documentos digitalizados, entre los que se cuentan libros impresos entre los siglos XV y XX, manuscritos, dibujos, grabados, folletos, carteles, fotografías, mapas, atlas, partituras, prensa histórica y grabaciones sonoras. 2007, Portal de Archivos Españoles (PARES) 2007, RECOLECTA (Recolector de Ciencia Abierta): agrupa todas las infraestructuras digitales españolas en las que se publican y/o depositan resultados de investigación en acceso abierto. 2008, Europeana: plataforma de patrimonio cultural europeo, con un esquema propio de metadatos. 2008, HathiTrust: creado por las bibliotecas universitarias norteamericanas. Su finalidad es preservar y proporcionar acceso al contenido digitalizado de libros y revistas de las colecciones de las bibliotecas miembros. 2008, Biblioteca Virtual de Prensa Histórica: hemeroteca digital en la que se ofrece un extenso y creciente repertorio de prensa histórica y revistas culturales. 2008, Biblioteca Virtual del Patrimonio Bibliográfico: portal para el CCPB. 2009, Biblioteca Digital Mundial: promovida por la UNESCO con la idea de desarrollar una biblioteca digital que sirviera como puente entre las diferentes culturas. Finalizado en 2020. 2009, Archivo de la Web Española: recolecciones masivas de sitios web pertenecientes al dominio.es y complementa estas recolecciones con una selección de sitios web en cualquier dominio (.com,.net, etc.) importantes por su valor histórico, social o cultural. 2021, Estrategia Nacional de Digitalización 2022-2026 (CCB): reunir, preservar, difundir, devolver a la sociedad el valor del patrimonio bibliográfico y documental que conserva, de nuestra memoria. 1.5.Colecciones patrimoniales y humanidades digitales Humanidades digitales = investigación e instrucción sobre el uso de tecnologías de la información en la investigación y enseñanza de las Humanidades. Las colecciones patrimoniales de bibliotecas, archivos y museos constituyen una infraestructura prioritaria en la provisión de contenidos susceptibles de ser empleados y reutilizados en el ámbito de la docencia e investigación en HD. El esfuerzo de digitalización masiva de fondos en las últimas décadas y la facilidad de acceso a los mismos han contribuido al reconocimiento del papel de estas instituciones y deberían redundar en el empleo de los contenidos de bibliotecas y archivos en iniciativas de HD. Algunos proyectos de HD: Mnemosine, Biblioteca Digital de la Otra Edad de Plata = biblioteca digital desarrollada por investigadores de Filología de la Universidad Complutense que sirve para importar, mantener y editar la información de registros bibliográficos procedente de distintas bibliotecas y repositorios, permitiendo el desarrollo de colecciones de objetos digitales enriquecidos. Dialogyca, Biblioteca Digital de Diálogo Hispánico = creada por el grupo de Estudios de Prosa Hispánica Bajomedieval y Renacentista de la Universidad Complutense. BIDISO, Biblioteca Digital del Siglo de Oro = desarrollado por el Seminario interdisciplinar para el estudio de la Literatura áurea española de la Universidad da Coruña (SIELAE). 2. PATRIMONIO DIGITAL Y POLÍTICAS DE ACCESO ABIERTO 2.1.Patrimonio digital (UNESCO) Carta de la UNESCO (2003): Recursos únicos que son fruto del saber o la expresión de los seres humanos. Comprende recursos de carácter cultural, educativo, científico o administrativo e información técnica, jurídica, médica y de otras clases, que se generan directamente en formato digital o se convierten a éste a partir de material analógico ya existente. Los productos “de origen digital” no existen en otro formato que el electrónico. Los objetos digitales pueden ser textos, bases de datos, imágenes fijas o en movimiento, grabaciones sonoras, material gráfico, programas informáticos o páginas Web, entre otros muchos formatos posibles dentro de un vasto repertorio de diversidad creciente. A menudo son efímeros, y su conservación requiere un trabajo específico en este sentido en los procesos de producción, mantenimiento y gestión. Muchos de esos recursos revisten valor e importancia duraderos, y constituyen por ello un patrimonio digno de protección y conservación en beneficio de las generaciones actuales y futuras. Este legado en constante aumento puede existir en cualquier lengua, cualquier lugar del mundo y cualquier campo de la expresión o el saber humanos. Directrices para la preservación del patrimonio digital (2003): Cada vez más, nuestro patrimonio cultural, científico y de información reviste formas digitales y, también cada vez con más frecuencia, se produce únicamente en forma digital. Las tecnologías que utilizamos para crear y aprovechar el patrimonio digital poseen numerosas ventajas que explican que hayan sido adoptadas tan rápidamente en muchas partes del mundo. No obstante, existen graves problemas para mantener utilizable y disponible nuestro emergente, aunque ya floreciente, patrimonio digital. Los medios que empleamos para guardarlo y almacenarlo son inestables y la tecnología necesaria para tener acceso a él es superada rápida y constantemente por otras nuevas. Cuando las tecnologías caducan, con ellas se pierde también el acceso al patrimonio digital que permitían. Estos problemas no son únicamente de carácter técnico, sino que también tienen dimensiones sociales y de organización, ya que tenemos la responsabilidad de esforzarnos por conservar abiertos los medios de acceso durante largos periodos de tiempo, a menudo sin recursos suficientes y con estrategias inciertas. Desde 1996 las administraciones han estado llevando a cabo estrategias para garantizar el acceso permanente a la producción digital propia. Estas acciones están orientadas a asegurar, en la medida de las posibilidades tecnológicas, la adecuación del ciclo documental clásico a las páginas web: la compilación, el procesamiento, la preservación y el acceso permanente a la producción bibliográfica digital. PADICAT (Patrimonio Digital de Cataluña, 2006) = archivo web de Cataluña. Archivo de la Web Española (BNE, 2009) 2.2.Acceso abierto Acceso abierto (Open Access) = libre acceso a la literatura científica a través de Internet. Este movimiento surge por el deseo de la comunidad científica de acceder a los recursos digitales de la producción científica o académica de forma libre y gratuita. Budapest Open Access Initiative (2002) = tiene como objeto de eliminar las barreras de acceso a la literatura científica para promover la investigación, enriquecer la educación y compartir el aprendizaje entre los ciudadanos superando las barreras económicas. Define el acceso abierto a la literatura científica como la disponibilidad gratuita en Internet público, que permite a cualquier usuario leer, descargar, copiar, distribuir, imprimir, buscar o añadir un enlace al texto completo de estos artículos, rastrearlos para su indización, incorporarlos como datos en un software o utilizarlos para cualquier otro propósito que sea legal, sin barreras financieras, legales o técnicas, aparte de las que son inseparables del acceso mismo a Internet. La única limitación en cuanto a reproducción y distribución y el único papel del copyright (los derechos patrimoniales) en este ámbito, debería ser la de dar a los autores el control sobre la integridad de sus trabajos y el derecho de ser adecuadamente reconocidos y citados. Estrategias de acceso abierto: Ruta dorada: los autores publicarán sus investigaciones en revistas de acceso abierto, que en ningún momento restringirán el acceso a sus contenidos por motivos de copyright o económicos. Las publicaciones utilizarán los derechos de copyright y otras alternativas para garantizar el acceso permanente a los artículos. Ruta verde: el autoarchivo de sus artículos por parte de los propios autores en archivos electrónicos abiertos (comúnmente denominados repositorios). Utilizando el protocolo OAI-PMH se provee al usuario de una interfaz sencilla para acceder a la información disponible en cualquiera de esos archivos electrónicos. Declaración de Bethesda (2003) = una publicación en acceso abierto es aquella en la que el autor y el propietario de los derechos de propiedad intelectual de la obra otorgan al usuario derecho de reutilizar y transmitir dicha obra, así como otras derivadas, siempre que se reconozca la autoría. La obra tiene que estar depositada en versión completa en formato electrónico en al menos un repositorio dependiente de alguna institución académica, sociedad intelectual y organización de reconocido prestigio que persiga facilitar el acceso abierto, la distribución sin restricciones, la interoperabilidad y el archivado a largo plazo. Declaración de Berlín (2003) = promover Internet como el instrumento fundamental para diseminar el conocimiento científico. Suscribe la Declaración de Bethesda y apoya de manera definitiva el cambio a un nuevo modelo de comunicación científica, basado en una Web sustentable, interactiva y transparente. Tanto el contenido como las herramientas de software han de ser libres, accesibles y compatibles. Declaración de Berlín (2012) = se reafirmaron los fines, los compromisos y la definición de acceso abierto de la declaración inicial. Se estableció el objetivo de conseguir que en los siguientes 10 años el acceso abierto se convirtiera en el método por defecto para la comunicación científica en el mundo. Para lograrlo se redactaron una serie de recomendaciones referidas a infraestructuras, licencias, políticas y difusión (como crear repositorios de acceso abierto por parte de las instituciones de educación superior). Políticas de acceso abierto: UNESCO (2013) = consiste en que todas sus publicaciones digitales estarán disponibles para los millones de personas de todo el mundo bajo una licencia abierta. La nueva política permite descargar, traducir, adaptar, distribuir y compartir gratuitamente los datos y publicaciones de esta organización. Iniciativa OpenAIRE (2012) = infraestructura tecnológica y de servicios para apoyar, acelerar y medir la correcta implementación de las políticas europeas de acceso abierto a publicaciones científicas y datos de investigación. Cuenta con una red de National Open Access Desks (NOADs), agentes que actúan como puntos de referencia nacional para divulgar y difundir las políticas de acceso abierto de la Comisión Europea entre las instituciones y los investigadores, así como para facilitar la coordinación de las políticas nacionales con las europeas. FECYT = helpdesk o punto de referencia de OpenAIRE en España. Organiza e imparte talleres de formación, seminarios y conferencias, tanto de forma presencial como online, destinados a investigadores, personal de apoyo, bibliotecarios, gestores de repositorios, etc. Los temas abarcan desde conceptos básicos de acceso abierto, asesoramiento sobre desarrollo de políticas y gestión de repositorios, hasta la gestión de datos de investigación. 2.3.Ciencia abierta Ciencia abierta (Tennant) = conjunto de valores y principios fundamentales que permiten una mejor práctica científica, reduciendo el sesgo de publicación, aumentando la fiabilidad y la reproducibilidad, y haciendo que la investigación sea más sostenible y digna de confianza, lo que en última instancia ayuda a hacer que la ciencia funcione mejor para abordar los principales retos a los que se enfrenta la sociedad actual. Entre ellos figuran, por ejemplo, los valores de cara al ser humano, como la equidad y la libertad, con principios prácticos como el rigor y la transparencia en la investigación. Ciencia abierta (UNESCO) = constructo inclusivo que combina diversos movimientos y prácticas con el fin de que los conocimientos científicos multilingües estén abiertamente disponibles y sean accesibles para todos, así como reutilizables por todos, se incrementen las colaboraciones científicas y el intercambio de información en beneficio de la ciencia y la sociedad, y se abran los procesos de creación, evaluación y comunicación de los conocimientos científicos a los agentes sociales más allá de la comunidad científica tradicional. Recomendación de la UNESCO sobre Ciencia Abierta (2021) = marco internacional para la política y la práctica de la ciencia abierta que reconozca las diferencias disciplinarias y regionales en las perspectivas de la ciencia abierta. Pretende contribuir a reducir las brechas digitales, tecnológicas y del conocimiento que existen entre los países y dentro de los mismos. La ciencia financiada con fondos públicos debe ser abierta, o no será ciencia. Políticas de ciencia abierta: Plan S (Science Europe) Ley 14/2021 de la Ciencia, la Tecnología y la Innovación (establecimiento de repositorios institucionales de acceso abierto). Ley 17/2022 por la que se modifica la ley 14/2021 de la Ciencia, la Tecnología y la Innovación Ley Orgánica 2/2023 del Sistema Universitario (art.12, fomento de la Ciencia Abierta y Ciencia Ciudadana) Real Decreto 99/2011 por el que se regulan las enseñanzas oficiales de doctorado. Estrategia Española de Ciencia, Tecnología e Innovación (EECTI) 2021-2027 Estrategia Nacional de Ciencia Abierta (ENCA) 2023-2027 (6 dimensiones: resultados de investigación; datos, protocolos y metodologías; infraestructuras; revisión por pares; ciencia ciudadana; y evaluación de la investigación) V Plan Estratégico REBIUN 2024-2027: La biblioteca como agente estratégico para el impulso de la ciencia abierta. ROARMAP = registro de repositorios con políticas de acceso abierto. SHERPA-ROMEO = recurso en línea que agrega y presenta políticas de acceso abierto para editoriales y revistas de todo el mundo. 2.4.Repositorios Repositorio (Abadal) = sitio web que recoge, preserva y difunde la producción académica de una institución (o de una disciplina científica), permitiendo el acceso a los objetos digitales que contiene y a sus metadatos. Los contenidos básicos son las publicaciones que se derivan de la investigación (artículos de revista, informes de investigación, congresos, tesis doctorales, etc.), aunque en muchos de ellos se puede encontrar información académica en un sentido amplio (material docente, actividad institucional, etc.). Repositorio institucional (Ferreras Fernández) = conjunto de servicios prestados por las universidades y organismos de investigación a toda la comunidad para recopilar, administrar, difundir y preservar la producción digital de cualquier tipo generada en la institución, a través de la creación de una colección digital organizada, abierta e interoperable a través del protocolo OAI-PMH con el fin de garantizar un aumento de la visibilidad e impacto de la misma. Objetivos de los repositorios: Favorecer la difusión de los contenidos académicos de la institución o de la temática a la que sirven. Dar visibilidad a la investigación realizada por la institución y sus miembros. Facilitar la conservación y preservación de los documentos generados por una institución. Formas de incorporar contenido a un repositorio: Autoarchivo = el propio autor realiza el depósito de sus trabajos y, posteriormente, los gestores del repositorio revisan los metadatos. Depósito delegado = los autores autorizan a los gestores del repositorio a realizar el archivo de su producción. Carga masiva = recolección de contenidos procedentes de revistas y otros repositorios. Primeros repositorios = arXiv.org (1991). En España, TDX (Texis Doctorals en Xarxa, 2001). Tipologías de repositorios: Institucionales = Contienen la producción de los miembros de una institución, ya sea una universidad o un centro de investigación. Tienen carácter multidisciplinar. A veces se centran exclusivamente en contenidos científicos (artículos de revista, tesis, congresos, etc.) pero existen también ejemplos de inclusión de material docente, documentación administrativa, colecciones patrimoniales, etc. Temáticos = Sus contenidos están especializados en un ámbito científico concreto. Los creadores pueden ser instituciones académicas, organismos públicos u organismos sin ánimo de lucro. Fueron los primeros en crearse. Se trata de una tipología que tuvo mucha importancia en los orígenes del movimiento pero que ha ido a menos ante el empuje de los repositorios institucionales. (arXiv.org, física; PubMed Central, ciencias biomédicas; CogPrints, psicología; RePEc, economía; e-LIS, información y documentación) Centralizados = recogen la producción científica en abierto de investigadores de distintas instituciones y temáticas. Contenido de los repositorios: Datos de investigación (datasets) = principios FAIR (findable, accesible, interoperable, usable) aplicado a los datos de investigación. Recursos docentes Libros Artículos de revistas Tesis y TFG Conferencias Portales de datos abiertos Servicios de recolección de metadatos = sistemas externos que están interesados en obtener los metadatos de los repositorios que cumplen con el protocolo OAI-PMH para integrarlos en un servicio de consulta más amplio. Solo necesitan mantener el índice común creado mediante su actividad de recolección, ya que los registros y los documentos permanecen en las colecciones originales. Actualizan de forma periódica y amplía su base de datos de forma continua. Pueden tener alcance internacional o estatal, estar especializados temáticamente o por tipo de documento (tesis, material docente, etc.). Ejemplos: OAIster (OCLC), Recolecta (FECYT), Hispana, Europeana, BASE. 2.5.Los portales de datos abiertos Datos abiertos (OKFN) = aquellos que pueden ser libremente utilizados, reutilizados y redistribuidos por cualquier persona, estando sujetos, como mucho, a los requisitos de atribución y de compartirlos de la misma manera en que aparecen. Se caracterizan por tres aspectos: Disponibilidad y acceso: la información modificable, y a un costo razonable de reproducción, preferiblemente descargándola de internet. Reutilización y redistribución: los datos deben ser legibles por máquina y proporcionados bajo términos que permitan reutilizarlos, redistribuirlos e incluso integrarlos con otros conjuntos de datos. Participación universal: todas las personas deben poder utilizar, reutilizar y redistribuir la información, sin discriminación. No están permitidas las restricciones que impiden el uso comercial de los datos, o restricciones de uso para ciertos propósitos (por ejemplo, sólo para educación). Tipos de datos abiertos = culturales, científicos, de finanzas, estadísticos, meteorológicos, medioambientales y de transporte. Datos abiertos gubernamentales = aquellos elaborados por las administraciones públicas en un principio para su propio consumo, pero que se ponen a disposición de la ciudadanía en general y del sector infomediario, en particular, en un formato abierto y por lo tanto reutilizable. Movimiento de gobierno abierto = modelo de gobierno basado en la transparencia, la participación y la colaboración. Carta Internacional de datos abiertos (2015) = basada en 6 principios: Abiertos por defecto. Puntuales y completos, además de publicarse rápidamente deben publicarse como un todo en su forma original. Accesibles y utilizables: con facilidad de acceso y bajo licencia libre, los formatos deben tener en cuenta tanto su legibilidad por parte de las máquinas como la experiencia de los usuarios. Comparables e interoperables: uso de estándares que posibiliten la comunicación entre grupos de datos y su interoperabilidad. Para mejorar la gobernanza y la participación ciudadana: fomento de la transparencia para que los ciudadanos sepan qué hacen los gobernantes, mejoren los servicios públicos y se mantenga la rendición de cuentas. Para el desarrollo inclusivo y la innovación: los datos abiertos posibilitan el desarrollo de negocios basados en su explotación. Políticas de datos abiertos: Directiva 2003/98/CE relativa a la reutilización de la información en el sector público. Directiva 2019/1024 relativa a datos abiertos y reutilización de la información del sector público. Ley 37/2007 de Reutilización de Información en el Sector Público (modificada por Ley 18/2015 y RD 1495/2011) Iniciativa Aporta (2009) Ley 19/2013 de transparencia, acceso a la información pública y buen gobierno. Norma Técnica de Interoperabilidad de Reutilización de recursos de la información. Sistema de 5 estrellas de reutilización de los datos (Berners-Lee, 2010): Una estrella: este nivel se alcanza con la mera publicación de los datos, independientemente de su formato. Aquí nos encontraríamos con datos abiertos no estructurados (documentos en formato pdf, imágenes, vídeos, etc.), difíciles de manipular y de reutilizar por aquellos usuarios que así lo deseen. Dos estrellas: en este nivel los datos cuentan con un formato estructurado, para lo cual se ha utilizado un software propietario. Sería el caso de las hojas de cálculo Excel. Tres estrellas: en este caso los datos abiertos estructurados no utilizan un software propietario, sino un software libre, como OpenOffice, o CSV. Cuatro estrellas: este nivel supone la existencia de datos estructurados adecuadamente con URIs que identifican los recursos. Para ello utilizan el estándar RDF, recomendado por la W3C, que facilita la interoperabilidad. Cinco estrellas: es el nivel de mayor madurez, donde los datos, además de cumplir todos los requisitos anteriores, están enlazados con otros datos similares publicados por otras organizaciones. Esto dota de contexto y optimiza las búsquedas, facilitando la reutilización. 3. ESTÁNDARES E INTEROPERABILIDAD 3.1.IDENTIFICADOR PERSISTENTE DE LOS OBJETOS DIGITALES Identificador persistente = mecanismo capaz de proporcionar un medio de conexión entre el identificador de un objeto digital (permanente) y la ubicación del mismo (que puede cambiar). URL (Uniform Resource Locator) = sistema de Berners-Lee para establecer hiperenlaces en la web. Es el sistema más común de localización de documentos en la web. Combina el nombre del ordenador que proporciona la información, el directorio donde se encuentra, el nombre del archivo y el protocolo que se debe de utilizar para recuperar la información contenida. URN (Uniforma Resource Name) = identificador paralelo a la URL, creado por IETF (1997), pretende conseguir una forma universal de identificar los recursos, para que cada uno sea único y constante. Interoperable con los sistemas de identificación estándar ISBN o ISSN. URI (Uniform Resource Identifier) = integra el modelo de URL y URN, creado por IETF (1998). Utiliza una cadena corta de caracteres que identifica inequívocamente un recurso (servicio, página, documento, dirección de correo electrónico, enciclopedia, etc.). PURL (Persistent Uniform Resource Locator) = desarrollado por OCLC (1995). Es una URL que no describe directamente la ubicación del recurso, sino una ubicación intermedia que redirecciona al recurso final. Se utiliza para referenciar recursos que cambian de dirección a lo largo del tiempo con una única dirección. La dirección se relaciona con una base de datos en la que se indica la dirección final (fácilmente modificable a lo largo del tiempo). Sistema Handle = desarrollado por CNRI. Servicio universal para asignar, administrar y resolver identificadores persistentes de aplicación a objetos digitales y otros recursos de Internet. Uenta con dos partes: prefijo (identifica el productor) y sufijo (identifica el objeto). Requiere instalar un software específico en el servidor y el pago de una tarifa anual. Uso extendido en repositorios institucionales. DOI (Digital Object Identifier) = proporciona la identificación de los objetos digitales y un marco para la gestión del contenido intelectual, la gestión de los metadatos y la vinculación entre los clientes y los proveedores en un espacio global para el comercio electrónico. Uso extendido entre editores de libros y revistas electrónicas. Muy estandarizado (NISO, ISO). Se estructura en dos partes: prefijo (productor) y sufijo (objeto digital). Tarifa por prefijo. ARK (Archival Resource Key) = identificador persistente multipropósito para objetos de información de cualquier tipo. Flexible, abierto, descentralizado y sin costes. Requiere cumplimentar un formulario de solicitud NAAN (Name Assigning Authority Number). Estructura: https://dirección-servidor/ark/NAAN-productor/NAAN-objeto/calificador- opcional(versión,lenguaje,formato...). 3.2.INTERCONEXIÓN E INTEGRACIÓN DE LOS OBJETOS DIGITALES CrossRef = creado por Publisher International Linking Association (2000). Relaciona artículos de revistas y sus citas mediante el sistema DOI de indexación e identificación. OpenURL (Link resolver) = creado en la Universidad de Gante (1998-2000) y comprado por Ex Libris (ProQuest-Clarivate). Servicio en red por el que se transportan paquetes de información de la propia URL. Cada dirección describe el recurso, el contexto de la red en la que se encuentra y el contexto desde el que se solicita. Este sistema permite resolver el problema del acceso al documento para un usuario determinado y ofrecerle servicios adicionales. Ejemplos: EBSCO Full Text Finder, Ovid LinkSolver, SFX link resolver. 3.3.INTEROPERABILIDAD Y ESTÁNDARES DE METADATOS Interoperabilidad (IEEE) = capacidad de dos o más sistemas o componentes para intercambiar información y utilizar la información intercambiada. Supone asegurar que los sistemas, procedimientos y cultura de una organización se administren de manera que maximicen las oportunidades para el intercambio y la reutilización de la información. Interoperabilidad (Esquema Nacional de Interoperabilidad, RD 4/2010) = capacidad de los sistemas de información y de los procedimientos a los que éstos dan soporte, de compartir datos y posibilitar el intercambio de información y conocimiento entre ellos. Resulta necesaria para la cooperación, el desarrollo, la integración y la prestación de servicios conjuntos por las Administraciones públicas; para la ejecución de las diversas políticas públicas; para la realización de diferentes principios y derechos; para la transferencia de tecnología y la reutilización de aplicaciones en beneficio de una mejor eficiencia; para la cooperación entre diferentes aplicaciones que habiliten nuevos servicios; todo ello facilitando el desarrollo de la administración electrónica y de la sociedad de la información. Metadatos (UNE-ISO 15489-1)= Datos que describen el contexto, contenido y estructura de los documentos, así como su gestión a lo largo del tiempo. Metadatos (UNE-ISO 23081-1) = Información estructurada o semiestructurada que posibilita la creación, registro, clasificación, acceso, conservación y disposición de los documentos a lo largo del tiempo y dentro de un mismo dominio o entre dominios diferentes. Cada uno de estos dominios, representa un área del discurso intelectual y de la actividad social o de la organización desarrollado por un grupo propio o limitado de individuos que comparten ciertos valores y conocimiento. Los metadatos para la gestión de documentos pueden usarse para identificar, autenticar y contextualizar tanto los documentos como los agentes, procesos y sistemas que los crean, gestionan, mantienen y utilizan, así como las políticas que los rigen. Razones para el uso de metadatos: Proteger los documentos como prueba y asegurar su accesibilidad y disponibilidad a lo largo del tiempo. Facilitar la comprensión de los documentos. Servir de base y garantizar el valor probatorio de los documentos Contribuir a garantizar la autenticidad, fiabilidad e integridad de los documentos. Respaldar la gestión del acceso, la privacidad y los derechos de propiedad intelectual. Servir de base para una recuperación eficiente. Respaldar las estrategias de interoperabilidad, permitiendo que se incorporen oficialmente al sistema documentos creados en diversos entornos administrativos y técnicos y que se mantengan durante tanto tiempo como sea necesario. Proporcionar vínculos lógicos entre los documentos y su contexto de creación, manteniéndolos de forma estructurada, fiable e inteligible. Facilitar la identificación del entorno tecnológico en que los documentos digitales fueron creados o se incorporaron al sistema y la gestión del entorno tecnológico en el que se han mantenido, de modo que puedan ser reproducidos como documentos auténticos cuando se necesiten. Facilitar la migración eficiente y exitosa de documentos electrónicos de un entorno o plataforma informáticos a otro, o cualquier otra posible estrategia de conservación. Tipologías de metadatos: Metadatos descriptivos, orientados a la identificación y recuperación de información, describen las características del recurso, su temática y contenido. Metadatos administrativos, dirigidos a la gestión: facilitan el tratamiento y el procesamiento del recurso. Por ejemplo, información sobre su fecha de creación, restricciones en el acceso, derechos sobre el mismo, fecha de modificación y motivo de los cambios, datos para la localización del recurso en un depósito, etc. Metadatos para la preservación: tienen como finalidad facilitar el uso del recurso en el futuro, especificando los requisitos técnicos para su acceso y lectura, las operaciones realizadas para asegurar su conservación, etc. Metadatos estructurales: permiten identificar las distintas partes o componentes que configuran un recurso de información, la estructura lógica de la información y los distintos archivos que conforman el recurso. 3.4.MODELOS DE METADATOS DCMI (Dublin Core Metadata Initiative) (OCLC, 1995) = se basa en un conjunto de 15 elementos (opcinales y repetibles): title, creator, subject, description, Publisher, contributor, date, type, format, identifier, source, language, relation, coverage, rights. Se pueden aplicar calificadores para matizar o acotar el contenido de los elementos. También se pueden aplicar esquemas de codificación de vocabulario o sintáctica (para indicar que el término procede de un vocabulario normalizado o se ha codificado de acuerdo con una notación sintáctica formal, respectivamente). Características de Dublin Core: generalidad, independencia de los sistemas de codificación, extensibilidad, economía. MODS (Metadata Object Description Standard) = más orientado a bibliotecas que el modelo Dublin Core, orientado al usuario de MARCXML y más sencillo que MARC estándar. Contiene 20 elementos basados en MARC21. MADS (Metadata Authority Description Standard) = esquema XML para codificar información relativa al control de autoridades que da respaldo a MODS. METS (Metadata Encoding & Transmision Standard) = esquema XML que empaqueta todos los metadatos asociados a un recurso digital. Permite codificar y representar la estructura de los documentos digitales complejos. Es una norma convergente e integradora, orientada a describir, transmitir y gestionar recursos digitales, especialmente en bibliotecas digitales. Partes de un registro o paquete METS: cabecera (metadatos del documento METS), metadatos descriptivos (DC, MARC, EAD…), metadatos administrativos (MIX, PREMIS), sección archivo (ficheros que componen el objeto), mapa estructural (diseño jerárquico del documento), enlaces estructurales, comportamientos (aplicaciones empleadas para visualizar el documento). EDM (Europeana Data Model) = es un Dublin Core ampliado creado para el proyecto Europeana. Se basa en los principios fundamentales y buenas prácticas de la web semántica y Linked Open Data. 3.5.METADATOS DE PRESERVACIÓN DIGITAL Preservación digital = conjunto de actividades que están destinadas a que el objeto digital perdure el mayor tiempo posible, tanto del formato del mismo, como, y sobre todo, de su contenido informativo. Preservación física: relativa al soporte físico (cintas y discos magnéticos, discos ópticos, etc.). La rápida evolución tecnológica y, con ello, la obsolescencia de los soportes, obliga a la migración de los datos a soportes más actuales y con mayor capacidad de almacenamiento. Preservación lógica: relativa a los ficheros propiamente dichos, creados en unos formatos y normas determinadas. Sin embargo, en cuanto a los ficheros, no existe un consenso global para determinar la alternativa más conveniente de migración y emulación. La tendencia es hacia formatos abiertos y estandarizados. Preservación intelectual: relativa a los mecanismos que garanticen tanto la integridad y autenticidad de la información contenida en estos documentos, como los derechos de autor y uso de los mismos. Metadatos de preservación = la información que un repositorio utiliza para llevar a cabo el proceso de preservación digital. 3.6.MODELOS DE METADATOS PARA LA PRESERVACIÓN DIGITAL OAIS (Open Archival Information System) = establece un modelo de referencia (modelo teórico) para aquellos archivos o sistemas de información que cuentan con colecciones digitales y que precisan de una política de preservación a largo plazo. Establece un marco teórico en el que van a intervenir 6 entidades: Ingreso o admisión (ingest): proceso para la recepción de los objetos digitales procedentes de los productores. Almacenamiento (archival storage): se refiere a la preservación de los objetos digitales en un archivo. Gestión de datos (data management): se encarga de la gestión y mantenimiento de los metadatos descriptivos. Planificación de la preservación (preservation planning): hace un seguimiento del entorno exterior del archivo para identificar la influencia de las nuevas tecnologías. Acceso (access): servicios que usarán los usuarios para consultar los materiales, solicitarlos y obtener copias. Gestión (administration): gestión diaria del archivo. En este modelo la información existe como objeto físico y como objeto digital, integrándose bajo el nombre de objeto de datos (Data object) y, en conjunto con sus metadatos, Information Package (IP). Se distinguen tres modelos de IP: el que envían los proveedores de información al archivo (SIP, Submission Infomation Package), el que utiliza el archivo para el almacenamiento y preservación (AIP, Archival Information Package) y el que se usa para distribuirlos al usuario final (DIP, Dissemination Information Package). Un paquete OAIS consta de la información del contenido, descriptiva para la preservación, de empaquetado y descriptiva. A su vez, los metadatos de preservación se subdividen en cuatro categorías: información de referencia (identificadores), de contexto (creación), de procedencia (origen) y de autenticidad (firma digital). PREMIS (Preservation Metadata: Implementation Strategies) = esquema XML surgido a partir del modelo OAIS. Define cinco tipos de entidades: entidad intelectual, objeto (archivos electrónicos), eventos (actividades de preservación), agentes, derechos. Se combina con otros metadatos (DC; MODS…). En la mayoría de los casos se utiliza METS como contenedor XML de todos los metadatos. 3.7.PROTOCOLOS PARA LA RECOLECCIÓN DE METADATOS OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) = herramienta de interoperabilidad independiente de la aplicación que permite realizar el intercambio de información para que desde las herramientas que lo requieran (proveedores de servicio), se puedan hacer búsquedas que abarquen la información recopilada en distintos repositorios asociados (proveedores de datos). Es, por tanto, un protocolo para la definición e intercambio de metadatos. Permite que los metadatos de un repositorio puedan ser recolectados por un sistema externo (otro repositorio o un recolector). Actualmente la mayoría de los repositorios cumple con este protocolo ya que es la forma de asegurarse una total apertura y la integración en servicios externos. Soporta varios modelos de metadatos, pero utiliza como base Dublin Core simple (no calificado) con el esquema XML (oai_dc). En el protocolo OAI-PMH, hay un servidor que actúa como proveedor de datos, y otro que actúa como recolector o harvester. El recolector se encargará de pedir regularmente al proveedor de datos los nuevos registros que se hayan añadido. El proveedor de datos se los facilitará en formato XML, lo que permite al recolector procesarlos e incorporarlos a una base de datos donde se agregan metadatos de distintos proveedores de datos. OAI-ORE (Open Archives Inititative Object Reuse and Exchange) = normas para la descripción y el intercambio de agregaciones de recursos web. Estas agregaciones, a veces denominadas objetos digitales compuestos, pueden combinar recursos distribuidos en múltiples tipos de medios: texto, imágenes, datos o vídeo. SWORD (Simple Web-service Offering Repository Deposit) = estándar de interoperabilidad ligero (lightweight) utilizado por los repositorios digitales para recibir depósitos de contenido desde múltiples fuentes. Esto permite enviar documentos para ser preservados y difundidos por los repositorios digitales desde herramientas externas al repositorio. 3.8.TECNOLOGÍAS SEMÁNTICAS La comunidad dedicada al patrimonio cultural se ha esforzado en los últimos años en redefinir los modelos de datos tradicionales dentro de modelos basados en la tecnología de datos semánticos. Bibliotecas, archivos, museos y galerías abordan desde hace años proyectos dirigidos a la publicación de datos, metadatos y vocabularios aplicando el modelo de “Datos abiertos enlazados”, una concreción específica del concepto de web semántica en la que se apuesta por la representación de información en RDF (Resource Description Framework), el empleo de URIs (Identificadores Uniformes de Recursos) y el uso del lenguaje de búsqueda en datos RDF, SPARQL. Los modelos de metadatos han avanzado progresivamente hacia ontologías, tal vez no completamente desarrolladas como se entiende en el estándar OWL (Web Ontology Language), pero con especificaciones expresadas en RDF para su uso como datos enlazados, como DCMI MEtadata Terms o MODS Ontology. La web semántica pone a disposición de bibliotecas, archivos y museos un modelo de datos para la representación de información en la web, Resource Description Framework (RDF), y unas tecnologías que, en conjunto, permiten dotar de significado a los datos y a las transacciones de datos en la web. Todos estos componentes han sido estandarizados en forma de normas, especificaciones, recomendaciones, etc., por el W3C. Para la publicación de datos RDF resultan fundamentales dos iniciativas complementarias: Datos abiertos (Open Data) y Datos enlazados (Linked Data). La implementación de Linked Open Data en bibliotecas como Europeana, va a permitir un enriquecimiento en todos sus niveles, tanto de los datos, modelos de descripción y procesos de búsqueda. Así, esta gran biblioteca digital se está convirtiendo en abanderada de la implementación tecnológica de datos abiertos enlazados. 4. SOFTWARE PARA LA GESTIÓN DE COLECCIONES DIGITALES 4.1.CARACTERÍSTICAS Y FUNCIONALIDADES Para seleccionar un sistema de gestión hay que tener en cuenta los costes de implementación y mantenimiento, la posibilidad de integración en el entorno tecnológico de la institución y la flexibilidad para futuros cambios. Características y funcionalidades básicas del software: Modelo de objeto: la estructura interna del objeto digital (entidad que integra metadatos y los contenidos digitales) en el sistema de la colección digital. Existencia de identificadores únicos tanto para el objeto digital como para cada parte del mismo, para asegurar la preservación y el acceso fácil y rápido a los recursos. Colecciones y soporte a las relaciones: recopilación de metadatos para la descripción de los recursos, definición de subcolecciones y modelos que describen el formato de los objetos digitales o la presentación de la colección. Definición de las relaciones entre los objetos del mismo tipo y de otras colecciones. Metadatos y almacenamiento del contenido digital: establecimiento de la capacidad de almacenamiento, junto con las indicaciones de conservación. Resulta fundamental para el sistema la definición normalizada del conjunto de metadatos para la descripción de los distintos formatos existentes del contenido digital. Búsqueda y navegación: mecanismos utilizados para la indexación y la búsqueda de los metadatos y de los contenidos señalados por estos. Gestión de objetos: Los métodos y las interfaces de usuario proporcionadas por el sistema para manipular (insertar, actualizar y eliminar) los metadatos y el contenido digital. Interfaces de usuario: proporcionar interfaces de usuario adecuadas para el acceso del usuario final al sistema, sus colecciones y a los objetos digitales. Control de acceso: control de usuarios y grupos, métodos de autentificación y autorización. Nivel de restricción de acceso y de actualización a diversos niveles (sistema, colección, objetos digitales y el contenido propiamente dicho). Soporte multilingüe: la interfaz de usuario debe soportar varios idiomas (normalmente dos, el nativo e inglés), así como en los campos de metadatos y del contenido digital. La codificación de caracteres es de gran importancia para que estos sistemas sean plenamente multilingües. Interoperabilidad: adscripción a los estándares más importantes en este campo con el fin de garantizar la interoperabilidad con otros sistemas. Exportación de los objetos digitales en formatos abiertos normalizados. Personalización: personalización del sistema a diversos niveles, tanto de la colección, el formato de los objetos digitales y los servicios prestados. La calidad y los métodos proporcionados por las interfaces de programación de aplicaciones (API) del sistema. 4.2.SOFTWARE LIBRE/ABIERTO PARA LA GESTIÓN DE COLECCIONES DIGITALES EPrints = paquete de software gratuito de código abierto bajo licencia GNU, desarrollado por la Universidad de Southampton para la construcción de repositorios digitales con protocolo OAI-PMH. Permite almacenar contenido de cualquier tipo y en cualquier formato digital en una base de datos accesible a través de la web. Dispone de varios modelos de metadatos y de una plataforma específica para gestión de datos de investigación. DSpace = herramienta para la creación de repositorios digitales, creada por el MIT en colaboración con HP. Sus contenidos se organizan en comunidades y subcomunidades, en las que se incluyen los ítems que pueden estar formados por el objeto, sus metadatos y los ficheros asociados (admite gran variedad de tipos documentales). Fedora (Flexible Extensible Object Repository Architecture) = software de arquitectura modular basado en los principios de interoperabilidad y escalabilidad. Creado por la Universidad de Cornell y la Biblioteca de la Universidad de Virginia (financiado por DARPA y NSF) en 1999. Desde la versión 4 incluye el modelo Linked Data Plataform de W3C (RDF, web semántica). Invenio (antes, CDSware) = software desarrollado por el CERN (2002). Inicialmente era un repositorio digital y un sistema integrado de gestión bibliotecaria integrado basado en MARC21. En 2015 se rehízo para dar soporte a la gestión de datos de investigación a gran escala y abandono MARC21 por JSON , que admite múltiples formatos de metadatos diferentes. InvenioRDM es la aplicación de Invenio para la gestión de repositorios de datos de investigación. Dataverse = desarrollada por la Universidad de Harvard (2007) para la gestión y almacenamiento de datos de investigación. Soporta OAI-PMH y los esquemas de metadatos comunes y cumple los estándares de datos FAIR. Se integra con DataCite para permitir asignar DOI a los conjuntos de datos y cuenta con APIs ara integraciones personalizadas. Greenstone = producido por la Biblioteca Digital de Nueva Zelanda (en colaboración con la UNESCO y la ONG Human Info). Permite crear y distribuir colecciones digitales proporcionando acceso tanto a documentos textuales como a imágenes, vídeos y sonidos en múltiples formatos. Omeka = desarrollada por la Universidad George Mason. Está muy extendida por sus funcionalidades, su orientación al diseño, su fácil instalación y configuración y el respeto a los estándares W3C. Es una aplicación con funcionalidades de CMS. Principales características: pensada en el usuario final, sistemas de exposición personalizables, temas personalizables, uso de estándares de metadatos, sindicación de contenidos con RSS y Atom, herramientas de migración de datos (CSV, OAI-PMH), funcionalidades de la web 2.0 (etiquetas, recomendaciones, conexión con redes sociales…) Omeka Classic = orientado a proyectos individuales y sector educativo. Utiliza metadatos DC y puede ampliar sus funcionalidades con plugins. Omeka S = orientado a instituciones. Además de DC puede implementar otros vocabularios y ontologías, así como utilizar datos abiertos enlazados. Islandora = combinación de Fedora y el sistema de gestión de contenidos Drupal. Permite gestionar colecciones de forma colaborativa con los usuarios. Fedora se usa para el almacenamiento y control de los objetos digitales y Drupal para el desarrollo de la interfaz web. CollectiveAccess (antes, OpenCollection) = está diseñado para gestionar y publicar en web colecciones grandes y heterogéneas de bibliotecas, archivos y museos, con soporte de diferentes estándares de metadatos y vocabularios controlados. Soporta muchos formatos de archivo y de opciones de visualización. Se basa en Providence (plataforma de catalogación) y Pawtucket (interfaz de consulta y publicación). 4.3.SOFTWARE COMERCIAL PARA LA GESTIÓN DE COLECCIONES DIGITALES Rosetta = producto de exLibris, diseñado con la BN de Nueva Zelanda. Solución completa de gestión y preservación de activos digitales dirigida a recopilar, archivar y preservar los materiales digitalizados y nacidos digitales, garantizando la integridad de los datos y el acceso a lo largo del tiempo. Desarrollada de acuerdo con estándares como OAIS, PREMIS y METS. Permite la integración en Alma y Primo. CONTENTdm = creado por OCLC, se integra con otros de sus productos y servicios (conectada con WorldCat). Proporciona herramientas para todos los aspectos relacionados con la administración de colecciones digitales. Admite extensiones y totalmente personalizable. DIGIBIB = pertenece a la compañía española DIGIBIS (integrada con Baratz en Total Specific Solutions, TSS). Permite la gestión de la colección física y digital de forma completamente integrada. Se basa en la gestión de metadatos normalizados de registros bibliográficos, ejemplares, autoridades y objetos digitales a través de múltiples esquemas de metadatos. Pandora = desarrollada por Cran Consulting. Permite recopilar, gestionar y difundir la documentación digitalizada. Basada en software libre, pero con respaldo empresarial. Dispone de módulos específicos para el tratamiento de la mayoría de los formatos digitales. 4.4.PLATAFORMAS DE PUBLICACIÓN DE DATOS ABIERTOS La finalidad última de una plataforma de publicación de datos abiertos debe ser no sólo la de servir como catálogo para la gestión de los datos publicados por las entidades, sino también la de proporcionar el soporte necesario a todos los elementos que formarán parte de esa iniciativa de datos abiertos a través de una serie de herramientas que en su conjunto componen la plataforma. Catálogo de datos: responsable de organizar los datos disponibles. Debe contar con soporte para metadatos, compatibilidad con estándares y soporte avanzado de datos abiertos enlazados. Servicio de datos: debe proveer de acceso directo a los datos, a través de enlaces externos o mediante descarga de la propia plataforma. Debe permitir la búsqueda y contar con mecanismos de actualización. Servicios informativos: secciones en la plataforma con información sobre el concepto, características, etc. Así como información sobre las condiciones de reutilización y licencias aplicables. Servicios para la comunidad: soporte a los reutilizadores y usuarios de los datos. 4.5.SOFTWARE PARA LA PUBLICACIÓN DE DATOS ABIERTOS CKAN Data Management System = herramienta de Open Knowledge similar a un CMS orientado a la publicación de datos. Permite publicar y administrar colecciones de datos con muy pocos recursos, así como exportarlos o previsualizarlos en mapas, gráficas, tablas… Es gratuita y de software libre, aunque incluye servicios de desarrollo, alojamiento, soporte y formación que son de pago. DKAN Open Data Platform = basada en Drupal y mantenida por CivicActions. Se organiza en cuatro funciones principales: gestión, agregación, descubrimiento y usabilidad de los datos. OGoov (Plataforma de Gobierno Abierto) = software comercial, desarrollada por Viafirma. Integra CKAN y WordPress. Ofrece soporte para datos abiertos enlazados a través de un servidor semántico construido con Apache Marmotta y un punto de consulta SPARQL. Permite la gestión de datos con conexión en tiempo real y ofrece visualización en tablas, gráficos y mapas. Opendatasoft = software comercial. Permite publicar, gestionar, combinar, analizar, visualizar y compartir fácilmente datos en diversos formatos en una única plataforma. Open Data Platform (Socrata) = software comercial. Plataforma escalable de publicación de datos en la nube con un amplio conjunto de funcionalidades. 5. PLANIFICACIÓN, DESARROLLO Y EVALUACIÓN DE PROYECTOS DIGITALES 5.1.FASES DE UN PROYECTO DIGITAL Etapa 1: Planificación = identificar objetivos; describir recursos (búsqueda de fuentes de financiación); prever dimensión del proyecto; formatos y usos; análisis de la plataforma de software; cronograma. Etapa 2: Diseño conceptual y lógico = estructura; tipología; modelos de metadatos; plan de preservación; condiciones legales; equipo de trabajo; flujos de trabajo; pautas de uso y mantenimiento; difusión y promoción. Etapa 3: Implementación = digitalización; implantación y personalización del software; carga de contenido. Etapa 4: Marketing y difusión = comunicar y difundir la colección; formar a usuarios potenciales; registro en directorios y portales (OAI Data Providers, Hispana, OpenDOAR…); presencia en congresos y publicaciones científicas; herramientas sociales. Etapa 5: Evaluación 5.2.ASPECTOS LEGALES La digitalización es un acto de reproducción, es decir, un acto de explotación que corresponde en exclusiva a su titular y no puede realizarse por otras personas, salvo autorización legal o expresa del mismo. La ley contempla como excepciones las instituciones culturales (bibliotecas, museos, archivos…, que pueden realizar reproducciones —analógicas o digitales— sin ánimo de lucro y con fines de investigación o conservación) y la copia para uso privado, que permite al usuario la digitalización, siempre que la copia no se utilice de forma colectiva, ni lucrativa. La puesta a disposición del público de contenidos a través de Internet e intranets. En cuanto a alojar contenidos accesibles en Internet, debemos ser sus titulares o tener autorización de quien detente ese derecho, hacer lo contrario es un acto de explotación indebida de derechos de propiedad intelectual. La delimitación es simple, tanto el signo del copyright, ©, acompañado de la expresión «todos los derechos reservados», como los específicos de licencias libres o abiertas, por ejemplo, Creative Commons, CC, con sus variantes, son fáciles de reconocer e interpretar como para ser respetados. La gestión de derechos digitales, DRM (Digital Rights Management). El uso de materiales protegidos es uno de los aspectos más complejos, en parte mejorado gracias a las diferentes alternativas de licencias, en parte vigilado por las diferentes sociedades gestoras de derechos, como son la SGAE (Sociedad General de Autores de España), centrada en la música, el cine y las artes escénicas; o CEDRO (Centro Español de Derechos Reprográficos), orientada a la gestión de derechos de propiedad intelectual de autores y editores españoles. Legislación: RD 1/1996 de la Ley de Propiedad Intelectual. o Art. 10: Son objeto de propiedad intelectual todas las creaciones originales literarias, artísticas o científicas expresadas por cualquier medio o soporte, tangible o intangible, actualmente conocido o que se invente en el futuro. ▪ Los libros, folletos, impresos, epistolarios, escritos, discursos y alocuciones, conferencias, informes forenses, explicaciones de cátedra y cualesquiera otras obras de la misma naturaleza. ▪ Las composiciones musicales, con o sin letra. ▪ Las obras dramáticas y dramático-musicales, las coreografías, las pantomimas y, en general, las obras teatrales. ▪ Las obras cinematográficas y cualesquiera otras obras audiovisuales. ▪ Las esculturas y las obras de pintura, dibujo, grabado, litografía y las historietas gráficas, tebeos o comics, así como sus ensayos o bocetos y las demás obras plásticas, sean o no aplicadas. ▪ Los proyectos, planos, maquetas y diseños de obras arquitectónicas y de ingeniería. ▪ Los gráficos, mapas y diseños relativos a la topografía, la geografía y, en general, a la ciencia. ▪ Las obras fotográficas y las expresadas por procedimiento análogo a la fotografía. ▪ Los programas de ordenador. o Art. 14: Derechos morales, irrenunciables e inalienables, es decir, que no se pueden transmitir por actos inter vivos, y que pertenecen al autor de la obra. o Art.17-21: Derechos patrimoniales o de explotación pueden cederse y permiten obtener beneficios económicos a sus autores cuando en la obra se produzca reproducción, distribución, comunicación pública o transformación. o Derechos de remuneración: compensación por copia privada sin fines comerciales, remuneración por copias digitales en universidades y centros de investigación, remuneración por préstamo público en bibliotecas. o Los derechos de explotación duran hasta 70 años después de su muerte (80 para los fallecidos antes de 1987, no afectados por la ley de 1987 de propiedad intelectual). Después la obra pasa a dominio público y puede ser usadas sin autorización, siempre que se respete su autoría e integridad. Ley 21/2014 por la que se modifica el RD 1/1996. Recomendación (UE) 2021/1970 relativa al patrimonio cultural (digitalización, reutilización y conservación digital de mayor calidad). RD 24/2021 sobre derechos de autor y afines en el mercado único digital = trasposición de la Directiva Europea sobre Derechos de Autor en el Mercado Único Digital (DEMUD). Licencias Creative Commons (CC) = reconocimiento (by), reconocimiento-no comercial (by-nc), reconocimiento-no comercial-compartir igual (by-nc-sa), reconocimiento-no comercial-sin obra derivada (by-nc-nd), reconocimiento- compartir igual (by-sa), reconocimiento-sin obra derivada (by-nd), dominio público (CC0). RightStatements.org = declaraciones de derechos estandarizados para el patrimonio cultural en línea, respaldadas por Europeana, que facilitan ver si las obras patrimoniales pueden ser reutilizadas y cómo. Recomiendan el almacenado del URI d la declaración de derechos en un elemento de metadatos. Por ejemplo en dc:rights o edm:rights. Se recomienda usarlo conjuntamente con Creative Commons. Sherpa Romeo = base de datos con listas de revistas y editoriales y sus condiciones de derechos de autor. 5.3.ASPECTOS TÉCNICOS DE LA DIGITALIZACIÓN Digitalización (Díez Carrera) = copia, proceso de fijado en un nuevo soporte, con nuevos medios y agregando o modificando algunas de sus características. Deben de cumplir: calidad en términos de integridad y nitidez de los resultados, permanencia en el tiempo mediante el uso de medios y soportes normalizados e interoperabilidad entre sistemas informáticos. Digitalización = proceso mediante el cual la información analógica se convierte en información digital, a través de un sistema informático y de unos dispositivos, normalmente el escáner óptico o la cámara digital, para su conversión en imagen o en texto a través de un OCR (optical character recognition), ICR (intelligent character recognition) o IWR (intelligent word recognition). Planificación de la digitalización = objetivos y propósito (contenido, prioridad, público al que se dirige, medios para acceder a los fondos, derechos, modelo de negocio). Estrategia Nacional de Digitalización 2022-2026. Contextualización con las políticas de digitalización existentes. Cooperación y coordinación para evitar duplicidades. Valoración de los materiales (valor intínseco, uso actual y potencial) para establecer prioridades. Disponibilidad tecnológica (hardware y software) Sostenibilidad del proyecto en términos económicos Calidad del ciclo técnico: tareas de preparación de los documentos (restauración o reforzamiento, desencuadernado, procedimiento de manipulación para garantizar su integridad…), proceso de digitalización, catalogación e incorporación de metadatos, postprocesasdo, control de calidad y evaluación, preparación de miniaturas y formatos de publicación. Conformidad legal: derechos de terceros (autores, editores…) y de la propia biblioteca o institución, procesos de contratación de servicios (pliegos, condicionados, contratos…), confidencialidad, protección de datos y derechos de explotación y reutilización. Normativas sobre digitalización: A framework of guidance for building good digital collections (NISO) UNE-ISO 13028:2011 Información y documentación. Directrices para la implementación de la digitalización de documentos. ISO 19264-1:2021 Photography – archiving systems – imaging systems analysisi – part 1: reflective originals. Tutorial de la Biblioteca de la Universidad de Cornwll. Directrices para proyectos de digitalización de colecciones y fondos de dominio público (IFLA, ICA, UNESCO) Guías sobre procedimientos de digitalización del MC, BNE, CSIC, CCAA o REBIUN. ALTO (Analyzed Layout and Text Object) = esquema XML para almacenar los metadatos técnicos para describir el diseño gráfico y el texto de las imágenes digitales, obtenido por OCR (reconocimiento óptico de caracteres). Suele utilizarse dentro de los metadatos administrativos de METS, aunque también puede existir como documento autónomo. IIIF (International Image Interoperability Framework) = conjunto de estándares abiertos para mejorar la interoperabilidad con el acceso a imágenes digitales, audio y vídeo. 5.4.PRESERVACIÓN DIGITAL Las Directrices para la Preservación del Patrimonio Digital (UNESCO, 2003) establecen que la preservación digital consiste en los procesos destinados a garantizar la accesibilidad permanente de los objetos digitales. Para ello, es necesario encontrar las maneras de representar lo que se había presentado originalmente a los usuarios mediante un conjunto de equipos y programas informáticos que permiten procesar los datos. Para lograrlo, es necesario que la comprensión y la gestión de los objetos digitales se realice considerándolos desde cuatro puntos de vista: como fenómenos físicos, como codificaciones lógicas, como objetos conceptuales comprensibles para el ser humano y como conjuntos de elementos esenciales que deben ser preservados para ofrecer a los futuros usuarios lo esencial del objeto. Características del objeto digital: autenticidad, fiabilidad, integridad y manejabilidad/accesibilidad. Objetivos de las políticas de preservación en bibliotecas digitales: desde el punto de vista patrimonial, conservación a largo plazo de los objetos digitales y, desde el punto de vista del usuario, garantizar la accesibilidad en el tiempo. Problemática de la conservación digital: obsolescencia tecnológica, dependencia de los equipos (soportes asociados a tecnologías concretas), pérdida de integridad, fragilidad de los soportes. Estrategias de preservación digital: actualización de los soportes (refreshing), migración de los formatos, emulación, mantenimiento, preservación de la tecnología, arqueología digital, analogización, replicación. Metadatos de preservación = información estructurada sobre un objeto digital que: Define el material bajo la responsabilidad de un programa de preservación. Indica qué se necesita para mantener y proteger los datos. Indica qué se necesita para representar el objeto (o sus elementos esenciales definidos) al usuario cuando éste lo solicite, aun cuando las tecnologías de almacenamiento y acceso hayan cambiado. Registra la historia del objeto y las consecuencias de lo que le vaya sucediendo. Documenta la identidad y la integridad del objeto para certificar su autenticidad. Permite al usuario y al programa de preservación comprender el contexto del objeto almacenado y en uso. Información necesaria en los metadatos de preservación: Información sobre el contenido: consiste principalmente en detalles sobre la categoría técnica del objeto, que indica al sistema cómo representar los datos como tipos y formatos de datos específicos. A medida que las tecnologías de acceso cambien, estos metadatos de representación también tendrán que ser actualizados. Información de descripción para la preservación: constituida por los otros detalles necesarios para la gestión y utilización a largo plazo del objeto, como identificadores y detalles bibliográficos, información sobre derechos y propiedad intelectual, procedencia, historia, contexto (incluidas las relaciones con otros objetos) y validación de la información. La preservación digital, además de conservar objetos, debe hacerlo de modo que mantengan todas sus cualidades o características: autenticidad, integridad, accesibilidad, entre otras. A diferencia de la actuación tradicional, orientada a mantener el documento en su estado original, los documentos digitales deben ser modificados y transformados continuamente para que continúen siendo accesibles e inteligibles. Las actuaciones deben ser permanentes y esta intervención continuada requiere financiación permanente. Declaración de Vancouver UNESCO/UBC (2012) = solicita que el sector de patrimonio cultural, los gobiernos y la industria trabajen juntos en preservación digital. UNESCO/PERSIST: Guidelines for the selection of digital heritage for longterm preservation (2021): directrices para elaborar políticas de selección de patrimonio digital sostenible a largo plazo para su preservación digital. 5.5.SOFTWARE PARA LA PRESERVACIÓN Archivematica = herramientas de software libre que permiten procesar objetos digitales desde que son introducidos en el sistema hasta su publicación atendiendo al modelo funcional OAIS-ISO. Utiliza estándares como METS, PREMIS, Dublin Core, entre otros. DROID = herramienta de The National Archives para realizar la identificación automática por lotes de los formatos de archivo. Software gratuito y de código abierto. JHOVE = herramienta de identificación, validación y caracterización de formatos de archivo. Implementada como aplicación Java, disponible bajo licencia LGPL. koLibRI (kopal Library for Retrieval and Ingest) = herramientas Java desarrolladas para la interacción con el sistema DIAS de IBM dentro del proyecto kopal. Puede reutilizarse en su totalidad o por partes en otros contextos. LIBSAFE (Libnova) = software de preservación digital conforme a OAIS-ISO. LOCKSS = sistema de preservación digital de uso general. Software de código abierto desarrollado por Standford Libraries. Preservica = software de preservación basado en estándares OAIS-ISO, combina todas las capacidades críticas de la preservación digital a largo plazo en una única plataforma integrada. Rosetta (ExLibris) = solución completa de gestión y preservación de recursos digitales ideada para bibliotecas, archivos, museos y otras instituciones. Odilo Preserver = gestiona el ingreso de paquetes de información y los transforma en elementos de archivo conforme al modelo OAIS. Asegura la trazabilidad de los paquetes y ofrece almacenamiento en la nube. 5.6.EVALUACIÓN DE COLECCIONES DIGITALES Ejes de evaluación de las colecciones digitales (DELOS) = usabilidad, utilidad y rendimiento de las colecciones. Métodos de recogida de datos = observaciones, análisis de ficheros log, entrevistas, análisis de documentos producidos por los usuarios, análisis de tareas. Recomendaciones respecto a la evaluación de bibliotecas digitales (Fuhr et al) = establecer marcos de evaluación flexibles, involucrar en el proceso a profesionales y usuarios reales, tener en cuenta las experiencias de evaluación de colecciones a larga escala como TREC, mantener un inventario de las investigaciones evaluativas al servicio de la comunidad profesional e investigadora, establecer repositorios de acceso abierto con datos evaluativos primarios, acordar formatos estandarizados de ficheros de transacciones, desarrollar evaluaciones longitudinales sobre el comportamiento de los usuarios y delimitar el área de actuación específica que corresponde a la evaluación de bibliotecas digitales. Guías de evaluación de repositorios: Guía para la evaluación de repositorios institucionales de investigación (2021) Guía para la evaluación de los procesos de preservación en repositorios institucionales de investigación (2020)