Tema 18.2.pdf
Document Details
Uploaded by FriendlyIodine
Universidad de Granada
2018
Tags
Full Transcript
PLAN DE PRESERVACIÓN DIGITAL DE LA BIBLIOTECA UNIVERSITARIA DE GRANADA Fecha: 21/03/2018 Índice 0. Historia 1. Situación actual 1.1. Análisis de la biblioteca 1.1.1.1. Activos 1.1.1.2. Descripción de la situación actual...
PLAN DE PRESERVACIÓN DIGITAL DE LA BIBLIOTECA UNIVERSITARIA DE GRANADA Fecha: 21/03/2018 Índice 0. Historia 1. Situación actual 1.1. Análisis de la biblioteca 1.1.1.1. Activos 1.1.1.2. Descripción de la situación actual 1.1.1.3. Acceso universal 1.2. Análisis externo 2. Definición del Plan de Preservación 2.1. Ámbito de aplicación 2.2. Objetivo 2.3. Procedimientos 3. Estrategia 3.1. Modelo de gestión 3.2. Estructura organizativa 3.2.1. Recursos humanos 3.2.2. Financiación 4. Diseño 4.1. Programas de digitalización 4.2. Proceso de digitalización 4.3. Almacenamiento 4.3.1. Dimensión y organización de la colección 4.3.2. Sistema de almacenamiento: requisitos 4.3.3. Metodología de preservación 5. Ejecución/Difusión 5.1. Sistema de difusión 5.1.1. Requerimientos técnicos 5.2. Sistema de preservación 5.3. Planificación actual 5.4. Planificación económica 6. Bibliografía 7. Anexos Anexo I.- Manual Técnico de Digitalización Anexo II.- Registros de fondo antiguo Anexo III.- Perfil de metadatos 0. Historia El Proyecto Ilíberis de la Biblioteca Universitaria de Granada (BUG) se inicia en el año 2002 cuando se modifican las descripciones bibliográficas existentes y se adaptan todos los datos al nuevo sistema de gestión Millenium. Se inicia, en colaboración con la Fundación Botín del SCH, la digitalización masiva de aquellos fondos del siglo XVI que no estuvieran previamente microfilmados. Sin perder de vista el objetivo prioritario de prestar a los usuarios e investigadores las reproducciones necesarias para su labor científica, la digitalización se planificó siguiendo los estándares de calidad internacionales. Respondiendo al compromiso adquirido desde el Plan Estratégico 2008-2012 que persigue impulsar la preservación, conservación, difusión y acceso del fondo patrimonial de la biblioteca de la Universidad de Granada, y gracias a sucesivas ayudas del Ministerio de Cultura, seguimos nuestra política de digitalización de nuestros fondos y en el año 2009 habilitamos una plataforma para difusión de nuestros contenidos, a través del protocolo OAI -PMH. Gracias a todo esto, elaboramos un Manual Técnico de Digitalización (Anexo I) con el objetivo de poner en marcha una política unitaria que guíe a la biblioteca en la aplicación de unos criterios técnicos uniformes, así como en el uso de unos estándares de aceptación general que permitan la interoperabilidad y el intercambio de datos con otros organismos nacionales e internacionales. Este Manual busca una optimización de los procesos de digitalización que faciliten la implantación de unos modos de actuación y que garantice una digitalización de calidad en la que se contemple el uso de metadatos y protocolos estandarizados favoreciendo así la adhesión de Biblioteca Universitaria a las tendencias e iniciativas actuales en temas coma la conservación y preservación de objetos digitales. El Manual aconseja trabajar siguiendo una metodología basada en la definición de tareas y procesos y su secuencia lógica, así como establecer funciones y responsabilidades de los distintos agentes implicados. La digitalización de los fondos bibliográficos patrimoniales conservados, además de ser un garante de preservación, es una puesta en valor del patrimonio de la Institución en la red, optimizando el acceso a los contenidos y mejorando su difusión entre la comunidad científica y organismos similares. Hasta el momento se ha desarrollado un Manual Digitalización que fija los requerimientos técnicos y los estándares a utilizar en los procesos de digitalización pero se hace necesario el desarrollo de un proyecto que concrete y establezca metodológicamente algunos aspectos no contemplados en ese Manual. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] 1. Situación actual 1.1. Análisis de la biblioteca 1.1.1. Activos La Biblioteca Universitaria de la Universidad de Granada (BUG) posee un conjunto documental multidisciplinar compuesto por fondos bibliográficos del siglo XV al XIX. Estos materiales son de gran importancia para distintas áreas del conocimiento. Existen unos 70.000 volúmenes de fondo antiguo pertenecientes a la BUG, que inicialmente podrían ser candidatos a ser digitalizados en su totalidad (Anexo II), de los que ya están digitalizados y puestos a disposición de los usuarios, bien a través del catálogo de la biblioteca, bien a través del repositorio institucional (plataforma de difusión en acceso abierto y con protocolo OAI-PMH), unos 16.000 documentos. Estos fondos se encuentran albergados en la Biblioteca de Fondo Antiguo situada en el Hospital Real, sede del rectorado. 1.1.2. Descripción de la situación actual Gracias a la puesta en marcha de las diferentes convocatorias de ayudas a la digitalización de Fondo Antiguo por parte del Ministerio de Cultura y Educación, de las que la BUG ha resultado beneficiada en diferentes ocasiones, hemos podido realizar sucesivos proyectos de digitalización de fondos propios, habiendo conseguido nuestro objetivo principal, la difusión de dichos fondos y una gran aceptación entre nuestros usuarios, pero no se han considerado los aspectos relativos a la preservación de las propias imágenes digitales, de forma que se asegure su continuidad en el futuro con independencia de las versiones de los programas de gestión u otras contingencias. Esta carencia sólo se puede achacar a que la sensibilidad por los temas de preservación de las imágenes digitales se ha generalizado muy recientemente en el ámbito español. El convencimiento de la necesidad de preservar las imágenes de acuerdo con criterios técnicos y de ajustarse en ello a los estándares internaciones ha sido uno de los elementos principales para elaborar el Plan de Preservación Digital de la Biblioteca Universitaria de Granada. Pero no sólo es la preservación lo que obliga a elaborar planes globales ya que el hecho de no haber tenido hasta ahora una política institucional en los temas de digitalización conlleva el riesgo de Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] que se multipliquen los esfuerzos, se desperdicien recursos y no se rentabilicen adecuadamente las actuaciones en ese ámbito. 1.1.3. Acceso universal Las digitalizaciones se deben contemplar como una política dirigida a dar acceso a los usuarios potencialmente interesados en la consulta a esos documentos pero incorporando las ventajas de disponibilidad universal que ofrece Internet, desde cualquier ordenador del mundo, a cualquier hora, con consultas simultáneas a los documentos por parte de usuarios distintos, de manera equiparable a como se hace con los recursos electrónicos (revistas, libros, etc.) nacidos en soporte digital. Un aspecto importante a considerar con la digitalización se refiere a la mejora de la gestión documental de esos fondos, ya que se logra, por un lado, la conservación física de las obras al limitar su manejo por una reducción de la consulta de los originales y, por otro, multiplica el acceso. Unido a lo anterior, se produce una reducción de costes en el gasto por la compra y mantenimiento de los materiales que se digitalizan, en especial en tareas de encuadernado o restauración. Otro valor destacable que también se logra con la digitalización es dar una mayor visibilidad a la Institución en Internet a la vez que la difusión de fondos valiosos, en ocasiones de difícil acceso. La digitalización de nuestros fondos enlaza con otras iniciativas de la Institución en el ámbito de la información electrónica de calidad para la actividad científica; en concreto, el Repositorio Institucional de la Universidad de Granada, Digibug (http://digibug.ugr.es). 1.2. Análisis externo En España tenemos ya algunos ejemplos de implantación de sistemas de preservación en diferentes instituciones como la Universidad de Barcelona, la Biblioteca Nacional Española o el CSIC. Analizamos diferentes soluciones existentes en el mercado para la realización de preservación digital en las bibliotecas: LOCKSS -> solución estandarizada para preservación digital en el mundo bibliotecario, pero que decepciona por su poca claridad en los objetivos e implementación, y unos requerimientos excesivos. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] koLibRI -> de origen alemán pero no tiene sistemas de replica o verificación de objetos digitales. Digital Information Archiving System (DIAS) -> de IBM implantado en la Koninklijke Bibliotheek e-Depot Safety Deposit Box (SDB) -> de Tessella, implantado en The Nacional Archives UK y en US Nacional Archives and Records Administration (NARA) Rosetta -> de Exlibris (muy cara) instalado en la Nacional Library of New Zelanda. Libsafe -> de Libnoba instalado en la Universidad de Barcelona y BNE 2. Definición del Plan de Preservación 2.1. Ámbito de aplicación Con este plan la BUG recoge todos los aspectos a tener en cuenta en los proyectos que digitalicen documentos que se custodian en sus bibliotecas. Estos aspectos incluyen: los técnicos relativos a la captura de las imágenes, la organización previa de los procesos y las tareas posteriores, el almacenaje y la preservación de las imágenes, su difusión en Internet y las herramientas tecnológicas necesarias para ello. Se pretende dar coherencia y uniformidad dentro de la Institución a los criterios que deben guiar los procesos de digitalización y preservación e incorporar estándares y procedimientos homologados que faciliten la cooperación con iniciativas de ámbito nacional e internacional. 2.2. Objetivo Con este Plan se establece, por un lado, una serie de medidas para la preservación de las propias imágenes digitales frente a las contingencias futuras y reforzar la conservación de los documentos originales al disminuir su manejo físico en la consulta por parte de los usuarios, y poro otro lado, conseguir dar una mayor difusión a través del acceso por Internet a documentos relevantes e importantes de la institución. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] Como objetivos concretos del Plan se establecen: Uso de estándares internacionales en la digitalización y asignación de metadatos Establecer una política de preservación de !as imágenes Difusión de los resultados de los procesos de digitalización Mayor presencia del patrimonio en Internet 2.3. Procedimientos Los fondos bibliográficos a digitalizar estarán siempre en dominio público; en el caso excepcional de que no lo estén, la BUG se asegurará de ser poseedor de todos los derechos o de cumplir los requisitos legales vigentes en cada caso para respetar los derechos de los autores. Se aplicarán unos criterios de selección que marcarán las pautas a la hora de proponer obras a digitalizar y que permitirán priorizar unos frente a otros. Estos criterios son: Fondos que tengan un elevado riesgo de deterioro Fondos que sean de especial relevancia Participen en proyectos o iniciativas de digitalización de otras instituciones, tanto nacionales como internacionales Fondos que tengan un gran uso Que sean unidades temáticas que formen un conjunto de presentación, exposición, etc. Peticiones expresas por temas de investigación de personal de la UGR Respondan a una efeméride o acontecimiento en la sociedad Otro aspecto muy destacable son los recursos tecnológicos para gestionar las imágenes resultantes de los procesos de digitalización, tanto en lo relativo a los distintos formatos, en especial, el de conservación, como en las herramientas necesarias para la difusión. En el primer caso, es imprescindible cubrir las necesidades de espacio en servidores para almacenar los distintos formatos, tanto los tiff de conservación de las imágenes como los derivados (.pdf, jpeg, etc.), Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] y dimensionar el crecimiento previsto. Esta infraestructura de almacenamiento debe estar asegurada por el CSIRC, que tiene que prever los recursos precisos para el mantenimiento correcto y perdurable de las imágenes así como posibles migraciones y otras contingencias técnicas. Por otro lado, la gestión de los objetos digitales exige herramientas propias que permitan su organización y puesta en servicio de manera ágil y que hagan una gestión de los distintos metadatos que acompañan las digitalizaciones (técnicos, descriptivos y estructurales); en este sentido, existen en el mercado distintas opciones que se tendrán que valorar para ver cuál puede cubrir todas las exigencias necesarias y la integración con las demás herramientas de información que tiene la BUGR. En cuanto a la vigencia del Plan, se considera que, dada su propia naturaleza, es un documento abierto, en continua actualización, si bien sus planteamientos generales responden a las directrices aprobadas en los Planes Estratégicos (2008-2011, 2012-2015 y 2016-2019) y sus principios técnicos son sólidos ya que se basan en estándares internacionales y en propuestas ampliamente aceptadas en la comunidad profesional. 3. Estrategia 3.1. Modelo de gestión En la medida de lo posible y como norma general se optará por un modelo de gestión basado en la externalización de los procesos de digitalización y generación de metadatos. No se puede mantener tecnologías de vanguardia, ni asumir el increm ento de trabajo que conllevan los proyectos de digitalización por lo que se deben utilizar los servicios de empresas especializadas que por su dedicación y carácter están en permanente actualización de programas y equipos. Si los materiales que se quiere digitalizar son valiosos, la empresa tiene que instalarse en los espacios que la institución proponga, evitando así la salida de estos materiales. Las empresas deberán cumplir con los requerimientos que fija el Manual Técnico de Digitalización de la Biblioteca de la Universidad de Granada (Anexo 1) En función de cuál sea la fuente de financiación, bien la UGR o bien organismos externos, puede variar el modelo de gestión, puesto que estará supeditado al modelo de Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] funcionamiento del organismo financiador. 3.2. Estructura organizativa 3.2.1. Recursos humanos Para la correcta puesta en marcha de cada uno de los proyectos de digitalización es conveniente contar con un equipo de profesionales que deberán trabajar coordinadamente en base a los objetivos que se habrán fijado en el proyecto de digitalización. Este equipo lo integrará personal fijo, de la institución y personal externo, de las empresas, en función de la envergadura y tamaño del trabajo a realizar. El personal implicado en los proyectos de digitalización deberá reunir las siguientes aptitudes y condiciones: o Conocimiento especializado y exhaustivo de los fondos objeto de digitalización (valor, informatización, estado de conservación, derechos de propiedad intelectual) o Personal Facultativo , Ayudante y Técnico especialista en Archivos, Bibliotecas y Museos o Conocimientos sobre protocolo de control de fondos en procesos de digitalización o Experiencia en la contratación de seguros, traslado de fondos, instalación, etc. o Experiencia en la manipulación de fondos patrimoniales o Especialista en conservación y preservación de materiales especiales (fotografías, fondo antiguo, etc.) o Especialistas en técnicas de digitalización actuales o Experiencia en digitalización de fondos o Manejo de escáneres y software de aplicación o Conocimientos sobre generación de metadatos 3.2.2. Financiación Se contemplan las siguientes vías de financiación: Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] A. Ayudas de la Universidad de Granada Acciones especiales Proyectos de investigación que requieran digitalización Convenios con terceros B. Ayudas procedentes de otros organismos Ministerio de Cultura Participación en proyectos nacionales o internacionales Mecenazgo, dentro del plan propio de la UGR. 4. Diseño 4.1. Programas de digitalización La política de digitalización se puede dividir en varios programas de digitalización: - Fondo patrimonial - Proyectos nacionales o internacionales (1).- Selección y preparación de obras A. Selección y revisión de los documentos En la revisión de los títulos habrá que tener en cuenta: Digitalizaciones ya existentes. Ediciones repetidas, aunque sean de distinta fecha Selección de ejemplares duplicados entre las distintas bibliotecas. Posibles incorporaciones no contempladas en un primer momento Selección de los ejemplares en función de su estado de conservación Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] Producto de este examen se realizará una tabla de ejemplares a la que se trasladará toda la información pertinente y que finalmente refleja la selección real. (2).-Digitalización. El proceso de digitalización conlleva una relativa automatización por lo que se debe intentar que sucedan los menores cambios posibles. La fase de digitalización debe ir lo más fluida posible. 4.2. Proceso de digitalización Este proceso abarcará a su vez varias fases que se desarrollan a continuación. Se tendrá que establecer un flujo de movimiento de las obras, unos criterios técnicos y finalmente un control de calidad: a. Digitalización y tratamientos asociados La digitalización debe seguir siempre las pautas y criterios establecidos en el Manual Técnico de Digitalización (Anexo I). Este plan irá ampliándose y actualizándose con toda la información técnica necesaria. b. Control de los objetos digitales y control de calidad En primer lugar habrá que identificar y controlar si los productos que se obtienen son los que se han establecido. Una vez comprobada la calidad de las imágenes y sus formatos, se deberá proceder de igual manera con la calidad de los metadatos, de forma que se hará un muestreo aleatorio. La corrección estructural de los metadatos se comprobará con una herramienta que valide estructuras y lenguajes xml. c. Transferencia y alojamiento en un sistema de gestión de colecciones y en un sistema de preservación Los ficheros digitales (objetos digitales más metadatos o cada uno por separado) deberán integrarse tanto en el repositorio institucional como en el sistema de Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] almacenamiento y preservación. La política de preservación digital, expuesta en el siguiente punto, indicará qué requerimientos, formatos y procesos componen este sistema. Igualmente la carga en el repositorio institucional, representa el último paso del ciclo ya que es este quién dé acceso a los usuarios y a través de él las colecciones y los proyectos serán difundidos. 4.3. Almacenamiento Como elementos básicos se deberán conservar los siguientes formatos con los objetivos que se indican: TIPO DE FICHERO OBJETIVO TIFF MASTER PRESERVACIÓN TIFF EDITADO PRESERVACIÓN Y OBTENCIÓN DE DERIVADOS FICHERO DE METADATOS PRESERVACIÓN PDF (*) DIFUSIÓN JPEG (*) DIFUSIÓN (*) Según el tipo de obra digitalizada 4.3.1. Dimensión y organización de la colección En el momento de redactar este documento ya se han realizado en años anteriores, diferentes proyectos de digitalización, manteniendo los ficheros resultantes de estos en discos duros externos. En total, se han realizado 8 proyectos de digitalización, con un tamaño cercano a los 30 TB de información Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] (imágenes y metadatos) que ya están incluidos en nuestro sistema de preservación digital, Libsafe. La estructura definida en estos proyectos es la siguiente: Nivel 1 - Signatura del objeto (según nuestro catalogo) Nivel 2 - Tipología de ficheros (TIFF, JPEG, PREMIS, METS,…) Nivel 3 – Secuencia correlativa de ficheros resultantes 4.3.2. Sistema de almacenamiento: requisitos El sistema de almacenamiento y preservación, debe ser un sistema abierto, conforme al estándar OAIS y debe poseer una estructura flexible, modular y escalable capaz de evolucionar. También debe ofrecer una capacidad de seguimiento y alerta, además de un plan de recuperación de emergencia, con un uso y mantenimiento las 24 h los 365 días al año además debe tener una gran capacidad de almacenamiento y a su vez tener una proyección de crecimiento. A ser posible, deberá ser concebido como un sistema de módulos independientes para minimizar riesgos. Por otro lado debe poder garantizar la conservación con independencia de la infraestructura y arquitectura física que adopte. La política de preservación tiene como objetivos: Garantizar la integridad y la autenticidad de los documentos Recolectar todas las informaciones necesarias para que los documentos sigan comprensibles a lo largo del tiempo Establecer estrategias de preservación como la migración (transformación del código del objeto) o emulación (restitución del objeto a través de la transformación del entorno informático). Pero también debe poder permitir volver hacia atrás. Tener un módulo de gestión de datos Respetar las normas y estándares internacionales Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] Sistemas de backup consistentes Mantener la vigilancia tecnológica continua de los equipos y de las técnicas de producción 4.3.3. Metodología de preservación En el sistema de preservación deberán almacenarse los objetos digitales con los metadatos codificados en METS, que ligan la información sobre los objetos con los objetos propiamente dichos. Los metadatos deben poderse consultar y deben ser accesibles de una forma ágil; también es importante que los metadatos puedan actualizarse de forma regular y sencilla y de igual manera también los objetos digitales deben poder ser mejorados o modificados, por lo que un sistema de preservación debe tener un "sistema de gestión o control de versiones" que facilite las modificaciones y/o actualizaciones pero también que conserve la versión anterior de forma automática. Por otro lado hay que establecer unos procedimientos normalizados de almacenamiento entre productores y archivo. Se debe establecer una política de alimentación que permita validar las transferencias hechas por el productor y que los encargados del sistema de preservación puedan asumir sus responsabilidades en cuanto a formatos y versiones. También es recomendable frente a la masa, tamaño y peso que representan hoy en día los objetos y datos en formato digital, proceder por conjuntos en función del grado de importancia. La política de preservación define dónde se almacenan los AIP 1 y su ciclo de vida. Otro aspecto a tener en cuenta es la aplicación de una política de acceso que defina los formatos de difusión, así como las restricciones de acceso. = AIPArchival Information Package Paquete informativo que se guarda y preserva en el repositorio o sistema de almacenamiento. (SIP, Submission Information Package= Es el paquete de información que se transmite o se ingresa en el repositorio DIP, Dissemination Information Package = es la información derivada del AIP para ser ofrecida al usuario) Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] 5. Ejecución/Difusión 5.1. Sistema de difusión La BUG debe potenciar la política de difusión de los fondos propios que digitalice de acuerdo con este Plan por medio del uso de las herramientas técnicas más adecuadas para que la consulta sea ágil y cómoda para cualquier persona que quiere hacerlo. La difusión también tiene que contemplar la participación en proyectos de digitalización nacionales e internacionales que permitan una presencia más amplia de la Institución en Internet. Una buena política de difusión de las digitalizaciones es imprescindible para responder mejor a los fines propios de la BUG y sirva adecuadamente a la sociedad permitiendo la consulta amplia y segura de su rico patrimonio documental. Para ello se puso en funcionamiento en el año 2009 el Repositorio Institucional de la Universidad de Granada, Digibug (http://digibug.ugr.es), bajo la implantación del software Dspace, ampliamente extendido a nivel nacional e internacional. 5.1. 1. Requerimientos técnicos Los requerimientos técnicos generales a tener en cuenta para un sistema de difusión deben ser: Trabajar con todos los estándares de uso en el ámbito internacional (OAI, METS, PREMIS etc.) Permitir una gestión múltiple, con control de tareas y permisos. Sistema ágil y con interfaces amigables para los profesionales Organización de los objetos digitales cargados en el sistema debe ser rápida y de fácil manejo (creación de colecciones, presentación web de novedades y destacados, resalte de nuevas incorporaciones...) Acceso controlado a los objetos digitales con una buena gestión de los derechos de copyright. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] Incorporar rápidamente actualizaciones de nuevos estándares, nuevos formatos, etc., (flexibilidad y adaptabilidad) Ofrecer un mantenimiento continuo y dinámico que garantice plazos de respuesta y soluciones. Contener un módulo de estadísticas de uso, parametrizable a las necesidades de la institución. Tener un motor de búsqueda potente que permita la búsqueda externa (metadatos descriptivos) e interna (dentro de los propios objetos digitales) 5.2. Sistema de preservación Nos decidimos por la solución de la empresa Libnova, tanto el precio como el software para preservación se adaptan a nuestras necesidades. Nos aportan una solución global que incluye la generación de objetos digitales (imágenes+metadatos), software de preservación y hardware especializado. Actualmente se decidió contratar solo la solución software de preservación (LibSafe) y la parte y la parte hardware se implanta en colaboración con el servicio de informática de la UGR (CSIRC). Solución adoptada Software: LibSafe de la empresa Libnova Hardware: Servidor para la implantación del software de preservación Libsafe: Rack Dell con Intel Xeon E5-2407 2.40GHz ,12 GB RAM, 2 discos 1 TB, 2 puertos Ethernet 1 Gb con Windows Server 2008R2. Para el almacenamiento hacemos uso de un sistema de almacenamiento masivo Fujitsu DX90, gestionado por el CSIRC, al que le añadimos una bandeja de discos con 12 discos de 4 TB, conectados en RAID 6 sin disco de espera, lo que no da una capacidad total de 36 TB. Esto nos permite una tolerancia de error sin perdida de hasta 2 discos duros. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] Además, toda la información que vayamos almacenando se integra dentro de los sistemas automáticos de backup en cinta que mantiene el CSIRC. 5.3. Planificación actual Tenemos unos 30 TB de objetos digitales (imágenes y metadatos) almacenados en Libsafe con lo que estamos al 100% de nuestra capacidad actual, tanto en la licencia del software como en la capacidad hardware. Se ha procedido a solicitar una ampliación en la licencia del software de preservación ampliando la licencia de gestión en otros 15 TB de objetos y en el apartado hardware se ha realizado la compra de otra bandeja de expansión para el sistema de almacenamiento Fujitsu, junto con 12 discos de 4 TB. El apartado de difusión está operativo a través del catalogo de la biblioteca de la UGR, http:// http://adrastea.ugr.es/search*spi/X (las imágenes tiff reducidas) y en el repositorio institucional, http://digibug.ugr.es (los pdf’s). También se están probando varias soluciones para generar los metadatos automáticamente en el proceso de digitalización realizado directamente por la BUG, lo cual conlleva también la definición de un perfil de metadatos propio. 5.4. Planificación económica Para el mantenimiento del sistema de preservación la BUG, además del compromiso adquirido para el mantenimiento del mismo, y salvando la inversión inicial para la implantación de todo el sistema, se ha estimado un inversión anual de 3.000 €. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] 6. Bibliografía 1. Arms, W.: Digital Libraries. MIT Press, Cambridge, Massachusetts (2000) 2. Biblioteca Nacional de Australia. “Directrices para la preservación del Patrimonio Digital”, Marzo 2003 3. Biblioteca Nacional de España “Proceso de digitalización en la BNE. Biblioteca Digital Hispánica”. 2015 4. CSIC. “Plan director para la digitalización de fondos del CSIC”. 2010 5. Miller, K. “5 Steps to Research Data Readiness”. DCC Briefing Papers. Edinburgh: Digital Curation Centre (2012). Available online: http://www.dcc.ac.uk/resources/briefing-papers - See more at: http://www.dcc.ac.uk/resources/briefing-papers/five-steps-research-data- readiness#sthash.jwF9eQu3.dpuf 6. UNESCO, “Carta para la Preservación del Patrimonio Digital”.2003 Zuleta 7. Portal Travesía, «Directrices para proyectos de digitalización de colecciones y fondos de dominio público, en particular para aquellos custodiados en bibliotecas y archivos», última versión publicada en http://hdl.handle.net/10421/3342. 8. Portal Travesía, «Requisitos técnicos de los proyectos de digitalización de patrimonio bibliográfico y de prensa histórica de la SGCB», ultima versión publicada en http://hdl.handle.net/10421/8981. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] 7. Anexos Anexo I.- Manual Técnico de Digitalización Proceso de digitalización - Dada la fragilidad del material bibliográfico a digitalizar se utilizarán escáneres o cámaras de captura cenital, evitando una excesiva manipulación o el empleo de prensalibros. En todo caso se garantizará la integridad física del material a reproducir. - En ningún caso los ejemplares podrán ser desencuadernados o guillotinados y se deberá asegurar la correcta manipulación de los mismos. - No se digitalizará a doble página. - En caso de que se incorporen marcas de agua, no se superpondrán al texto. - Se llevarán a cabo los ajustes necesarios para evitar bordes negros en las imágenes. Características técnicas 1. La digitalización de los documentos impresos y manuscritos, así como la del resto de materiales especiales (fotografías, postales, carteles, planos, grabados, mapas, etc.) se realizará en color. La resolución de imagen mínima será de 400 ppp. en una escala de 256 gamas de grises o de 16,7 millones de colores. 2. Los formatos de entrega serán: - Copia en formato TIFF 6.0, como copia de seguridad para la preservación de los originales. - Copia en formato JPEG de máxima calidad. - Copia en formato JPEG, comprimida y optimizada para su visualización en Internet - Copia en formato PDF multipágina para cada documento completo digitalizado con texto oculto. - Copia de imágenes thumbnail para miniatura en formato JPG Es obligatoria la utilización de las normas y estándares técnicos promovidos por la biblioteca digital europea (EUROPEANA), así como por los organismos internacionales, tales como IFLA, ISO, y por instituciones de reconocido prestigio, como la LIBRARY CONGRESS. Los objetos digitales serán integrados en la biblioteca digital europea a través de su agregador Hispana. 3. Para cada título se realizará un control de paginación, la indexación del documento, su índice de contenidos, la asignación de metadatos Dublín Core Cualificado en XML con elementos ESE (Europeana Semantic Elements) en su última versión, integrada en el EDM (Europeana Data Model) versión 5.2.1 (o posterior, si existe). Se deberá tener en cuenta, en cualquier caso, las directrices de la iniciativa europea Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] DRIVER. Igualmente se contemplará la integración de los registros digitalizados en el repositorio institucional de la Universidad de Granada, con dirección http://digibug.ugr.es. Todo el proceso de creación de recursos digitales deberá ajustarse a las directrices marcadas en “Requisitos técnicos de los proyectos de digitalización de patrimonio bibliográfico y de prensa histórica de la SGCB” en su portal Travesía, http://hdl.handle.net/10421/8981 4. De los ficheros resultantes, tanto TIFF como JPEG y PDF multipágina con texto oculto, se entregarán copias en disco duro externo USB 2.0. La estructura de directorios deberá agrupar en un mismo directorio todas las imágenes correspondientes a un mismo título en un único formato. 5. Para el almacenamiento más detallado de las imágenes y el nombrado de directorios se seguirán las siguientes instrucciones: para cada título se creará una carpeta cuya denominación se corresponderá con la signatura de la obra pero sólo con los elementos que siguen a la barra todos seguidos y sin guiones, ejemplos: -Para la obra con signatura BHR/A-003-890, la carpeta se denominará A003890 -Para la obra con signatura BHR/A-004-908 (1), la carpeta se denominará A004908-1 6. Cada título se entregará junto con un fichero XML, estructurado según el esquema Metadata Encoding & Transmission Standard (METS) versión 1.9 y un fichero con los metadatos Dublín Core RDF que contendrá los datos descriptivos, administrativos y técnicos de cada copia digital (tipo de material, título, autor, número de páginas, materias, incidencias detectadas en la digitalización, tipos de ficheros de imágenes TIFF, JPEG, PDF, etc., algoritmos de compresión, densidad de grabación, modo de acceso, etc.). 7. Cada título se entregará junto con un fichero XML estructurado según el esquema Perfil METS de la Biblioteca Virtual del Patrimonio bibliográfico, al que se puede acceder en la siguiente dirección: http://www.loc.gov/standards/mets/profiles/00000044.xml. Este perfil está orientado a la creación de METS que sirvan para representar, preservar e ingestar los objetos digitales que se archivan y ofrecen al público en la Biblioteca Virtual de Patrimonio Bibliográfico del Ministerio de Educación, Cultura y Deporte. También puede ser utilizado para ingestar objetos digitales y/o metadatos en otras bibliotecas digitales y bases de datos y, en general, para registrar, trasmitir y almacenar metadatos y objetos digitales. En particular los METS para carga de monografías deben respetar las siguientes especificaciones: Los METS deben incluir direcciones correctas a los namespaces y a los schemas utilizados, y deben Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] estar bien formados y ser válidos. Deben incluir una sección de metadatos descriptivos (dmdSec) que embeba el registro bibliográfico en formato MARC21XML. Deben incluir una sección de metadatos descriptivos (dmdSec) en la que se relacione la imagen que va servir como icono representativo de la obra (normalmente una portada o ilustración). En el caso de los contratos de digitalización, los METS deben incluir una sección de archivo (fileSec), que en un único fileGrp agrupe elementos file para cada imagen JPG de las que conforman la obra. Además, en etiquetas FLocat para cada elemento filese incluirán las direcciones a las imágenes correspondientes. Las direcciones de los METS apuntarán a las imágenes de difusión que se encuentran en los mismos discos duros que estos METS (véase apartado 1.5). En el caso de las subvenciones para digitalización otorgadas por la S.G.C.B. la sección de archivo podrá incluir direcciones bien a versiones en JPG o PDF de las obras digitalizadas. Se incluirá una sección de mapa estructural (strucMap) con atributo TYPE=”LOGICAL”. Si la sección de archivo correspondiente (fileSec) hace referencia a una versión en formato JPG de la obra, este mapa estructural (strucMap) debe incluir la información de paginación. En cuanto a los archivos METS para preservación de monografías deberán ceñirse a las siguientes especificaciones: Incluirán los metadatos que se precisan para la preservación de la copia digital. Estos metadatos se obtendrán del Diccionario de Datos de PREMIS, en su versión vigente a la firma del contrato. Asimismo, se incluirá en el METS información sobre derechos de propiedad intelectual según el esquema METSRigths en el que se detallarán las características de derecho de uso de las publicaciones según determine el Ministerio de Educación, Cultura y Deporte a través de la Subdirección General de Coordinación Bibliotecaria. Se incluirá una sección de archivo (fileSec) con enlaces a las imágenes de preservación. Los METS de carga y preservación para monografías podrán fusionarse en una única versión. Una vez terminado el servicio de digitalización la empresa o servicio de digitalización deberá entregar los archivos MARC21 y los METS de las obras digitalizadas a la institución. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] 8. También se incluirán los metadatos necesarios referentes a los distintos tipos de materiales que describan los términos que se precisan para la preservación de la copia digital de acuerdo con lo especificado en Preservation Metadata Implementation Strategies (PREMIS), versión 2.1 http://www.loc.gov/standards/premis/schemas.html, y elaborado según el Modelo de Referencia del Open Archival Information System (OAIS), IS014721. 9. Las entregas resultantes del proceso OCR serán: - Fichero PDF con el texto por debajo para cada obra, volumen o número. Para denominar los ficheros se utilizará el nombre de la carpeta (signatura) con la extensión 'pdf'. - Fichero ALTO (uno por página) con el resultado del OCR y las coordenadas de cada uno de los elementos de la página (bloques de texto o imagen, líneas, palabras, etc.) marcando los elementos obligatorios HEIGHT (alto), WIDTH (ancho), VPOS (vertical position) y HPOS (horizontal position), según especifica el esquema ALTO: Analyzed Layout and Text Object. Estos ficheros se denominarán con el mismo nombre de las imágenes en formato TIFF con la extensión 'xml'. - Fichero METS/ALTO, que relacionará por cada obra los ficheros de imágenes (TIFF), de reconocimiento óptico de caracteres (ALTO) y PDF con la extensión METSRights para la declaración de derechos de propiedad intelectual y con la extensión PREMIS para los metadatos de preservación. La correspondencia de páginas entre los ficheros TIFF y ALTO se realizará en el elemento structMap. Estos ficheros se denominarán con el número de identificación de la carpeta complementado con la especificación del número, el número de página y la extensión 'xml'. 10. Los ficheros: TIFF, JPEG, PDF y XML, deben validarse automáticamente a través de un software de validación de objetos digitales como JHOVE (JSTOR/Harvard Object Validation Environment) o similar. Los METS incluirán la información relativa al proceso de validación mediante un elemento , dentro de la sección de metadatos administrativos (amdSec), indicando esta información como una entidad Event, de acuerdo con lo especificado en el referido PREMIS Data Dictionary citado. En la sección Descriptive Metadata (dmdSec) se incluirá un elemento External Descriptive Metadata (mdRef) con MDTYPE-'MARC" cuyo valor debe coincidir con la signatura del documento. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] 11. La información deberá adecuarse al Europeana Data Model (EDM) versión 5.2.1 o posterior. Todo el proceso de creación de recursos digitales deberá ajustarse a lo especificado en las “Directrices para proyectos de digitalización de colecciones y fondos de dominio público, en particular para aquellos custodiados en bibliotecas…” en su última versión publicada en http://hdl.handle.net/10421/3342. 12. La estructura de la información de los recursos electrónicos que se incorporarán al Repositorio será la siguiente: -Descripción bibliográfica -Digitalización: realización en color o escala de 256 gamas de grises según las características del documento original. La resolución de la imagen mínima será de 400 ppp. -Ficheros: el formato de entrega será PDF mutipágina. De estos ficheros se entregarán copias en discos duros de 500 Gb con formato ISO 9660, incluyendo títulos completos. -Metadatos: el esquema de XML que permite aglutinar los diferentes tipos de metadatos es la norma Metadata Encoding & Transmission Standard (METS), que mantiene la Library of Congress. Consideramos como requisito indispensable que junto con los objetos digitales se realicen y entreguen los correspondientes ficheros METS. De esta forma el proyecto se asegura su continuidad técnica y su independencia de proveedores al estar basado en la norma para el intercambio y transmisión de información digital. Los ficheros METS incluirán, además de los apartados propios de la norma para la relación de ficheros, mapa estructural de los mismos, las siguientes extensiones: Metadatos descriptivos, con las extensiones IBERMARC ISO 2709, MARCXML Schema y Dublin Core Cualificado; metadatos administrativos técnicos conforme a la extensión MIX (NISO Metadata for Images in XML); metadatos administrativos; declaración de propiedad intelectual conforme al esquema METSRigthts o The RightsDeclarationMD Extension Schema; metadatos de preservación (estos metadatos se obtendrán del Diccionario de Datos , elaborado por el grupo de trabajo PREMIS y denominado PREMIS Data Dictionary, en su última versión basado a su vez en el Modelo de Referencia de Open Archival Information System (OAIS), ISO 14721); metadatos de autoridad (se crearán los correspondientes registros de autoridad de autores, títulos y materias según Metadata Authority Description Schema (MADS) que mantiene la Library of Congress.) Equivalencia entre la estructura de la información descrita en el apartado anterior y la normativa ISO citada en la convocatoria de ayudas La norma ISO15836 define el conjunto de elementos Dublin Core que se conoce habitualmente como “DC simple”. Consta de 15 elementos básicos para describir cualquier objeto de información. Estos se Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] presentan habitualmente divididos en tres grupos que indican la clase o alcance de la información incluida en ellos, y que responden a las expectativas que tiene el usuario cuando se enfrenta a la información de la Red. La clasificación de elementos de estructura de información que establece la ISO 15836 y su equivalencia con el Formato MARC 21 es la estructura de la información que actualmente se utiliza en la BUG para la descripción de los objetos digitales que forman parte del patrimonio bibliográfico de la Universidad de Granada. 13. Creación de los registros de autoridad (tanto de nombres personales y de nombres de entidades como de títulos y materias) a partir de los registros bibliográficos de acuerdo con el Formato MARC21 para registros de autoridad publicado 5 por la Biblioteca Nacional en 1999 o con la última versión del MARC21 format for authority data. El mismo proceso se llevará a cabo con los registros de fondos y localizaciones. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] Anexo II.- Registros de fondo antiguo TIPO DE DOCUMENTO NÚMERO DE DOCUMENTOS MANUSCRITOS(*) 2047 INCUNABLES(*) 58 IMPRESOS 1501-1800(*) 23.477 IMPRESOS 1801-1900(*) 23.842 IMPRESOS 1901- (*) 4.667 (*) Datos del Catálogo Colectivo de la Biblioteca de la UGR a 1 de abril de 2016 Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] Anexo III.- Perfil de metadatos METS El formato METS es un formato estándar para codificación y transmisión de metadatos. Está pensado principalmente para el envío de los ficheros, imágenes y objetos multimedia de una biblioteca digital. METS utiliza la estructura de etiquetas tipo XML. Un documento METS está compuesto por 7 secciones principales (no son obligatorias todas ellas): metsHdr (Mets Header). Información del documento METS: fecha y hora, nombre de la persona que lo crea, etc. dmdSec (Descriptive Metadata). Descripción del objeto al que se hace referencia en el documento METS. Los metadatos pueden estar definidos de dos maneras distintas: 1. En forma XML en un estándar distinto a METS, podría ser en Dublin Core o en MODS. La descripción en Gredos está hecha en Dublin Core Cualificado (DCQ) pero el formato que se visualiza es DC simple. 2. En cualquier forma textual, binaria pero codificada en Base64. admSec (Administrative Metadata). Contiene los metadatos administrativos sobre los ficheros que forman el objeto digital y el material fuente del que se han obtenido dichos ficheros. Existen cuatro formas principales de metadatos administrativos disponibles para su utilización en un documento METS: 1. Metadatos técnicos: información relativa a la creación, formato y características de utilización. 2. Metadatos sobre derechos y propiedad intelectual: copyright y licencias. 3. Metadatos sobre la fuente: metadatos descriptivos y administrativos de la fuente de la que se ha derivado el objeto digital. 4. Metadatos sobre el origen digital: información sobre las relaciones origen/destino entre los ficheros del objeto digital. fileSec (File groups) son los ficheros que comprenden la versión electrónica del objeto digital. Estos ficheros se agrupan en : por ejemplo podría haber distintos elementos para los archivos master, versiones pdf, versiones reducidas, etc. structMap (Structural Map) define la estructura jerárquica del objeto y nos permite navegar por él. smLink (Structural Links) se utiliza para indicar hiperlinks entre el estructural map. Behaviour Section se utiliza para asociar comportamientos ejecutables con los contenidos del objeto METS. Los metadatos de un objeto digital pueden realizarse o bien usando PREMIS como esquema básico o bien utilizando PREMIS como una extensión de METS, esta última opción está más extendida, y para lo que pueden utilizarse las recomendaciones Guidelines for using PREMIS with METS for exchange. "Using Premis with METS" refleja una serie de perfiles que especifican el uso de los metadatos PREMIS envueltos en un esquema METS y la relación con otras extensiones de metadatos que pueden coincidir total o parcialmente con METS (http://www.loc.gov/standards/premis/premis-mets.html). La versión 1.9 de METS hace una recomendación concreta para que se haga así. Cualquier sistema que reciba un paquete de Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] información procedente de un proceso de digitalización, por ejemplo, debe establecer sus requisitos mínimos y obligatorios, o bien haciendo referencia a alguno de los perfiles de METS existentes o bien desarrollando sus propios perfiles. La reciente publicación de PREMIS in METS Toolbox (http://pim.fcla.edu/) facilita considerablemente la tarea, pues se trata de herramientas de código abierto creadas por el Florida Center for Library Automation para la Library of Congress en 2009. Dirección y Servicios Centralizados Cuesta del Hospicio, S/N. 18071 Granada. Tfno.: 958 243053 Fax: 958 244058. Correo electrónico: [email protected] EJEMPLO METS Universidad de Granada. Biblioteca Universitaria 01028ntm a2200277 i 4500 ES-GrU tz 120425m18481862sp 000 m spa d UGR BRZ-LAL marc subfield code a Paso Delgado, Nicolás de marc subfield Agricultura y mejoras /