Full Transcript

Centro de Formación / www.auxiliardebiblioteca.com Academia Auxiliar de Biblioteca Digitalización. Preservación Digital Contenido registrado en la Propiedad Intelectual © El uso de este material para copia, distribución o venta está prohibido....

Centro de Formación / www.auxiliardebiblioteca.com Academia Auxiliar de Biblioteca Digitalización. Preservación Digital Contenido registrado en la Propiedad Intelectual © El uso de este material para copia, distribución o venta está prohibido. Gracias. Centro de Formación / www.auxiliardebiblioteca.com 1. La Digitalización. Objetivos de la digitalización El objetivo básico de la digitalización de documentos es la transferencia de la información a otro soporte distinto del original. El documento pasa de un estado analógico a uno digital o informático. Los documentos en formato informático, es aquella digitalizada con almacenamiento en soporte magnético u óptico. La información queda registrada por señales binarias; la calidad de las copias siempre es idéntica. La digitalización de documentos permite: Preservar los documentos originales del deterioro por su uso y generar copias de seguridad. Preservar sólo el contenido informativo. La tecnología digital permite capturar los valores de cualquier imagen al margen de su soporte, polaridad, dimensiones, etc. Cualquier imagen o conjunto de ellas puede ser estructurada en bases de datos y ser recuperada en nuevos formatos. Evolución El comienzo de la digitalización se dio debido a la necesidad del ser humano por almacenar y transmitir la información necesaria en distintos soportes. Antes de realizarse la digitalización tal y como la conocemos hoy en día, se crearon una serie de instrumentos modificados con el paso del tiempo explicados a continuación. En 1895 el instrumento utilizado se denominaba Telediágrafo, permitía transmitir las imágenes al formato digital por medio de métodos eléctricos. Su uso consistía en dibujar la imagen en una lámina de estaño empleando una tinta no conductora de gomalaca con alcohol, para posteriormente ser fijada en un rodillo que trabajaba como transmisor. Entretanto el receptor utilizaba un lápiz óptico sincronizado con el Telediágrafo, por lo que enviaba y recibía línea a línea la imagen que pretendía digitalizarse. Este proceso de digitalización podía costar hasta media hora. Posteriormente, con la llegada del Belinógrafo en 1913 la técnica utilizada mejoró notablemente, ya que se utilizaba una fotocelda para traspasar la imagen a través de la línea telefónico conocido como FAX. En los años 40 al construirse las primeras computadoras, simplemente se agregaban números para realizar múltiples cálculos. Ya en la década de los 80 se realizaban los primeros escáneres digitales, lo que en lugar de enviarse la imagen a fax se almacenaba en un PC. Estos primeros aparatos mencionados al capturar los documentos que pretendían digitalizarse contenían una deficiente resolución, pero con el avance de la tecnología y el paso del tiempo han mejorado notablemente hasta la actualidad, utilizando para el proceso de digitalización sistemas mucho más innovadores y eficaces. Clases y tipos Los diferentes tipos de documentos que podemos encontrar son materiales de soporte magnético y de soporte óptico de caracteres. Soporte óptico de caracteres (Optical Character Recognition) significa Reconocimiento Óptico de Caracteres (OCR). Es la tecnología que permite convertir imágenes de caracteres en letra de máquina, en caracteres capaces de ser interpretados o reconocidos por un ordenador. Obtiene como resultado final un archivo en un formato de texto editable, cuyos formatos de salida en los que se presentan estos archivos pueden ser variados (pdf, txt, etc.). Este procedimiento es utilizado en la informática como procedimiento para digitalizar un texto a través de un escáner. Centro de Formación / www.auxiliardebiblioteca.com Para poder realizar un reconocimiento de los caracteres, el software debe inspeccionar la imagen pixel a pixel buscando formas que coincidan con los rasgos de los caracteres. El soporte óptico permite analizar elementos del documento como (imágenes, tablas, texto, etc.) para su posterior digitalización. Este sistema revolucionó en su momento el mundo digital pudiendo evitar la introducción manual de los datos a un ordenador y reconociéndolos automáticamente. Con el paso del tiempo la técnica se ha ido perfeccionando con la evolución y mejora de su efectividad. En la actualidad el soporte óptico además de permitir mantener la estructura de los documentos originales en el archivo de salida reconoce caracteres contenidos en documentos manuscritos, diagramas, partituras, etc. A pesar de ello, debemos destacar que dispone de una efectividad limitada, debido a que deben realizarse posteriores revisiones y correcciones manualmente del texto escaneado. En la actualidad existe un sistema de reconocimiento óptico más avanzado denominado de ABBYY FineReader, basado en tres principios fundamentales IPA (Integridad, Intencionalidad y Adaptabilidad). Respecto a la utilización del OCR es aplicable en diversos ámbitos y sectores (Actividad Jurisdiccional, Centros de Documentación, etc.) para la digitalización de formularios, informes, documentos administrativos, etc. En el sector cultural, en la preservación del patrimonio el OCR digitaliza principalmente documentos históricos en soporte microfilm o papel. Entre las ventajas que presenta el soporte óptico de caracteres encontramos: Búsqueda y recuperación de documentos. Explotación de los documentos. Reducción de costes económicos Los inconvenientes que muestra son los siguientes: Escasez de conocimiento y expertos en las instituciones. Elevado coste de generar texto electrónico Deficiente digitalización de documentos históricos anteriores al siglo XIX. Las recomendaciones técnicas que deben plantearse para una mayor resolución de los documentos digitalizados con el soporte óptico de caracteres, es establecer una resolución mínima de 300 ppp en documentos de textos con tipos de letra claros y 600 ppp para documentos con letras pequeñas u originales de poca calidad (prensa). Soporte magnético. Esta categoría hace referencia los materiales audiovisuales, entre los materiales que pueden digitalizarse encontramos (Cintas de vídeo VHS, Beta, Vinilos, Cassettes, etc.). El proceso de digitalización consiste en la transcripción de señales analógicas en señales digitales cuyo objetivo es facilitar su procesamiento (comprensión, codificación, etc.), haciendo la señal derivada (digital) con menos ruidos e interferencias a las señales analógicas. El proceso de digitalización analógica está formado de cuatro procesos: Muestreo (sampling). Consiste en tomar muestras periódicas de la amplitud de la señal. La velocidad con que se toma esta muestra (el número de muestras por segundo), conocido como frecuencia de muestreo. Cuanto menor es el valor del periodo de muestreo mejor constituida queda la señal analógica. Retención (hold). Las muestras tomadas han de ser retenidas (retención) por un circuito de retención (hold), el tiempo suficiente para permitir evaluar su nivel Centro de Formación / www.auxiliardebiblioteca.com (cuantificación). Desde el punto de vista matemático este proceso no se contempla, ya que se trata de un recurso técnico debido a limitaciones prácticas, y carece, por tanto, de modelo matemático. Cuantificación. Mide el nivel de voltaje de cada una de las muestras. Consiste en asignar un margen de valor de una señal analizada a un único nivel de salida. Incluso en su versión ideal, añade, como resultado, una señal indeseada a la señal de entrada: el ruido de cuantificación. Codificación. Consiste en traducir los valores obtenidos durante la cuantificación al código binario. Hay que tener presente que el código binario es el más utilizado, pero también existen otros tipos de códigos que también son utilizados. Entre las ventajas que presenta el soporte magnético encontramos: Al presentar la señal leves alteraciones puede ser reparada y amplificada a través de sistemas de regeneración de señales. Dispone de sistemas de detección y modificación de errores. Facilidad para el procesamiento de la señal. La señal digital permite la multigeneración infinita sin pérdidas de calidad. Los inconvenientes que muestra son los siguientes: Debe realizarse primeramente una conversión analógica-digital y a continuación una decodificación. La transmisión de señales digitales requiere una sincronización precisa entre los tiempos del reloj del transmisor, con respecto a los del receptor. Al utilizar compresión con pérdida, es improbable reconstruir la señal original idéntica, pero permitiría una parecida dependiendo del muestreo tomado en la conversión de analógico a digital. Características técnicas La digitalización de documentos es un proceso el cual está muy normalizado y el cual debe hacerse bajo unas condiciones determinados y unos requerimientos básicos para una correcta digitalización, es por eso que necesita unas características técnicas determinadas, las cuales pueden depender del formato de origen del documento y la finalidad que se le vaya a dar a la copia digitalizada. Principalmente las características técnicas de los documentos digitalizados son: Imagen digital A diferencia de las fotografías ordinarias, las digitales están formadas por cadenas de bits, interpretadas por un ordenador, y que presenta una reproducción de la imagen en pantalla. La imagen digital, es dividida en una matriz de puntos a modo de cuadrícula. Cada uno de estos puntos recibe el nombre de píxel, que toma el valor binario 1 o 0 dependiendo de la luminosidad y el tono lumínico leído por el escáner. A cada píxel se le asigna un valor tonal que está representado por un código binario. Resolución digital La resolución de la imagen viene dada por el número de pixeles que tiene la imagen. Cuanto mayor sea este número mayor será la resolución. La medida de la resolución se determina por el número de píxeles leídos en una distancia lineal de una pulgada (2,54 cm) en el documento digitalizado. Centro de Formación / www.auxiliardebiblioteca.com Las resoluciones de escaneado más frecuentemente utilizadas en documentos blanco y negro son 200, 300 y 400 puntos por pulgada. En la digitalización de imágenes color de alta calidad, son típicas resoluciones de 1200 a 2400 puntos por pulgada. Profundidad de bits o resolución cromática La profundidad de bits especifica la cantidad de información de color que está disponible para cada píxel de una imagen. Cuantos más bits de información por píxel haya, más colores disponibles existirán y se podrá apreciar una mayor precisión en la representación del color. Las imágenes digitales se pueden digitalizar en blanco y negro, a escala de grises o a color. Para la digitalización en blanco y negro, a cada pixel un bit, bien de valor 0 bien de valor 1, correspondiendo al blanco y al negro. Para una escala de grises se aplican 8 bits a cada píxel, de modo que la imagen digital resultante sea capaz de representar 256 valores o tonos de grises. En el caso de las imágenes en color, utilizando 24 bits se obtendrán 16,7 millones de colores. Tamaño del fichero El tamaño del fichero se calcula multiplicando el área de superficie (ancho por alto) del documento a digitalizar (en pulgadas), por la profundidad en bits (en bits/píxel) y por el cuadrado de la resolución. Dado que el tamaño del archivo se representa en Bytes (8 bits), dividiremos el resultado por 8. Compresión La compresión se utiliza para reducir el tamaño del fichero de imagen para su almacenamiento, su procesamiento y transmisión. El tamaño del fichero para las imágenes digitales puede ser muy grande, lo que requiere mayores recursos informáticos para su almacenamiento, procesamiento y transmisión. Existen dos sistemas de compresión: los sistemas de compresión sin pérdidas y los sistemas de compresión con pérdidas. Los sistemas de compresión sin pérdidas reducen el código binario pero sin desechar o suprimir ninguna información, los sistemas de compresión con pérdidas sacrifican parte de la información original con el objetivo de conseguir una mayor compresión y, por tanto, un archivo final de tamaño más reducido. Formatos de ficheros Existen diferentes formatos de ficheros de imágenes en el mercado. Cada uno con sus características específicas, sus ventajas e inconvenientes, algunos ejemplos son: ✓ BMP (Windows Bitmap) ✓ GIF (Graphic Interchange Format) ✓ TIFF (Tagged Image File Format) ✓ JPEG (Joint Photographic Experts Group) ✓ PDF (Portable Document Format) ✓ SVG (Scalable Vector Graphics) ✓ PNG (Portable Network Graphics) ✓ RAW Centro de Formación / www.auxiliardebiblioteca.com Proceso La clave del proceso de digitalización es el compromiso entre el dispositivo de captura y el reproductor para que el resultado represente la fuente original con la mayor fidelidad posible. La digitalización suele ocurrir en dos partes: Discretización y Cuantificación, estos pueden ocurrir al mismo tiempo, aunque son conceptualmente distintos. Todo proyecto de digitalización, en general, debe contemplar tres aspectos fundamentales: Los objetivos que se quieren lograr El ámbito de aplicación de aplicación La responsabilidad de las partes involucradas También deben de tenerse en cuenta tres fases diferente, pero estrechamente ligadas en tres sí: Fase archivística: preparación de la digitalización de documentos según las reglas archivísticas. Fase tecnológica: aplicación de reglas ligadas a la tecnología de la digitalización. Fase legal: cumplimiento de las prescripciones legales para garantizar el valor de los documentos digitalizados. En el caso específico de digitalizar documentos con origen en formato papel el proceso tiene que realizar: Captura con escáner del documento físico. Indexado de la información extraída del documento. Almacenamiento del documento y la información para una posterior búsqueda. Fases del proceso Antes de empezar a digitalizar, se debería realizar un documento donde se plasmen los criterios que vamos a emplear para la digitalización, de gran utilidad si cambian los equipos que lo desarrollan. En el proceso de digitalización de documentos se deben de tener en cuenta ciertas pautas para normalizar dicho proceso en los archivos: Reunir toda la información a procesar Eliminando todos los elementos que no sean el documento en sí mismo. Consideraciones de la descripción Seguidamente a la selección de los documentos y previamente a la digitalización, se deben comparar y actualizar las descripciones archivísticas del material objeto de la digitalización. Para poder identificar la documentación digitalizada se deberá registrar como mínimo la información de los elementos obligatorios de ISAD (G). Sin embargo, si se observa algún deterioro físico en el documento original, se hará constar en el área, no obligatoria de “Condiciones de acceso y uso”. Igualmente se hará constar las cuestiones relativas a las restricciones de acceso cuando sea preciso. A los elementos obligatorios, se le suman, para su inclusión como metadatos, los elementos: Archivo que custodia la documentación. Serie documental a la que pertenece Centro de Formación / www.auxiliardebiblioteca.com Responsable de la digitalización Fecha de la digitalización Preparación de los orígenes También previamente a la digitalización se comprobará que no existan documentos duplicados, que estén libres de elementos que puedan obstaculizar la digitalización (grapas, gomas, etc.) y de que estén convenientemente ordenadas. Si el documento a digitalizar es una unidad documental compuesta, se recomienda foliar el original a lápiz previamente a la digitalización. Condiciones de visualización y calibración del monitor Es necesario controlar el entorno de visualización, teniendo en cuenta que el monitor (mejor con poca luz) y el documento original (mejor con mucha luz) requieren condiciones de visualización diferentes. También se deben considerar las “condiciones humanas”, ya que sería conveniente que las imágenes se evaluaran bajo las mismas circunstancias. Hay que tener en cuenta también la calibración del monitor, ya que las imágenes pueden verse diferentes en distintos monitores. El método ideal es utilizar hardware de calibración de monitor y el software adjunto. Obtención de las imágenes Es necesario determinar el dispositivo de captura de la imagen más adecuado a la documentación para así garantizar la integridad y la calidad de las imágenes digitales. Por último, se comprobará que el número de páginas digitalizadas sea igual al de imágenes digitales resultantes del proceso de digitalización. Control de calidad de la imagen Para el control tonal y de color se recomienda incluir en los ficheros maestros escalas o cartas de colores, que sirven para conseguir un mayor control sobre los resultados de un proceso fotográfico, normalmente se incluyen dentro de la propia imagen que se va a reproducir. Para el control de la resolución y estar dentro de las normas del índice de calidad (QI), se emplea la carta MIRA TEST ISO CHART Nº2, utilizada en la microfilmación. En el caso de usar cámaras digitales tenemos que saber cuál es la resolución óptica de partida que ofrece el sensor de nuestra cámara. Para ello deberíamos conocer los píxeles que ofrece. Además hay que tener en cuenta las siguientes consideraciones: Durante todo el proceso de digitalización es necesario efectuar controles de calidad. El proceso de digitalización estará supervisado por un técnico en imagen digital. La supervisión se realizará a partir de la visualización de la imagen en el monitor o bien desde la operación matemática del índice de calidad (QI) para la escala de grises y color. El tamaño del archivo digital, el tipo de archivo y la resolución de captura dependerán de las características de los originales a reproducir. Se efectuarán ensayos de acceso a los ficheros con el fin de establecer un equilibrio entre calidad visual aceptable para el usuario y el tamaño del fichero, de manera que el tiempo de captura sea amable. La captura digital de originales de gran formato se realizará para la copia de conservación en formato TIFF, utilizando un sistema de cuadrícula. Para la difusión de estos formatos se realizará una captura general con una resolución óptima en sistema de compresión JPEG o PNG, y se dividirá en coordenadas. Cuando se realicen capturas con un sistema de compresión, se optará por el grado de compresión que garantice que la calidad de la imagen sea óptima y la pérdida de información mínima. Centro de Formación / www.auxiliardebiblioteca.com En las imágenes digitales obtenidas se incorporarán los metadatos adecuados de control. La capacidad mínima de captura del sensor será de 6000 píxeles en escala de grises y color RGB. Podrán realizarse todos aquellos procesos encaminados a la mejora y optimización de la imagen captada bajo las directrices del responsable técnico que supervise los trabajos. Tratamiento de las imágenes Una vez escaneados los documentos, se deberá verificar que las imágenes digitales estén correctamente alineadas, que no tengan imágenes añadidos, que sean una representación exacta de la unidad documental, que sean visibles y legibles y que tengan un índice de calidad. Si estas premisas no se cumplen se deberá realizar el tratamiento de optimización de las imágenes. Una vez realizada la digitalización se revisará cada una de las imágenes de cada fichero, subsanando las deficiencias detectadas. Una vez revisado se deberá conservar un “fichero maestro” o Copia de conservación (Son reproducciones digitales de alta calidad realizadas con fines de preservación, en formatos RAW o TIFF sin compresión agresiva que afecte a la calidad de la imagen) de todos los documentos digitales y una copia de consulta. Creación de los ficheros de consulta y ficheros de divulgación A partir de cada fichero maestro deberá crearse un fichero de consulta en formato PDF (documentación encuadernada), JPG o PNG (documentación suelta). Estos ficheros de consulta se pueden hacer bien por defecto o bien por demanda. Marca de agua Las copias digitales obtenidas deberán ir convenientemente provistas de una marca de agua visible, que identifique el Archivo de procedencia/la institución que custodia los documentos originales. Los ficheros maestros (TIFF/PDF) no llevarán inserta en ningún caso marca de agua. Se debe tener en cuenta que, la marca de agua es un elemento inserto en la imagen que puede ser fácilmente eliminado si se dispone de los medios necesarios. Por tanto, más confiable resulta, la información registrada en el metadato “responsable de la digitalización” ya que en dicho elemento se consignará la persona e institución responsables de dicha digitalización. Almacenamiento y soportes de conservación Se deben elegir como soportes de almacenamiento de las imágenes digitales aquellos que ofrezcan una mayor garantía para la conservación y preservación inalterable de la información. Las imágenes estarán archivadas en una estructura jerárquica de carpetas, reflejando el esquema de organización de los fondos dentro del Archivo de procedencia. Esta estructura aparecerá duplicada, una de ellas destinada a las imágenes de conservación y otra para las de consulta. Los responsables de la custodia de las copias comprobarán periódicamente la legibilidad de todos los soportes en los que se han alojado las copias digitales. Ventajas e inconvenientes de la digitalización a) Ventajas Rápido acceso a múltiples usuarios en todo el mundo Las imágenes pueden rehacerse y mejorarse electrónicamente Centro de Formación / www.auxiliardebiblioteca.com Se pueden obtener copias de alta calidad La recuperación automatizada facilita la búsqueda de la información Las imágenes pueden reproducirse muchas veces sin pérdida de calidad Las imágenes digitales no se deterioran con el uso. b) Inconvenientes Gran inversión para sustentar las tecnologías de conversión y recuperación de registros Faltan estándares en muchas áreas El almacenamiento digital no ofrece características de permanencia: necesita revisión continúa y una transferencia periódica Los sistemas de recuperación se vuelven obsoletos Aunque en disminución progresiva, los costos de producción y almacenamiento son altos El tiempo y los costos para capturar y almacenar imágenes de alta resolución aumentan a medida que aumenta su calidad. Reproducir en color es más costoso. 2. La Preservación digital La UNESCO nos dice que La preservación digital consiste en los procesos destinados a garantizar la accesibilidad permanente de los objetos digitales. Para ello, es necesario encontrar las maneras de representar lo que se había presentado originalmente a los usuarios mediante un conjunto de equipos y programas informáticos que permiten procesar los datos. Para lograrlo, es necesario que la comprensión y la gestión de los objetos digitales se realice considerándolos desde cuatro puntos de vista: como fenómenos físicos, como codificaciones lógicas, como objetos conceptuales comprensibles para el ser humano y como conjuntos de elementos esenciales que deben ser preservados para ofrecer a los futuros usuarios lo esencial del objeto. La preservación digital puede definirse como el conjunto de los procesos destinados a garantizar la continuidad de los elementos del patrimonio digital durante todo el tiempo que se consideren necesarios. La mayor amenaza para la continuidad digital es la desaparición de los medios de acceso. No puede decirse que se han conservado los objetos digitales si, al haber dejado de existir los medios de acceso a ellos, resulta imposible utilizarlos. El objetivo de la preservación de los objetos digitales es mantener su accesibilidad, es decir, la capacidad de tener acceso a su mensaje o propósito esencial y auténtico. La preservación digital supone la selección y puesta en práctica de un conjunto evolutivo de estrategias con objeto de lograr el tipo de accesibilidad anteriormente mencionado, considerando las necesidades de preservación de las diferentes capas de los objetos digitales. Estas estrategias abarcan: Colaborar con los productores (creadores y distribuidores) para aplicar normas que prolonguen la vida efectiva de los medios de acceso y reduzcan la variedad de problemas desconocidos que deben ser tratados Centro de Formación / www.auxiliardebiblioteca.com Reconocer que no es realista tratar de preservar todo y que hay que seleccionar el material que debe ser preservado Guardar el material en un lugar seguro Controlar el material utilizando metadatos estructurados y otros documentos que faciliten el acceso y ayuden durante todo el proceso de preservación Proteger la integridad y la identidad de los datos Elegir los medios apropiados para proporcionar acceso pese a los cambios tecnológicos Administrar los programas de preservación para que alcancen sus objetivos de manera económica, oportuna, global, dinámica y responsable. Introducción a la Preservación digital La primera evidencia conocida es de escritura –signos pictóricos sobre tablillas de arcilla secadas al sol– data de aproximadamente seis mil años atrás. Desde la antigüedad hasta el presente, la escritura ha experimentado una evolución sostenida, dando origen a una de las paradojas más grandes de la historia: nuestra capacidad de registrar información ha aumentado exponencialmente con el tiempo, mientras que la longevidad de los medios utilizados para almacenarla ha disminuido de manera equivalente. Así, aún son legibles los fragmentos de papiro de escritura egipcia de hace 4.500 años o manuscritos y otros documentos de la época medieval, pero la durabilidad del moderno papel es bastante menor. El primer desafío mundial en tema de preservación documental surge por la extraordinaria fragilidad de los libros impresos a partir de la segunda mitad del siglo XIX, a causa del elevado grado de degradación del papel fabricado con madera, llamado también papel friable. Este problema se dio a conocer a mediados del siglo XX y recibió el nombre de "fuego lento" -slow fire-, porque era tan letal para los libros como los incendios, pero a un ritmo más lento. La lección no fue aprendida, y durante el siglo XX continúan decayendo la permanencia, durabilidad y resistencia de los nuevos medios de registro, como por ejemplo el de una cinta magnética, que puede quedar ilegle sólo treinta años después de su fabricación. El medio de registro más reciente – el disco óptico– puede alcanzar una vida más prolongada, sin embargo, esto tampoco garantiza su perdurabilidad, y es que es probable que los actuales medios ópticos de almacenamiento superen ampliamente la vida útil del sistema informático que lo creó. De lo anterior podemos concluir que nos encontramos ante un nuevo paradigma en preservación: tradicionalmente, la conservación del documento físico equivalía a la conservación de la información que contenía, y por tanto, garantizaba su usabilidad, sin embargo en los documentos digitales preservar el soporte es condición necesaria, pero no suficiente: hay que considerar otras cuestiones, tanto de conservación como de usabilidad: La fiabilidad e integridad de la información, ya que la grabación de datos digitales no se hace en un soporte fijo y los datos se pueden reproducir, alterar o borrar con gran facilidad; la obsolescencia de los soportes digitales, que han de ser renovados con cierta frecuencia; la necesidad del entorno informático original u otro que pueda interpretar la cadena de bits que contiene la información; y la necesidad de que los usuarios sepan utilizarlo. Esto ocurre con gran parte de los contenidos que se producen en el mundo, y que pueden ser desde composiciones artísticas hasta datos personales, pasando por los resultados de la actividad de organismos públicos y privados o pensamientos y sentimientos de seres humanos. Muchos de ellos tienen un interés histórico, científico o cultural y conviene conservarlos para que sean conocidos y utilizados por nosotros y por las generaciones que nos sucedan, ahora bien, la extensa variedad de formatos - texto, bases de datos, grabaciones sonoras, películas, Centro de Formación / www.auxiliardebiblioteca.com imágenes,... - la volatilidad, la obsolescencia técnica, el deterioro físico y la inestabilidad de Internet, entre otras muchas causas, constituyen un gran riesgo para este conocimiento acumulado, poniendo de manifiesto la necesidad de llevar a cabo una actividad de preservación responsable por parte las instituciones. Para los organismos que tienen a su cargo el acopio y la preservación del patrimonio digital cultural, “se ha convertido en un problema apremiante definir qué elementos deben conservarse para las generaciones futuras y cómo proceder en su selección y conservación”. La necesidad de salvaguardar esta forma relativamente nueva de patrimonio documental requiere un consenso internacional sobre su acopio, preservación y difusión, y así algunas instituciones inician proyectos, elaboran normativas o crean directrices que sientan las bases para que esta nueva forma de patrimonio no desaparezca en silencio. Algunos ejemplos de ello son los proyectos NEDLIB, DigiCult,4 PADI, Kulturarw3, o Patrimonio.es; la resolución 2002/C 162/02 del Consejo de Europa: Conservar la memoria del mañana; o la Carta sobre la preservación del patrimonio digital de la UNESCO Propiedades de la Preservación Digital Para conservar los objetos digitales es necesario que su comprensión y gestión se realice desde su singularidad, que combina el fenómeno físico con las codificaciones lógicas. Por ello, a la hora de la preservación digital vamos a encontrar puntos comunes con su hermana la preservación analógica, pero también características propias derivadas de su naturaleza: Se trata de una serie de actividades encaminadas a un mismo fin, y no sólo de técnicas aisladas, es decir, no vale de nada conservar un fichero si no se garantiza que luego se pueda acceder a él para utilizarlo. Por ello, hay que llevar a cabo tareas que comprenden – además de los procedimientoss técnicos– la planificación y la gestión de los recursos Su finalidad es la futura utilización de los documentos. La garantía del futuro uso del recurso digital representa un reto mayor que solamente mantener la cadena de bits. Se pretende preservar la información en vez del documento físico: “La preservación a largo plazo implica la provisión de acceso indefinido a los documentos o, como mínimo, al contenido de éstos", aunque numerosos expertos recomiendan que se mantenga también la cadena de bits original. Voluntad de mantenimiento a largo plazo, mediante nuevas operaciones de tratamiento si éstas fueran necesarias en el futuro. Un informe sobre las necesidades de preservación digital en el Reino Unido define "largo plazo" aplicado a documentos digitales como un periodo de más de veinte años. Amenzas a la integración de los documentos digitales Los valores esenciales a preservar en un documento electrónico son la fiabilidad, la autenticidad, la integridad, la identidad de las personas que han creado o trabajado en el mismo y la capacidad de uso y acceso para los humanos. La volatilidad y virtualidad de la información digital y su dependencia de programas y máquinas informáticas para el acceso y la decodificación hacen que estos valores puedan alterarse por una serie de problemas reales o potenciales: La obsolescencia tecnológica: Debido a la rápida evolución tecnológica los recursos digitales pueden quedar "huérfanos", es decir, inutilizables por falta de todos o alguno de los elementos informáticos – hardware, software o soportes físicos - de su entorno original. Este concepto no significa que dichos elementos hayan dejado de funcionar, sino que ya no se puede acceder a ellos e interpretarlos o hacerlos funcionar. Un claro ejemplo lo constituye la desaparición de los disquetes de tres pulgadas y media. En la actualidad ningún fabricante de ordenadores proporciona de serie un dispositivo capaz de leer y de escribir en dichos discos; y aunque aún es posible solicitar una disquetera externa a Centro de Formación / www.auxiliardebiblioteca.com algunos fabricantes, es un artículo difícil de encontrar, y cada vez lo será más. Por ello, se hace necesario la migración de los datos a otros soportes tecnológicos actuales. La degradación de los soportes. La "fragilidad" o inestabilidad del soporte, debida tanto a factores internos como a factores externos, pueden conducir, tarde o temprano, a la pérdida de la información grabada en él. Los factores internos se asocian a la propia composición de los materiales de los soportes ópticos o magnéticos. Estos soportes envejecen y se deterioran, perdiéndose información o produciéndose errores de lectura. Entre los factores externos que pueden afectar a la degradación de los soportes, destacar las fluctuaciones elevadas de temperatura y de humedad. Para ayudar a comprender como puede llegar a perjudicar a la esperanza de vida de los soportes ópticos y magnéticos, se adjunta la siguiente tabla que refleja la degradación del soporte como consecuencia del incremento de temperatura y de humedad relativa (Jones y Beagrie, 2001, pág.130): Soporte / Hum. rel. 25 h. r. 30 h. r. 40 h. r. 50 h. r. 50 h. r. Soporte / Temp. 10º C 15º C 20º C 25º C 28º C DLT cinta magnética 75 años 40 años 15 años 3 años 1 año CD / DVD 75 años 40 años 20 años 10 años 2 años CD-ROM 30 años 15 años 3 años 9 meses 3 meses Además la IFLA proporciona unas recomendaciones generales y particulares para facilitar la conservación y el manejo de los diferentes soportes para su conservación, que se muestran en la siguiente tabla simplificada: - Evitar tocar la superficie, y emplear guantes sin pelusa si fuera necesario - Generales - Almacenar en áreas limpias sin polvo, humo ni elementos magnéticos - Guardar el soporte en posición vertical, empleando cajas especiales para ello - Limpiar suavemente desde el centro hacia los bordes del disco - Discos ópticos - Limpiar con pistola de aire o en su defecto, con un papel de tisú no abrasivo - Siempre emplear marcadores suaves de punta de fieltro sin disolventes - Rebobinar las cintas siempre después de cada uso - Cintas magnéticas - Avanzar y rebobinar las cintas periódicamente Centro de Formación / www.auxiliardebiblioteca.com - Girar las cintas anualmente Datos fácilmente alterados o destruidos. Debido a errores humanos, al mal funcionamiento de los sistemas o a acciones mal intencionadas, los datos pueden ser eliminados o falseados. Además, también existe el riesgo de que la información se pierda debido a la falta de control de las versiones de un recurso. Políticas de Preservación Digital Aún existiendo capacidad técnica y voluntad, no es realista preservar absolutamente todo. Los recursos son limitados y obligan a las instituciones a establecer políticas de preservación bien definidas económicamente y que determinen una colección formada por los datos cuyo interés social e intelectual sea mayor, en función de las necesidades y recursos de la institución, de los intereses de sus usuarios y de aspectos físicos e intelectuales.Para ello nos podríamos plantear las siguientes preguntas: ¿Cómo debemos preservar el documento? Debemos decidir entre preservar esencialmente el contenido, incluso mejorar la legibilidad o utilidad mediante las tecnologías disponibles en el momento de su recuperación o mantener el aspecto y comportamiento original, con las limitaciones que esto pueda representar. ¿Qué recursos debemos preservar? En primer lugar deberemos tener en cuenta la obligación legal, y después consideraciones como el valor intrínseco del material, si el material se ajusta a la política de selección, si otra institución ha asumido ya la responsabilidad, su estado físico, el uso actual y potencial, la relación coste efectidad del tratamiento, etc. En general se prioriza en este orden: 1. Documentos nacidos digitales. 2. Documentos digitalizados sin versión analógica. 3. Documentos digitalizados con versión analógica. ¿Cuándo hay que iniciar el tratamiento? Cuanto antes mejor. El abandono benigno en los documentos analógicos podía no ser excesivamente dañino, pero en los digitales es letal. Son necesarias soluciones preventivas que detecten la amenaza antes de que el daño se haya producido y vigilancia continuada tanto en el documento como en los metadatos. Se recomienda tener en cuenta la preservación desde el mismo momento de la creación del documento, mediante una adecuada selección de los formatos, soportes y metadatos. ¿Quién se implicará en el proceso de preservación? Ante la dificultad de la labor, es muy importante seleccionar a profesionales con los conocimientos y aptitudes adecuados, que asuman claramente su responsabilidad y que puedan responder de forma ágil y eficiente a los nuevos retos que indudablemente surgirán. Para garantizar el éxito de los esfuerzos de la preservación digital se requerirá un nivel más elevado de implicación institucional que suele matizarse en los dos conceptos siguientes: La viabilidad institucional (institutional viability): la transición requerirá la capacidad técnica, económica y material para asumir las nuevas competencias. La sostenibilidad económica (economic sustainability): La capacidad de sostener el nivel de apoyo necesario-sobre todo el económico-en el futuro. Cabe recordar que actualmente los factores institucionales, no los tecnológicos, se consideran el principal obstáculo para el avance de la preservación digital. Estrategias de Preservación Digital La preservación de un fondo tradicional se diseñaba sobre la base de conservar el material lo más inalterado posible. Por el contrario los documentos digitales deben ser modificados y Centro de Formación / www.auxiliardebiblioteca.com transformados continuamente para que continúen siendo accesibles e inteligibles: Se trata de preservación por alteración, a través de métodos como los que se detallan a continuación: Refresco Es la transferencia de los datos de un soporte a otro nuevo para reducir el riesgo de la pérdida de datos debida a la degradación lógica por el uso y el paso del tiempo. Se efectúa sin producir cambio alguno en el software o el formato, es decir, no es una solución contra la obsolescencia tecnológica, ya que el continente se renueva sin alterar el contenido, aunque en ocasiones el refresco coincide con un cambio generacional del soporte, como cuando se pasa información de cintas o discos originales a modelos actuales. La frecuencia con la que se realiza el refresco varía según la política institucional y el tipo de soporte, pero siempre debería realizarse dentro del plazo recomendado por el fabricante. Metadatos Se pueden crear los metadatos durante la producción de los documentos o simplemente crear unos básicos con la posibilidad de ampliarlos. Existen dos tipos de metadatos: Descriptores de objetos (permiten su recuperación). De conservación (describen como acceder a los datos) con dos tipos de información necesaria: De contenido: detalles sobre como representar el formato del documento (estos metadatos de representación cambian y se actualizan). Descriptiva: incluye identificadores y detalles bibliográficos, propietarios, historia, validación de formatos y nexo con demás formatos. Preservación de la tecnología Consiste en el mantenimiento de la máquina con la que fueron creados los documentos, incluyendo software, hardware, etc. No es una solución válida ya que con el paso del tiempo este mantenimiento se verá dificultado por la falta de recambios y avances tecnológicos que harán que dicho ordenador quede obsoleto. Migración Es la estrategia más utilizada hoy en día. Este método consiste en convertir los documentos almacenados a nuevos formatos con el fin de no perder la información que contienen. Mediante este proceso se mantienen las características esenciales de los datos, aunque se pueden producir pequeños cambios que con el paso del tiempo y la acumulación de migraciones pueden verse amplificados. Por éso, se convierte en un proceso poco fiable si se utilizaron componentes muy específicos de software, lo que conlleva una incompatibilidad entre sistemas. La migración también puede utilizarse en la extensión o formato de los documentos, por ejemplo, trasladar un documento en formato Microsoft Word 95 a uno Microsoft Word 97/2000/XP, para aumentar su funcionalidad. Existen diferentes variedades de migración: Migración sobre la demanda: se trata de separar el código binario de su entorno y soporte original en el momento en el que se deposite el recurso. Junto con esta cadena de bits, se guardan los metadatos técnicos que especifican cómo debe migrarse a otros entornos. De ese modo el centro evita tener que realizar migraciones periódicas de toda la colección para poder concentrar los esfuerzos y recursos en los documentos con una demanda constatada. Aunque mediante este método se ahorran los esfuerzos de las migraciones periódicas, al mismo tiempo se requiere mayor dedicación en la presentación y la actualización de los metadatos técnicos Centro de Formación / www.auxiliardebiblioteca.com que han de ser modificados paralelamente a la evolución de la tecnología (Cedars guide to digital preservation..., 2002). Migración a un formato estándar: se refiere a la migración del documento original a un formato neutral o estandarizado, con una mayor duración prevista. Por ejemplo, muchos centros pasan los documentos textuales de diferentes formatos a XML, PDF u otros formatos abiertos. Por esta razón y por contar, como consecuencia, con un mayor número de usuarios, se prevé que estos formatos tendrán una vida más larga que un formato propietario. En una medida parecida, algunos depósitos sólo admiten determinados formatos. De esta manera, los depósitos pueden centrar sus esfuerzos y recursos en la gestión del fondo digital en vez de desperdigarlos en procesar unos formatos minoritarios. Algunas instituciones incentivan o incluso obligan a los autores a utilizar formatos estándares para la creación de documentos. En cambio, otras asumen la responsabilidad de convertir el fichero a un formato estandarizado en el momento de ingresar el documento. Migración sucesiva o conversión en serie: mediante esta técnica (conocida en inglés como serial conversion y también Backward compatibility) se actualizan los documentos con cada cambio incremental del software, sea necesario o no la operación interna. Es obvio que cuando se introducen nuevas versiones de software es justamente cuando existe mayor motivo por parte de los fabricantes para facilitar la conversión. De esta manera, se corre el riesgo de perder la oportunidad cuando el formato esté a punto de desaparecer y existan menos facilidades para realizar la migración. La migración tiene varios inconvenientes, entre los más importantes destacan los siguientes: No se puede evitar la alteración del documento original. Esta alteración puede afectar a la estructura, al contenido, a la apariencia y a la funcionalidad en mayor o menor grado. Por la inevitabilidad de algunas alteraciones, los procesos seguidos durante la migración han de ser documentados mediante los metadatos técnicos, igual que cualquier efecto que hayan producido en el documento. De este modo los futuros usuarios sabrán qué diferencias existen entre el documento original y la versión recuperada. No es muy adecuado para los objetos digitales que contienen una variedad de formatos, ya que cada uno de éstos necesitará recibir un tratamiento diferente, lo que hace muy difícil la automatización del proceso. Actualmente la catalogación tradicional no capta con exactitud la presencia de los diferentes elementos incorporados en el documento, lo que dificulta aún más la migración de cada formato en el momento oportuno. Se enumeran a continuación las principales ventajas de la migración: Es una operación muy experimentada. No se requieren conocimientos técnicos muy especializados. Se puede automatizar una parte de los procesos. La tendencia hacia la estandarización de software y formatos facilitará la migración. Convierte el documento a un formato compatible con sistemas actuales. Entre sus inconvenientes se destacan los siguientes: Es difícil programar la migración para objetos digitales complejos. Altera el documento con el riesgo de la pérdida de elementos importantes. Debe repetirse periódicamente a lo largo de la vida del recurso. Centro de Formación / www.auxiliardebiblioteca.com Emulación La emulación permite simular el comportamiento del software original con el que se crearon los documentos digitales, de forma que puedan ejecutarse y utilizarse pudiendo prescindir del programa de origen. Los partidarios de la emulación creen que esta estrategia ofrece la mejor solución para preservar recursos digitales más complejos, ya que es la única que garantiza la recuperación del documento original sin las inevitables alteraciones que ocurren en la migración. Jeff Rothenberg, el principal defensor de esta estrategia, argumentaba que la emulación era la única manera capaz –al menos en teoría– de garantizar la conservación de los datos junto con sus elementos esenciales, en lo que se refiere tanto a su apariencia como a su funcionalidad "de manera coherente, automática y homologable para diferentes tipos de documentos El problema es que este proceso requiere el mantenimiento de una cantidad de información considerable - emulador, SO, aplicación y datos - y por otro lado conservar los emuladores de cada software no tiene sentido, ya que también se quedarían obsoletos. Además, diferencia de la migración, la emulación no está tan experimentada y requiere unos conocimientos informáticos muy avanzados. Replicado (copia de seguridad) Basado en la realización de duplicados de los datos almacenados. Esta técnica no puede trasladarse a un largo periodo de tiempo, ya que, suele utilizarse en pérdidas de datos debidas a fallos en la computadora, ya sea por causas técnicas o ajenas (como virus), o fallos en el hardware. Suele utilizarse en centros de procesamiento de datos o en situaciones domésticas para evitar la pérdida de estos datos importantes. Lo que se olvida es que los métodos de almacenamiento también quedan obsoletos, por lo que debe realizarse un rejuvenecimiento y una transferencia a nuevos medios. Arqueología digital La arqueología digital es una técnica que recupera informaciones dañadas, con pérdidas o demasiado antiguas, a causa de un mal trato de los datos (refiriéndose a conservación, etc). Preservación en línea Algunos expertos proponen esta opción frente al almacenamiento de la información en soportes físicos por el coste de los dispositivos de almacenamiento en línea, bastante menor, y por la utilización de formatos como el HTML y el XML, que se prevén más duraderos que los formatos de programas de propiedad, y además se actualizan sobre la marcha de manera natural. Sus inconvenientes serían que no se elimina la necesidad de realizar migraciones, sólo se aplaza, y tampoco se evita el riesgo de destrucción física de un archivo almacenado en un único servidor. Combinación de estrategias Comúnmente, pueden ser necesarias varias estrategias para abarcar toda la variedad de objetos y características que se deben preservar. Además, los programas de preservación deben considerar asimismo las posibles ventajas de la redundancia y aplicar más de un tipo de actuación, ya que una sola estrategia, aunque esté bien planificada, puede fallar y dejar el documento inservible. Así, por ejemplo, es conveniente considerar que un documento puede contener tanto texto como imágenes, objetos multimedia, etc. y ocuparse de los problemas de obsolescencia de cada elemento por separado, sin olvidarse, por otro lado, del deterioro de los soportes. Implementación Los documentos o imágenes digitales están formados por un conjunto de píxeles distribuidos en un número predefinido de filas y de columnas. Los archivos se transforman en mapas de bits mediante dispositivos electrónicos como escáneres o cámaras. En la transformación se adquiere una cierta resolución y posteriormente los datos se encapsulan en un formato de Centro de Formación / www.auxiliardebiblioteca.com almacenamiento. Todo esto hace que haya ciertos aspectos a tener en cuenta cuando ejecutamos un sistema de preservación digital. Conversión Los programas de digitalización capturan y presentan el formato digitalizado de todo el contenido del archivo transformado, de forma que quede concatenado en un solo documento o en una pequeña colección. Para determinar cuales son las partes importantes del documento se suele comparar la imagen o imágenes digitales con la original teniendo en cuenta la calidad, resolución con la que se transformó el documento, etc. Todo esto para determinar cual será la mejor forma de realizar la conversión, de la información que tenemos en soporte papel a digital, para su almacenamiento. Calidad Para garantizar que los datos digitales tienen la máxima similitud, sobre todo en rasgos importantes, con el documento original es imprescindible llevar un buen control de la calidad, para minimizar los errores (que podrían acumularse por diversas transformaciones sucesivas). No existe ninguna norma que estandarice este control de la calidad, ya que cada documento, requiere un trato distinto fundamentado en sus características más básicas. Tramitación de la colección La permanencia a lo largo del tiempo de una colección digital no solo depende de factores de calidad o de conversión, sino también de una buena gestión, por lo que se refiere, al almacenamiento acorado de los documentos o datos escaneados, mediante organización (ya sea por tamaño, nombre, etc.), nominación adecuada y una buena descripción de los datos. Para hacer una buena tramitación es preciso identificar cada uno de los archivos como único dentro del conjunto, acompañándolo de una buena descripción y si es preciso, por el uso de metadatos. Organización Previamente a la nominación y descripción de los documentos es necesario definir como van a ser almacenados. El método más habitual es organizar los datos tal y como lo haría la misma computadora, por lo que se tiene que tener en cuenta el avance tecnológico para evitar incompatibilidades entre máquinas, asegurando que la colección pueda preservarse y asimismo, crecer. Caracterización Los ordenadores no son capaces de relacionar documentos por su contenido, es decir, no son capaces de identificar que rasgos son comunes entre dos o más archivos. Hay dos modos de caracterizar o identificar las imágenes: Utilizando una numeración predeterminada que quede en memoria. Utilizando los nombres completos de los documentos. Para establecer la identificación de los documentos se adopta uno de los criterios, teniendo en cuenta que el elegido deberá utilizarse a lo largo de toda la colección sin posibilidad de cambio. Detalle Para llevar a cabo la descripción de cada documento es necesario el uso de los metadatos para facilitar la tramitación de la colección y el uso de los datos que esta contiene. Hay proyectos actuales que distinguen hasta tres categorías o tipos de metadatos: Descriptivos para descripción e identificación de las fuentes de información. Centro de Formación / www.auxiliardebiblioteca.com Estructurados para la navegación y presentación. Administrativos para la tramitación y el proceso. Según el proyecto o colección que llevemos a cabo utilizaremos un tipo de metadatos u otro. Modelo de Referencias OAIS(Open Archivas Information System) OAIS nació de la preocupación de la National Aeronautics and Space Administration (NASA), por la conservación y custodia de sus datos, al ser consciente de que errores en la custodia habían ocasionado la pérdida de datos originales. Fue desarrollado originalmente por la NASA con la ayuda de otras agencias aeroespaciales ante la preocupación por la conservación de sus archivos digitales. En enero de 2002 se publica como estándar del Consultative Committee for Space Data Systems CCSDS650.0-B-1 y, finalmente, al año siguiente el modelo terminó convirtiéndose en la norma internacional ISO 14721:2003 Open Archival Information System (OAIS), actualmente existe una norma revisada y actualizada, la ISO 14721:2012. El modelo de referencia OAIS persigue una doble finalidad, conservar la información y facilitar a la comunidad el acceso futuro a la misma. Esta doble finalidad responde al hecho de que los soportes en los que se almacena la información digital tienen una vida muy corta y la información debe sobrevivir migrando a otros soportes o a otros entornos de software para que el acceso a la misma sea posible. Agencias aeroespaciales y preservación digital La preocupación por la preservación digital mostrada por las agencias aeroespaciales nacionales -ajenas al mundo de las bibliotecas- nace de las cantidades ingentes de imágenes y otra información digital generadas por los satélites y gestionadas por ellas para asegurar su recuperación y usabilidad en el futuro. Según la página web de la NASA, el telescopio espacial Hubble diariamente archiva entre 3 y 5 GB de datos y difunde entre 10 y 15 GB a astrónomos de todo el mundo. Esta web ofrece acceso libre a algunas de las imágenes más espectaculares captadas y que aportan vistas de la Tierra y de otros rincones del universo. Definición OAIS no muestra el diseño concreto de un programa, más bien ofrece una serie de pistas que sirven para estandarizar la forma en que los materiales a preservar deben ser gestionados, desde su ingreso hasta el acceso público. Estas pistas deben ser adaptadas por cada institución a sus propias necesidades. Es un modelo de referencia que pretende reducir los malentendidos, y según la propia definición del protocolo OAIS, un modelo de referencia es: “Un marco para la comprensión de las relaciones importantes entre las entidades de un mismo entorno y para el desarrollo de los estándares o especificaciones básicas que apoyan ese entorno. Un modelo de referencia se basa en un pequeño número de conceptos unificadores y puede ser utilizado como base para la educación y para explicar los estándares a alguien no especialista”. OAIS identifica las responsabilidades y componentes de un sistema centrado en archivar documentos digitales: Los actores: Productores, administradores y consumidores Los objetos o documentos procesados: El objeto que se pretende preservar se denomina “Paquete de información” (Information package) IP y en él se incluyen el objeto y sus metadatos. Las clases de paquetes de información según el área funcional en que se encuentran son: Centro de Formación / www.auxiliardebiblioteca.com SIP (Submission information package): Es el paquete tal como llega al depósito procedente de los productores, junto con sus metadatos, para ser incorporado al OAIS. AIP (Archival information package): Al SIP se le añade, como mínimo, la información necesaria para su gestión y preservación a largo plazo. DIP (Disemination information package): El paquete de información tal como se entrega al consumidor y contiene la información necesaria para que el consumidor pueda utilizarlo. Los procesos implicados: Procesos Según el modelo OAIS, un archivo digital debe componerse de seis procesos básicos, que podemos ver reflejados en el siguiente gráfico: Cuatro de ellos son actividades a las que se somete el material almacenado: Incorporación/ingesta (ingest): Los paquetes de información llegan desde los productores y, tras someterlos a diversos controles, se procede a su ingreso en el sistema de preservación. Almacenamiento/Almacén del archivo (archival storage): En este proceso, los ficheros de datos son almacenados en un soporte físico y se proporcionan los servicios necesarios para el almacenamiento, mantenimiento y recuperación. Gestión/Administración de datos (data Management): Se gestionan los metadatos de los ficheros: los originales, que formaban parte del IP, los que fueron creados en el proceso de ingesta y todos aquellos que se generen a lo largo de la vida de los ficheros. Acceso/difusión (access/disemination): Se da soporte a los consumidores para posibilitar la recuperación y acceso a la información preservada Y dos hablan del funcionamiento del depósito: Planificación para la preservación (preservation planning):En este proceso se deciden las políticas que se van a aplicar, se monitorea el entorno y se sigue una vigilancia tecnológica para detectar cuando un formato se vuelve obsoleto y proceder a la migración a un nuevo formato. La finalidad es asegurar que la información permanezca disponible en el futuro. Administración/Gestión del depósito (archive administration): Desde aquí se proporciona el soporte técnico a toda la operación global de preservación. Metadatos Para poder realizar la preservación de forma efectiva, OAIS reconoce dos tipos de metadatos: RI (Representation information): es la información necesaria para interpretar los datos técnicos del paquete de información y es lo que permitirá convertirlo a otros formatos y hacerlo recuperable PDI (Preservation description information): Esta información será la que posibilite la interpretación descriptiva que permita identificar y recuperar el contenido de la información durante un largo periodo de tiempo. Incluye datos referentes a los derechos de autor, restricciones de uso etc. Metadatos de representación y metadatos de preservación[ Siguiendo las recomendaciones del modelo de referencia OAIS los sistemas de metadatos de representación (RI) más populares son: Centro de Formación / www.auxiliardebiblioteca.com Dublin Core: es un sistema de descripción de recursos de información. Este estándar (ISO 15836:2003) se caracteriza por ser un sistema general, independiente, extensible y económico. Está formado por 15 elementos que se clasifican en tres grupos: Descripción del recurso: datos sobre las características bibliográficas del recurso, Propiedad intelectual: autor, editor de la obra e Instancia: fecha de creación, formato, tipo e idientificador (URL, DOI, ISBN). Todos los elementos son repetibles y opcionales y van precedidos de los caracteres DC. Existe un Dublin Core Simple y Dublin Core Calificado. Este segundo esquema es una ampliación del DC Simple y determina el significado de cada uno de los 15 elementos iniciales añadiéndole calificadores. Se pretende mitigar la generalidad de las propiedades principales del sistema para describir cualquier tipo de recurso electrónico. Marcxml: es la codificación de los registros MARC en XML para facilitar la captura e integración de estos registros en los procesos de recopilación propios de desarrollos OAI e incluir metadatos MARC en el texto completo de documentos codificados en XML. MODS: sistema XML para codificar metadatos e información bibliográfica. Basado en el MARC21 consta de 20 elementos principales que se subdividen en elementos más específicos para una estructuración del contenido más precisa. Son etiquetas alfanuméricas que posibilitan una descripción más detallada que el sistema Dublin Core pero menos compleja que el MARC. METS: sistema que codifica en formato electrónico el propio objeto digital. Además de contener los metadatos descriptivos añade metadatos administrativos y de gestión. Los mets son documentos XML que recogen la estructura de un objeto digital formado por varios archivos en distinto formato y la forma en la que se organizan estos archivos en el documento digital. El sistema de metadatos de preservación de objetos digitales (PDI) que destaca en el panorama bibliotecario es: PREMIS: Es el fruto de un grupo de trabajo miembros de la OCLC y RLG (Research Libraries Group) creado en 2003. Entre sus objetivos estaba crear un conjunto de metadatos para la preservación de objetos digitales que pudiera aplicarse a un sistema real y analizar otras soluciones para la codificación, almacenamiento e intercambio de registros. Los resultados más importantes de este equipo de profesionales fueron, por un lado el informe Implementing Preservation Repositories for Digital Materials: Current Practice and Emerging Trends in the Cultural Heritage Community (2004) y el Data Dictionary for Preservation Metadata (2005, última versión PREMIS 2.2 de julio de 2012). Este diccionario describe los metadatos esenciales para la preservación digital de cualquier formato de archivos y el esquema XML para su codificación. Este sistema divide los metadatos en cinco categorías: Entidad intelectual: detalla la tipología documental del objeto digital. Objeto: formato electrónico de la entidad intelectual. Se clasifican en cuatro tipos: bitstream, secuencia de bites; file, archivos; filestream, tipo de archivo (comprimidos, encriptados); representation, conjunto de archivos que representan al documento. Eventos: los distintos procesos que se llevan a cabo en un documento digital para su preservación (registro, almacenamiento, migración, etc.). Agentes: personas, instituciones o aplicaciones informáticas relacionadas con un evento. Derechos: permiso del autor de la obra para ejecutar las tareas que conlleva la preservación digital. Objetivos La implantación del modelo de referencia OAIS persigue los siguientes fines: Recibir información proveniente de organismos productores y que cumpla las condiciones establecidas para su incorporación al archivo. Fijar los criterios de selección de los contenidos que van a ser preservados, respetando los derechos de autor y favoreciendo el depósito de los materiales por parte de los productores. Centro de Formación / www.auxiliardebiblioteca.com Permitir el acceso público a la información que se preserva. Asegurar la comprensión de la información almacenada y preservada, por parte de los potenciales destinatarios de la misma, sin que éstos necesiten de ningún soporte para ello. Establecer procesos y políticas concretas que garanticen la preservación de los documentos frente a riesgos eventuales y la difusión de copias legales y auténticas de los mismos. Aspectos legales de la preservación Derechos de propiedad intelectual afectados[editar] Derechos morales. Corresponden al autor de una obra y se concretan en decidir su divulgación, de qué forma y si se hace bajo su nombre, seudónimo, o de manera anónima; reconocimiento de su autoría; respeto a la integridad de la obra, frente a deformación o alteración que pueda perjudicarle; modificarla, respetando derechos de terceros y lo establecido para bienes de interés cultural; retirada del comercio, previa indemnización a los titulares de derechos de explotación; acceso al ejemplar único o raro de la obra, si está en manos de otro, garantizando así su divulgación. Derechos de explotación. Corresponden también al autor, requieren su autorización y son la reproducción (fijación de la obra o de una parte, sobre cualquier soporte que sirva para comunicar y obtener copias), distribución (puesta a disposición del público de los ejemplares de una obra mediante venta, alquiler, préstamo o cualquier otra forma), comunicación pública (se produce cuando un conjunto de personas accede a la obra a través de una representación escénica, proyección, emisión radiofónica o vía satélite) y transformación (traducción, adaptación o modificación, de la que resulte una obra diferente). La duración de estos derechos es de 70 años después de la muerte del autor, transcurridos los cuales la obra pasa a dominio público, pudiendo ser utilizada por cualquiera, con finalidades comerciales o no, siempre que se respeten los derechos morales de reconocimiento de autoría y de integridad de la obra. Los derechos de explotación o derechos económicos pueden ser cedidos, pagando o de manera gratuita, y habitualmente lo son, a través de los contratos de edición. Equivalen al copyright, derecho característico de la tradición anglosajona. Derechos afines. Se reconocen a intérpretes, ejecutantes, productores audiovisuales y de fonogramas, entes radiofónicos y autores de fotos, sin valor artístico, sobre la reproducción y comunicación de sus obras. Derecho sui géneris, se reconoce al fabricante de una base de datos no original, sobre la prestación (inversión, esfuerzo, etc.) que ha realizado y por el que puede impedir: la extracción y/o reutilización de todo o de parte importante del contenido; la extracción y/o reutilización continuada de una parte no fundamental, cuando cause perjuicio a los intereses legítimos del fabricante y sea contraria a una explotación normal. Actividades de preservación vs. derechos Copias/reproducción. La obtención de copias es una actividad frecuente relacionada con la preservación y que se opone al derecho de explotación, que exige el consentimiento del autor para reproducir el original. Migración/modificación e integridad. La migración de sistemas y programas trae consigo la transformación del documento a un nuevo formato. Se produce una modificación del original que entra en conflicto con el derecho moral reconocido al autor y que le confiere en exclusiva la modificación de la obra. También puede afectar a la integridad de la misma, por la pérdida de determinados datos. Centro de Formación / www.auxiliardebiblioteca.com Accesibilidad remota/Distribución y comunicación pública. La puesta a disposición del público de determinados contenidos, por ejemplo, a través de una web, se contrapone al derecho reconocido al autor sobre la distribución y comunicación pública de su obra. Si además el acceso se ve limitado por contraseñas o cifrados, se interfiere también en el control que sobre su propia obra se garantiza al autor de la misma. Límites a los derechos La Ley de Propiedad Intelectual (España) permite: la reproducción sin necesidad de autorización de una obra publicada, para uso temporal, sin compensación económica y dentro de una actividad tecnológica y para uso privado, sin ánimo lucrativo, a cambio de compensación económica a la entidad de gestión de derechos de autor que corresponda. La reproducción, distribución y comunicación pública para uso de personas con discapacidad y sin fin lucrativo y en procedimientos judiciales, administrativos o parlamentarios por motivos de seguridad pública; de pequeños fragmentos de una obra, salvo libros de texto o manuales universitarios, en tareas de enseñanza; de trabajos sobre temas de actualidad, en medios de comunicación social, indicando fuente y autor y respetando sus derechos; de las situadas en espacios públicos. También permite las recopilaciones periódicas, cuando el autor no se haya opuesto expresamente y sin fines lucrativos; la utilización de fragmentos, a modo de cita o reseña, en actividades docentes o de investigación, señalando el autor y la fuente; el uso de bases de datos, a las que se acceda de forma legal; la ejecución de obras en actos oficiales y ceremonias religiosas, sin autorización del autor, cuando tengan carácter gratuito y el artista no perciba remuneración a cambio; la parodia. Por lo que respecta concretamente a la preservación, la ley dice en su artículo 37, que se permite la reproducción de obras, sin ánimo lucrativo y con fines exclusivos de investigación o conservación, por parte de bibliotecas, museos, fonotecas, filmotecas o archivos públicos o que pertenezcan a entidades culturales o científicas. Al mismo tiempo se permite, sin necesidad de consentimiento del autor, la comunicación y puesta a disposición pública de obras, con fines de investigación, por parte de los establecimientos citados antes, además de por centros integrantes del sistema educativo español, mediante red interna y a través de terminales localizados en dichos establecimientos. Iniciativas favorables a la preservación Acceso Abierto (Open Access). Iniciativa que persigue el acceso libre y sin obstáculos a la información científica, a través de internet y que apuesta por el archivo de los contenidos en depósitos o repositorios digitales, a cargo de instituciones (universidades u otros organismos productores), dónde además del acceso se asegura su conservación y preservación. Creative Commons. Son licencias que permiten el uso legal de una obra, garantizando la autoría. Se clasifican en cuatro tipos, combinables entre sí: Reconocimiento (By) del autor; No Comercial (NC), se permite cualquier uso, salvo la explotación comercial; Sin obra derivada (ND, Non derivative), prohíbe la modificación o reutilización de parte de la obra, para la creación de otra; Compartir igual (SA, Same as), obliga a publicar bajo la misma licencia, cualquier obra derivada. Copyleft. Licencias que en contraposición al copyright, permiten la modificación y distribución de una obra, pero siempre respetando aquellos derechos que el autor no quiera ceder. Favorece el trabajo en colaboración. Protección de las medidas tecnológicas La adaptación de las legislaciones de los derechos de autor al contexto digital ha venido acompañada de la inclusión de la protección de las medidas tecnológicas, incorporadas en una obra, para proteger estos derechos, y también de la información referente a la gestión de los derechos de autor. Centro de Formación / www.auxiliardebiblioteca.com Este punto puede llegar a representar un grave riesgo de cara a la preservación, ya que si no se pueden utilizar legalmente mecanismos para suprimir las medidas tecnológicas de protección, será imposible, a largo plazo, acceder a muchas obras porque habrán desaparecido los códigos de paso de la protección o del organismo o el mecanismo de autorización, o simplemente por la imposibilidad de hacer una copia de refresco debido a que ésta saldrá con una degradación sustancial respecto al original a causa de las medidas de protección integradas. El otro punto que se debe considerar es que los derechos de explotación son temporales y cuando la obra pase a dominio público debe poder ser utilizada sin obstáculos. Si las medidas de protección no se pueden suprimir en el momento en el que obra pasa a dominio público, se puede decir que este artículo de la legislación referente al dominio público ha quedado, en buena parte, liquidado en lo que respecta a la producción digital. De igual modo, quedan seriamente reducidos los límites y las excepciones permitidas en el contexto impreso, tales como las reproducciones para uso privado, para uso de discapacitados, y para investigación o conservación en determinadas instituciones; con la ironía de estar pagando cánones sobre soportes que después las medidas tecnológicas de protección de los derechos no dejan utilizar para las actividades en concepto de las cuales se aplican estos cánones.

Use Quizgecko on...
Browser
Browser