Podcast
Questions and Answers
Match the following attributes with their corresponding values in the web robot's identification:
Match the following attributes with their corresponding values in the web robot's identification:
UserAgentTemplate = Mozzilla/5.0 (compatible; bne.e_bot; +@OPERATOR_CONTACT_URL@) operatorFrom = [email protected] operatorContactUrl = http://www.bne.es/es/Colecciones/ArchivoWeb/AvisoWebmasters/index.html organization = Biblioteca Nacional de España
Match the following authors with their corresponding publications related to document preservation:
Match the following authors with their corresponding publications related to document preservation:
Mª Adelaida Alló Manero = Conservación de la colección Luisa Orera = Manual de biblioteconomía José Manuel Barrueco = Preservación y conservación de documentos digitales Maria Elvira i Silleras = Preservación de los documentos digitales: Guía para comenzar
Match the following institutions with their corresponding publications related to document preservation:
Match the following institutions with their corresponding publications related to document preservation:
AENOR = UNE-ISO 15836:2011 BNE = Manual de biblioteconomía Trae = El Patrimonio bibliográfico y documental: claves para su conservación preventiva ISO/TC 46/SC 11 = Preservación de los documentos digitales: Guía para comenzar
Match the following URLs with their corresponding purposes:
Match the following URLs with their corresponding purposes:
Signup and view all the answers
Match the following terms with their corresponding meanings related to document preservation:
Match the following terms with their corresponding meanings related to document preservation:
Signup and view all the answers
Match the following terms with their corresponding purposes related to web robots:
Match the following terms with their corresponding purposes related to web robots:
Signup and view all the answers
Asocie los siguientes términos con sus definiciones:
Asocie los siguientes términos con sus definiciones:
Signup and view all the answers
Asocie los siguientes conceptos con sus características:
Asocie los siguientes conceptos con sus características:
Signup and view all the answers
Asocie los siguientes términos con sus funciones:
Asocie los siguientes términos con sus funciones:
Signup and view all the answers
Asocie los siguientes conceptos con sus resultados:
Asocie los siguientes conceptos con sus resultados:
Signup and view all the answers
Asocie los siguientes términos con sus características:
Asocie los siguientes términos con sus características:
Signup and view all the answers
Asocie los siguientes conceptos con sus procesos:
Asocie los siguientes conceptos con sus procesos:
Signup and view all the answers
¿Qué herramienta de código abierto diseñada por la Biblioteca de Dinamarca se utiliza en la Biblioteca Nacional de España para archivar la web?
¿Qué herramienta de código abierto diseñada por la Biblioteca de Dinamarca se utiliza en la Biblioteca Nacional de España para archivar la web?
Signup and view all the answers
¿Cuál es el fin principal de las recolecciones de sitios web?
¿Cuál es el fin principal de las recolecciones de sitios web?
Signup and view all the answers
¿Qué organización inició la tarea de rastrear y archivar la web en 1996?
¿Qué organización inició la tarea de rastrear y archivar la web en 1996?
Signup and view all the answers
¿Qué aplicación se utiliza para visualizar sitios web archivados?
¿Qué aplicación se utiliza para visualizar sitios web archivados?
Signup and view all the answers
¿Cuál es el nombre del robot utilizado para rastrear sitios web?
¿Cuál es el nombre del robot utilizado para rastrear sitios web?
Signup and view all the answers
¿Qué versión de Heritrix se utiliza actualmente?
¿Qué versión de Heritrix se utiliza actualmente?
Signup and view all the answers
Study Notes
Robot de rastreo y sus atributos
- Identificación del robot: utiliza un User Agent Template específico que incluye "Mozilla/5.0 (compatible; bne.es_bot; +@OPERATOR_CONTACT_URL@)".
- Atributos del robot:
- operatorFrom: [email protected]
- operatorContactUrl: http://www.bne.es/es/Colecciones/ArchivoWeb/AvisoWebmasters/index.html
- organization: Biblioteca Nacional de España (BNE).
- El robot ignora los archivos robots.txt debido al mandato legal de la BNE en materia de depósito legal.
Proceso de recolección web
- Los crawlers comienzan a partir de URLs iniciales llamadas seeds o semillas.
- Guardan automáticamente cada página, recorriendo hiperenlaces y añadiendo a la lista de URLs para visitas recursivas.
- Los documentos, vídeos, imágenes, etc., son almacenados de forma ordenada.
- El contenido es indexado para permitir búsquedas a texto completo en la colección.
Visualización y herramientas utilizadas
- Las recolecciones buscan replicar el aspecto y funcionalidad de los sitios en el momento de la captura.
- Las webs archivadas se visualizan en OpenWayback, permitiendo al usuario seleccionar versiones específicas.
- Para archivar la web, la BNE emplea NAS (NetarchiveSuite), herramienta de código abierto aprobada por otras bibliotecas nacionales.
- El robot utilizado para rastrear es Heritrix, desarrollado por Internet Archive en 1996, usado ampliamente por grandes instituciones.
- Heritrix está diseñado para minimizar el impacto sobre la actividad normal de los sitios, con un ritmo de rastreo ajustable.
Importancia de la recolección web
- Facilita la conservación del patrimonio digital y transformaciones de contenido de Internet.
- Permite a los usuarios acceder a versiones antiguas de sitios web, contribuyendo así a la preservación de la memoria digital.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Aprende sobre los atributos utilizados por el robot rastreador para la recolección web y su relación con la Biblioteca Nacional de España y el depósito legal. Desafía tus conocimientos sobre la identificación de los robots rastreadores y su función en la recolección de información.