Information Science PDF
Document Details
Uploaded by TrustingHurdyGurdy960
Tags
Summary
This document discusses the nature of Information Science, encompassing conceptions related to computing, information and communication technologies, and the physical and biological fields. It further describes the core concepts, constituents, and its relationship with various disciplines including data science, humanities, and social sciences. The document also looks at the history of information science and the role of organizations.
Full Transcript
INFORMATION SCIENCE 1. ¿QUÉ ES INFORMATION SCIENCE? Existen diferentes concepciones de las ciencias de la información: - Concepción relacionada con la computación, logaritmos y la ciencia de datos. - Concepción relacionada con las tecnologías de la información y la comunicación. - Co...
INFORMATION SCIENCE 1. ¿QUÉ ES INFORMATION SCIENCE? Existen diferentes concepciones de las ciencias de la información: - Concepción relacionada con la computación, logaritmos y la ciencia de datos. - Concepción relacionada con las tecnologías de la información y la comunicación. - Concepción relacionada con la información como una entidad con la ciencia física y biológica. - Concepción de la ciencia que se ocupa de la información registrada en los documentos, con el significado y el conocimiento, como algo que surge de las disciplinas más antiguas de la biblioteconomía y la documentación. Saracevic basándose en ideas anteriores a Borko define: la ciencia de la información es la ciencia y la práctica que se ocupa de la recopilación, el almacenamiento, la recuperación y el uso efectivos de la información. Se ocupa de la información y el conocimiento registrables, y de las tecnologías y servicios relacionados que facilitan su gestión y uso. 1.1 LA NATURALEZA DE LA CIENCIA DE LA INFORMACIÓN Es una disciplina vocacional, subyacente a una serie de actividades profesionales, que incluyen: - Documentación en museos, galerías e instituciones patrimoniales entre otras. - Gestión de datos, información y conocimiento - Gestión de metadatos y taxonomías - Gestión de bibliotecas - Gestión de documentos y archivos Respondiendo a qué tipo de disciplina es la ciencia de la información, se le ha llamado: metaciencia, interciencia, ciencia posmoderna, ciencia de interfaz, ciencia superior, que debería rebautizarse ciencia del conocimiento, arte liberal, forma de compromiso cultural, un tema que puede asumir el papel que alguna vez jugó la filosofía en la mediación de la ciencia y el humanismo, y la filosofía aplicada de la información. 1.2 CONSTITUYENTES Y NÚCLEO No existe una lista canónica de temas que están dentro del ámbito de la Information Science, hay temas comunes: - Naturaleza y concepciones de la información, documentos y colecciones - Arquitectura de la información, interacción humano-computadora y experiencia del usuario - Teoría y filosofía de la información - Organización de la información y metadatos - Historia de la información - Comportamiento y prácticas de información - Alfabetización informacional y digital - Búsqueda y recuperación de información - Gestión de datos, información y conocimiento - Políticas y estrategias de información - Gestión de documentos y colecciones - Gestión de registros y archivos - Derecho y ética de la información - Metodología de investigación de información - Sociedad de la información - Sistemas de información - Publicación y comunicación académica - Servicios de información de todo tipo Un modelo útil para organizar la colección de temas es el de la cadena de comunicación de la información registrada: etapa de creación, difusión, recolección, almacenamiento, organización, descripción, recuperación, uso y preservación de la información. Estos elementos conforman el núcleo de la mayoría de las enseñanzas académicas de la materia. 1.3 RELACIÓN CON OTRAS DISCIPLINAS DE INFORMACIÓN Se relaciona con otras disciplinas relacionadas con la información, de recolección como la biblioteconomía y la ciencia archivística que tienen una larga trayectoria. También con la ciencia de datos y las humanidades digitales. A. DISCIPLINAS DE RECOLECCIÓN Se relacionan por su enfoque en la información registrada en documentos y sus orígenes en el sector de las bibliotecas especializadas. Distinguen entre las “ciencias de la información” y las “disciplinas del registro cultural”, pensando en las bibliotecas y archivos. B. HUMANIDADES DIGITALES Las humanidades digitales es la aplicación de la informática digital al estudio académicos de las humanidades. Siempre ha tenido fuertes vínculos y relación con biblioteconomía y ciencias de la información, y se ha visto a ambas disciplinas como socias naturales. Ambas están preocupadas por la información registrada en documentos y preocupadas por la creación, curación y uso de compilaciones de datos e información. C. DISCIPLINAS TECNOLÓGICAS La ciencia de la información se originó en parte como respuesta a las nuevas tecnologías de la información, y la conexión con la tecnología sigue siendo muy significativa. Varios temas abarcan el área entre las ciencias de la computación y la ciencia de la información, como la recuperación de la información, la visualización de información, la interacción humano-computadora y la arquitectura de información. D. CIENCIA DE DATOS La ciencia de datos se ocupa de la extracción del conocimiento y significado de grandes conjuntos de datos. Para respaldar las actividades de minería de datos y texto, visualización de datos y texto y análisis estadístico de la ciencia de datos, es esencial tener curación de datos, gestión y análisis, incluida la recopilación, limpieza y almacenamiento de datos y hacerlos accesibles a través de buenos metadatos. Todo ello con preocupación por el ciclo de vida de los datos. Esto es muy similar al papel de la gestión de la información. E. DISCIPLINAS DE CIENCIAS SOCIALES Aunque existe debate sobre qué tipo de disciplina es la ciencia de la información, no hay duda de que muchos de los fenómenos que estudia son fenómenos sociales, muchas de sus teorías y conceptos son de naturaleza social, causando una conexión con las ciencias sociales. F. DISCIPLINAS DE COMUNICACIÓN Y MEDIOS La comunicación técnica, la redacción de resúmenes, la traducción, el diseño de información, etc., siempre se han considerado como áreas de interés para la ciencia de la información. Existe una evidente conexión con el periodismo, la edición y los estudios de medios en las secciones de creación y difusión de la cadena de comunicación. G. DISCIPLINAS DE GESTIÓN Y POLÍTICA La gestión de la información y la gobernanza de la información, y en cierta medida la inteligencia empresarial, se consideran aspectos importantes de la ciencia de la información, pero igualmente relevantes para los estudios y la gestión empresariales. La gestión del conocimiento también abarca la división entre la ciencia de la información y los negocios. H. DISCIPLINAS DE DOMINIO: ESPECIALIZACIÓN DE TEMAS Muchas contribuciones al desarrollo de la ciencia de la información han sido hechas por aquellos cuya experiencia se encuentra en una disciplina donde se necesitan nuevos sistemas de información especializados, especialmente en las materias STEM (Science, Technology, Engineering y Mathematics) y dentro de ellas, en química. 2. HISTORIA DE LA INFORMATION SCIENCE La gestión de registros y la biblioteconomía han sido importantes durante milenios, pero fue solo en el siglo XIX cuando surgió un cuerpo codificado de conocimiento profesional que se desarrolló como una disciplina académica. El Martin Schrettinger fue el primero en argumentar a favor de una formación formal para los bibliotecarios y utilizó el término “Bibliothekswissenchaft” (ciencia de la biblioteca) en 1808, para abarcar las tareas de catalogación, clasificación, disposición de los materiales en estanterías y gestión de bibliotecas. Tratados posteriores ampliaron la idea de que las habilidades y el conocimiento necesarios para gestionar colecciones de documentos eran distintos de los del académico. La primera revista profesional para las disciplinas de la información se publicó en Alemania de 1840: Revista de Ciencia Bibliotecaria, Información de Manuscritos y Literatura Antigua. Los primeros programas educativos formalizados para las ciencias de la información surgieron con el establecimiento de cursos de biblioteconomía en la Universidad de Göttingen en 1886, en la Universidad de Columbia en 1887, y más tarde en Leipzig y Barcelona, ambos en 1915, seguidos por la creación de la Escuela de Biblioteconomía de la Universidad de Londres en 1919. Los estudios de posgrado en “ciencia de bibliotecas” comenzaron en la Universidad de Chicago en 1926 y en Londres unos años después. La Archivística, la disciplina que se ocupa de los archivos nace a finales del siglo XIX como técnica basada en la experiencia y no será hasta mitad del siglo XX cuando se configure como disciplina. Un claro precursor fue la publicación del ‘manual de archiveros holandeses’ de Muller, Feith y Fruin en 1898 con el título de Manual de organización y descripción de archivos. Con este y otros manuales parecidos la Archivística se configura como la disciplina de los archivos, no de los documentos, aunque el documento también es objeto de atención archivística. El origen de la ciencia de la información, como entidad distinta de la biblioteconomía y la gestión de registros archivísticos se encuentra en la revolución de las comunicaciones del siglo XIX y en la aparición simultánea de disciplinas científicas y técnicas, lo que generó la necesidad de manejar grandes volúmenes de documentos. Sus antecedentes específicos fueron el surgimiento del movimiento de documentación y el desarrollo del sector de bibliotecas especializadas, ambos a principios del siglo XX. El movimiento de documentación liderado por Paul Otlet, abogaba por un enfoque “científico” para el almacenamiento y la recuperación de información registrada, con nuevos esquemas de clasificación y el uso de la nueva tecnología de recuperación de tarjetas indizadas. La creciente conciencia de la información técnica como recurso para las industrias basadas en la ciencia llevó al establecimiento de bibliotecas especializadas y a la idea de “trabajo de información” como algo distinto de la biblioteconomía. Estas bibliotecas especializadas, comparadas con las tradicionales, tenían un papel mucho más activo, un fuerte enfoque matemático y un interés en todas las formas de información. La creciente aplicación de nuevas tecnologías al manejo de la información, inicialmente técnicas de documentación mecanizadas y enseguida los primeros ordenadores proporcionó el trasfondo tecnológico para la nueva ciencia. El influyente concepto del Memex de Vannevar Bush sobre la gestión personal de la información con acceso a la información mundial, combinado con la Teoría Matemática de la Comunicación de Shannon y Weaver y las nuevas leyes “informétricas”, como la ley de dispersión de Bradford, ofrecieron la perspectiva de un enfoque. El establecimiento de una nueva disciplina o profesión generalmente ha sido reconocido desde el siglo XIX mediante la creación de un organismo profesional que lo represente. El primero de la ciencia de la información fue un organismo internacional para la coordinación de las actividades del movimiento de documentación. El Institut International de Bibliographie (federación Internacional de Información y Documentación) fue establecido por dos pioneros belgas de la documentación, Paul Otlet y Henri La Fontaine, en 1895. Primera asociación reconocible de ciencia de la información. A menor escala se crearon varias asociaciones para bibliotecarios especializados. La Special Libraries Association, fundada en Estados Unidos en 1909, sigue siendo hoy en día una organización mundial próspera. En el Reino Unido, se formó la Association of Special Libraries and Information Bureaux (ASLIB) en 1924 para coordinar las actividades de los servicios de información especializados en el Reino Unido y actuar como servicio nacional de inteligencia para la ciencia, el comercio y la industria. Los dos principales organismos que representan la ciencia de la información en sí se formaron más tarde y tuvieron corta duración en su forma ‘pura’. El American Documentation Institute, creado en 1937, se convirtió en la American Society for Information Science en 1968. Luego cambió su nombre a American Society of Information Science and Technology en 2000. En el Reino Unido, se formó el Institute of Information Science (IIS) en 1958 y se unió a la Library Association fundada en 1877. Las revistas especializadas también caracterizan una disciplina madura. De las principales revistas de ciencia de la información actuales, la más antigua es Journal of Documentation, cuyo nombre refleja sus orígenes en el campo de la documentación cuando se fundó en 1945. Las dos asociaciones principales mencionadas de ciencia de la información fundaron revistas: Journal of the American Society for Information Science and Technology en 1950 y Journal of Information Science del IIS en 1967. La primera oferta educativa para formación se realizó con un curso específico para graduados en ciencias en Londres en 1929, aunque se cerró en 1935, la educación moderna comenzó en 1961, cuando Jason Farrandae estableció un curso nocturno sobre “recolección y comunicación del conocimiento científico” en el Northampton College of Advanced Technology. Farradane fue el primero en utilizar los términos “ciencias de la información” e “informático”. Posteriormente se estableció un curso de maestría en el Centro de Ciencias de la Información de Farrandane cuando el Northampton College se convirtió en la City University London en 1965. En los años siguientes, se desarrollaron otros cursos sobre el tema en todo el mundo, en departamentos conjuntos de Biblioteconomía y Ciencia de la Información. 3. HISTORIA DE LA INFORMACIÓN Y DOCUMENTOS 3.1 PREHISTORIA Y EL MUNDO ANTIGUO La comunicación de la información comenzó con el lenguaje hablado, pero solo podemos especular, sólo con los orígenes de la información registrada podemos comenzar una historia de la información, basada en documentos. Este primer período abarca desde los primeros registros hasta la caída del Imperio Romano en Occidente en 476. Los artefactos más antiguos considerados documentos es el arte rupestre, siendo la más antigua de más de 40.000 años. El propósito de estas representaciones no se puede conocer (especulación). Llamarlos ‘documentos’ es discutible, pero demuestran que las personas de esa época tenían los medios para registrar. Las inscripciones que aparecen en piedras portátiles y datan de hace 7.000 años se considera protoescritura, con símbolos que proporcionan un registro permanente. Por ejemplo, las tablillas de Tartaria de Rumanía, que algunos expertos creen que son la forma más temprana de escritura encontrada hasta ahora, otras más recientes son las etiquetas de hueso encontradas en la tumba U-J en Abydos, como un precursor de los jeroglíficos egipcios del 3320 a.e.c. 3.2 MESOPOTAMIA La escritura propiamente dicha, el repertorio acordado de signos y símbolo que se utiliza para expresarnos, apareció hace más de 5.000 años. Fue inventada independientemente al menos en Mesopotamia, Egipto, China y Mesoamérica. Los escritos con fecha más precias provienen de Uruk, Mesopotamia (3300 a.e.c.). Los escritos mesopotámicos utilizaban el sistema de escritura cuneiforme, escrito en tablillas de arcilla utilizando cañas afiladas. En Egipto se escribía con tinta en papiro, madera, piedra o cerámica. Por la naturaleza de los materiales utilizados y la durabilidad de las tablillas de arcilla, conocemos mucho más sobre las colecciones en Mesopotamia que en Egipto. Los primeros escritos en Mesopotamia fueron registros contables. Las primeras colecciones estaban asociadas a palacios y templos, con poca evidencia existente de organización o intención. No está claro si se hacía alguna distinción entre biblioteca y archivo para estas primeras colecciones. Con el paso del tiempo, hay colecciones que abarcan: material religioso, registros gubernamentales, registros comerciales, documentos familiares (tablas genealógicas), asuntos de propiedad y herencia, predicciones astrológicas, textos científicos y médicos, obras literarias. - La biblioteca/archivo en el palacio de Ebla (2.600-2300 a.e.c): compuesta por tablillas almacenadas en estanterías de madera, con diferentes tipos de materiales guardados en habitaciones separadas. Dos “salas de archivo” contenían más de 17000 tablillas de registros comerciales, legales y administrativos. Otra habitación contenía colecciones de diccionarios, proverbios, narrativas épicas, mitos, himnos, conjuros y rituales. Otras contenían material sobre botánica, zoología, mineralogía y matemáticas. Muchas tablillas estaban dedicadas a listas de personas y objetos, a menudo en orden de precedencia e importancia. El orden de los elementos en las habitaciones se mantenía mediante tablas de clasificación escritas rudimentarias. - El templo de Sippar (actual Iraq): activo durante un período muy largo, tenía una biblioteca de tablillas almacenadas en nichos de ladrillo. Se han encontrado más de 40000 elementos, divididos en registros de las actividades del templo, incluido registros comerciales y textos literarios. - El palacio de Assurbanipal en Nínive (650 a.e.c ): tenía una colección grande, bien organizada y catalogada, con alrededor de 10000 obras distinguibles en 30000 tablillas, dispuestas por tema en diferentes habitaciones. Se almacenaban en jarras de barro en estanterías de madera. Los elementos relacionados se mantenían juntos en una cesta, con una tablilla frontal que describía el conjunto; cada tablilla tenía una etiqueta de identificación que indicaba si ubicación “jarra-estante-habitación”. Se proporcionaba una forma temprana de catálogo, cerca de la puerta de cada habitación, que daba para cada obra presente su título palabras de apertura, el número de tablillas que componían la obra y su símbolo de ubicación. La escritura cuneiforme se desarrolló con el tiempo desde pictogramas, pasando por ideogramas, hasta un complejo sistema de escritura logo-silábica. Su uso disminuyó después de la absorción de Mesopotamia en el imperio persa con la llegada de Ciro el Grande en 359 a.e.c. La escritura cuneiforme fue reemplazada por el alfabeto arameo, basado en el alfabeto fenicio, ya que el arameo se hablaba en el imperio persa. El último texto cuneiforme acadio fechado conocido, de Babilonia, es del año 75, aunque es probable que se haya utilizado en siglos posteriores. La escritura cuneiforme se utilizó para describir una variedad de idiomas, desde sumerio, acadio, hitita y elamita hasta antiguo persa. 3.3 EGIPTO Sus materiales eran papiro y, más tarde, pergamino. Se sabe que existían bibliotecas institucionales, que podrían haber tenido una función estatal, en los templos de Tod, Edfu, Esna y Filae, así como grupos de papiros en entornos domésticos. En el Templo de Edfu, en Alto Egipto, hay evidencia de que se guardaban un pequeño número de rollos en un hueco, y cerca de la pared se tallaba una lista de títulos de los rollos. Hay referencias a escribas que tenían deberes sacerdotales y se cree que los líderes religiosos podrían haber tenido un papel como bibliotecarios/archiveros. Las inscripciones en tumbas, templos y estelas, entre otros, indican la existencia de varias instituciones asociadas con el almacenamiento de documentos, posiblemente desde los primeros períodos dinásticos del Reino Antiguo (2686-2160 a.e.c). 3.4 EUROPA Los primeros sistemas de escritura europeos se encontraron originalmente en Creta, aunque ahora se han encontrado ejemplos en todo el Egeo. Se han identificado tres sistemas de escritura: jeroglíficos cretenses, que datan de 2100-1700 a.e.c; Lineal A, 1750-1450 a.e.c; y Lineal B, algo posterior. Aunque se cree que los sistemas de escritura se superponen en el tiempo, no hay una línea de progresión directa evidente. Las últimas inscripciones en Lineal B, encontradas en Pilos, datan del 1200 a.e.c. El Lineal B fue descifrado en 1950 y se demostró que era griego antiguo. El Lineal A ha sido parcialmente descifrado, pero parece ser un idioma desconocido, y los jeroglíficos cretenses son protoescritura. 3.5 CHINA Aunque no se han establecido detalles, está claro que se establecieron colecciones de documentos en China durante 1200 a.e.c, con escritos en bambú, madera o seda: un sistema que incluía bibliotecas para palacios reales, el gobierno central y administraciones locales, con eruditos encargados de construir catálogos y esquemas de clasificación. 3.6 EL ALFABETO En el mundo antiguo observamos elementos de una infraestructura de información: espacios físicos con diferentes tipos de materiales organizados por ubicación, descripciones de obras y partes de obras, listas de estanterías, etiquetas de localización y formas tempranas de catálogos, organización por temas, listas y proto-clasificaciones, obras de referencia y copias múltiples de textos, con copias maestras de obras importantes guardadas centralmente. La aparición del alfabeto tuvo un impacto significativo en la escritura y en las herramientas intelectuales utilizadas para acceder a los escritos. Se cree que el alfabeto fenicio, visto por primera vez en 1000 a.e.c., utilizaba un número reducido de símbolos para reemplazar los conjuntos de símbolos mucho más grandes de la escritura cuneiforme y jeroglífica, y podía ser utilizado para escribir diferentes idiomas, lo que aumentaba en gran medida la flexibilidad de representación. El alfabeto fenicio influyó en los alfabetos arameo/hebreo y griego, lo que llevó a los primeros cuerpos sustanciales de escritos alfabéticos y a la primera ordenación de libros por orden alfabético. 3.7 GRECIA Los griegos escribían en piedra, papiro, cerámica y pizarra cubierta de cera. Las bibliotecas y centros de registros se extendieron por todo el mundo helenístico, con evidencia de bibliotecas significativas en Pérgamo, Antioquía, Pella y Alejandría. Existían bibliotecas reconocibles tanto reales como privadas y públicas, apoyadas por scriptoria y comercio de libros. Los textos se escribían en rollos de papiro y se almacenaban en estanterías, en compartimentos o en cofres, con etiquetas o rollos más pequeños para identificar el título y el autor. Estrabón, el geógrafo e historiador griego, nos dice que Aristóteles fue el primero en enseñar a los reyes helenísticos de Egipto cómo organizar una biblioteca. La biblioteca más conocida de este período es la Gran Biblioteca de Alejandría en Egipto, fundada por Alejandro Magno en el siglo IV a.e.c y desarrollada por los reyes Ptolomeos posteriormente. Como centro de estudios se creía que en su apogeo albergaba más de 400000 manuscritos de papiro en griego, todo el conocimiento de ese tiempo. Se dice que su primer director, Xenodontus, creó un sistema de estanterías con divisiones temáticas derivadas de las de Aristóteles, y los elementos se organizaban en ellas por nombres de autores en orden alfabético. Los Pinakes, presentados en muchos rollos, se dividían según la clasificación de su creador, Calímaco en secciones dedicadas a filosofía, derecho, historia, medicina, historia natural y miscelánea, y la literatura se dividía en obras de retórica, lírica, comedia, tragedia y épica. Incluía una guía general de la literatura de la época y se considera la primera forma moderna de herramienta bibliográfica. 3.8 ROMA El mundo romano adoptó la infraestructura documental de los griegos, con bibliotecas públicas y privadas y un favorable comercio de libros. Las primeras bibliotecas públicas romanas fueron iniciadas por el comandante militar Asinio Polión sobre el 39 a.e.c., y más tarde por el emperador Augusto. El códice fue desarrollado por los romanos a partir de tablillas de escritura de madera atadas con bisagras, luego reemplazadas por pergamino (cubiertas de piel de animales no natos). Los códices eran más útiles para almacenar, organizar y utilizar que los rollos, y reemplazaron a estos últimos para la mayoría de los propósitos entre el 100 y 500. La primera referencia a obras literarias en códices la hace Marcial durante 84-86. Se cree que el impulso para el cambio del rollo de pergamino a códice provino de los primeros cristianos y su uso de textos bíblicos, los textos paganos en forma de códice eran raros en el siglo II. El traslado de los textos clásicos del rollo al códice ocurrió gradualmente y pudo haber resultado en la pérdida de textos considerados menos importantes. Técnicamente, todos los libros modernos son códices, pero el término se reserva para libros escritos a mano producidos desde la Antigüedad tardía hasta la Edad Media. Algunas de las obras más antiguas que han sobrevivido son códices de pergamino del siglo IV. 3.9 EL MUNDO MEDIEVAL Los desarrollos iniciados en el período clásico continuaron en la época medieval (477-1453, caída Constantinopla). Las innovaciones en la comunicación de la información continuaron globalmente. El pergamino, capaz de ser escrito en ambos lados y mejor preparado para aceptar ilustraciones, con las hojas plegadas y cosidas dio lugar a los códices. Este fue el período de manuscrito iluminado, se desarrollaron otras formas de representación de la información como mapas, notaciones musicales y simbología matemática con el uso de los números arábigos, originalmente una innovación india. En ese momento, el mundo islámico estaba mucho más avanzado que Occidente en la producción de documentos, habiendo emprendido un importante programa de traducción de textos griegos, persas e indios ampliándolos mediante estudios originales. Este proceso fue liderado por la “Casa de la Sabiduría”, establecida en el siglo IX en Bagdad por el califa abasí Al-Ma’mun, quien deseaba recopilar todos los libros del mundo bajo un mismo techo. No queda nada de esta institución y su naturaleza y propósito siguen siendo objeto de especulación. Los primeros mapas estelares conocidos aparecieron en esta época en China. Durante gran parte de este periodo en Occidente, la escritura y la lectura se centraba en instituciones religiosas. Los monasterios y catedrales tenían colecciones sustanciales de códices en pergamino y eran principales productores de ello. Hacia finales del siglo XII, los escribas seculares comenzaron a agruparse en gremios y talleres. Las obras en lenguas locales, en contraposición al latín o al griego, se volvieron más comunes, y comenzaron a aparecer tratados sobre matemáticas, lógica, filosofía y astronomía, a menudo traducidos del árabe. Se podría decir que doscientos años antes de la introducción de la impresión se había establecido una industria editorial. Esto fue promovido por el surgimiento de universidades seculares en toda Europa occidental, estimuló la necesidad de múltiples copias autorizadas de textos. La producción de manuscritos alcanzó un estatus profesional, con hermandades de escribas y programas de aprendizaje. El papel había llegado a Europa en el siglo XII, una innovación china del siglo II o anterior transmitida a través del mundo árabe después de su introducción en Samarcanda desde China en 751. Sin embargo, inicialmente se utilizaba solo para documentos formales y no para libros. El primer molino de papel en Inglaterra se estableció a finales del siglo XV para satisfacer la demanda de impresores. Hacia el final del período, varias monarquías europeas, como las de Inglaterra, Francia, Austria y Hungría, establecieron colecciones reales que sentaron las bases de las futuras bibliotecas nacionales. Aparecieron bibliotecas universitarias, algunas de las cuales siguen activas, en Oxford, Cambridge, París, Padua, … Los catálogos de este periodo eran listas de adquisidores de autores y títulos, y servían para respaldar un programa activo de préstamo de documentos entre bibliotecas y académicos. Se crearon los primeros catálogos colectivos (siglo XIV, Universidad de la Sorbona en París). La clasificación secular se basaba en las siete artes liberales clásicas: el trívium de gramática, retórica y dialéctica y el cuadrivium de aritmética, geometría, música y astronomía. Esta clasificación fue ideada en el siglo VI por Flavio Magno Aurelio Casiodoro. 3.10 LA ERA DE LA IMPRESIÓN Desde la introducción de la impresión hasta el comienzo convencional del “largo siglo XIX” en 1789, presenció la introducción de una infraestructura de información basada en documentos impresos. La impresión con caracteres móviles se había establecido en China, donde inicialmente se utilizaban caracteres de arcilla cocida, varios siglos antes de su introducción en Europa. El libro impreso más antiguo con fecha es el Sutra del Diamante en 868. El crédito por la introducción de la imprenta en Europa se suele atribuir a Johannes Gutenberg, quien estableció una imprenta en Maguncia alrededor de 1447, mientras que Peter Schoeffer descubrió un método viable para fundir las letras utilizando una aleación de estaño y plomo. La primera imprenta se estableció en Inglaterra en 1476 por William Caxton; el primer producto fue “The Dictes or Sayings of the Philosophers”. Las imprentas se extendieron por toda Europa durante el siglo siguiente, combinando los talentos de compositores, grabadores y fundidores de tipos para crear una industria de impresión reconociblemente moderna, capaz de producir tanto texto como imágenes, aunque mediante un proceso algo torpe en el que las imágenes se reprodujeron por separado, inicialmente en grabados de madera y mas tarde en placas de metal. La impresión tuvo dos efectos generales. Uno fue la disponibilidad de múltiples copias obras, lo que exigía herramientas bibliográficas como catálogos, bibliografías, índices, en los que había una descripción única para una obra impresa en lugar de para cada manuscrito único escrito a mano. El otro fue que la impresión condujo a la “explosión de información” original, con muchas más copias de más títulos, de naturaleza cada vez más diversa. Las primeras bibliografías en el sentido moderno aparecieron en esta etapa, destacando la “Biblioteca Universalis” de Conrad Gesner de 1545, que fue pionera en ideas de selección, disposición e indización. Logró incluir 15000 títulos en hebreo, griego y latín, estimados en un 20-25% del total de libros disponibles en ese momento. El editor, librero y bibliógrafo Andrew Maunsell publicó un “Catalogue of English Printed Bookes” en 1595, el primer intento de una bibliografía nacional británica. Se desarrollaron esquemas de clasificación que intentaban conciliar una organización filosófica del conocimiento con la necesidad de ordenar los libros en bibliotecas, por parte de varios académicos. En el siglo XVII, los avances en la tecnología de impresión permitieron un proceso de producción más rápido y la capacidad a través de la litografía, de imprimir texto e imágenes al mismo tiempo. Aumentaron lectores de periódicos, revistas y publicaciones científicas y profesionales. Las primeras revistas científicas aparecieron en 1665, siendo el Journal des Savants de París el primero en publicarse el 5 de enero, reclamando precedencia sobre las Philosophical Transactions of the Royal Society of London, publicadas por primera vez el 6 de marzo. 3.11 ILUSTRACIÓN (SIGLO XVIII) El siglo XVIII vio una mayor expansión de la infraestructura de la información. Herramientas de referencia importantes, como la Cyclopedia de Ephraim Chambers, la Encyclopédie de Diderot, el Diccionario de Samuel Johnson y la Enciclopedia Británica, aparecieron por primera vez, acompañadas de bibliografías nacionales y temáticas, y nuevas ideas de clasificación y principios bibliográficos. Las bibliotecas nacionales e instituciones de “memoria” comenzaron a surgir, como el Museo Británico y su biblioteca asociada en 1753 y la Bibliothèque Nationale en 1789. Muchos de los desarrollos conceptuales en la organización, presentación y comunicación de la información realizados durante este período permitieron los avances técnicos del siglo siguiente. 3.12 LA ERA DE LA COMUNICACIÓN EN MASA La era de la comunicación de masas comenzó con la adopción de los productos de la Revolución Industrial del siglo XIX para la difusión de información, sentando las bases del entorno moderno de la información. Las primeras prensas de vapor, introducidas a principios del siglo XIX, aumentaron la velocidad de impresión. Para la década de 1820, las prensas de vapor podían producir 4000 páginas, y para 1850 las prensas rotativas de periódicos alcanzaban las 20000 hojas por hora. Los barcos y trenes de vapor proporcionaron un transporte rápido y confiable para este nuevo volumen de material impreso. Se produjo una gama mucho mayor de libros y publicaciones periódicas, tanto populares como académicas. En particular, se publicaron muchas más revistas científicas y profesionales especializadas, monografías y libros de texto para satisfacer las necesidades de las actividades científicas y técnicas que se estaban profesionalizando y especializando rápidamente. En general, la comunicación mejoró con la introducción del telégrafo en la década de 1830, los servicios postales nacionales en la década de 1840 y el teléfono en la década de 1870. La fotografía se introdujo en la década de 1840 y, tres décadas después, las fotografías se reproducían en documentos impresos. Las computadoras analógicas de Charles Babbage de la década de 1830, aunque su concepto resultó estar más allá de lo que la tecnología de la época ofrecía, dio indicios de lo que vendría. En el siglo XIX se crearon servicios de biblioteca e información: bibliotecas, instituciones nacionales de información especializada, instituciones de memoria, muchas instituciones académicas y profesionales generalmente con biblioteca y/o archivo propio, bibliotecas universitarias modernas, los primeros servicios de resumen e indización, y servicios de biblioteca pública, tanto de suscripción como gratuitos. Las 91 reglas de Anthony Panizzi para el catálogo de la biblioteca del Museo Británico de 1841 fueron un desarrollo importante paralelo a los principios de Charles Jewett para la biblioteca del Instituto Smithsonian en EEUU. La clasificación decimal de Dewey apareció en 1876 y las primeras listas modernas hacia finales del siglo, los Encabezamientos de Materias de la Biblioteca del Congreso en 1898. 3.13 LA ERA DE LA DOCUMENTACIÓN El deseo centenario de un control bibliográfico universal fue perseguido por el nuevo “movimiento de documentación”, liderado por los académicos belgas Paul Otlet y Henri La Fontaine. Haciendo unos de nuevas herramientas intelectuales y físicas para la organización de la información, Otlet, especialmente a través de su centro de documentación Mundaneum y su influyente libro Taite de documentation, bases de las ciencias de la información y la documentación. La mecanización se introdujo en la documentación en forma de tarjetas perforadas, con muescas en los bordes, de coincidencia óptica y microformas, que permitían búsquedas complejas utilizando la lógica booleana. La llegada de la computadora digital en el siglo XX condujo a la convergencia de formatos; el texto, las imágenes, los sonidos y los videos se volvieron digitales. Se introdujeron nuevas herramientas intelectuales, como clasificaciones facetadas y tesauros, para lidiar con el aumento de volúmenes de materiales en todos los formatos. La gestión de la información y el conocimiento se convirtieron en disciplinas establecidas y a finales del siglo XX se estableció el concepto de búsqueda en línea o “sociedad de información” con la introducción de Internet y la World Wide Web, que junto con la aparición de las redes sociales, dieron lugar a nuevas formas de comunicación. 4. PARADIGMAS DE LA INFORMATION SCIENCE El diccionario Oxford English define un paradigma como “un modelo conceptual o metodológico subyacente a las teorías y prácticas de una ciencia o disciplina en un momento particular; de ahí una visión del mundo generalmente aceptada”. El término fue introducido por el filósofo de la ciencia Thomas Khun en su trabajo sobre revoluciones científicas. El término “paradigma” describe una colección de creencias sobre el tema de una materia y un conjunto de acuerdos sobre cómo debe estudiarse la materia. La aceptación de un paradigma se aplica al estudio académico y la investigación, pero también influye en la práctica, ya que encapsula una visión general de cómo es un tema. Es importante tener en cuenta que la aparición de un nuevo paradigma no implica el cese del trabajo basado en paradigmas anteriores; es más bien de adición y tal vez de reemplazo gradual. La ciencia de la información ha visto varios paradigmas operando al mismo tiempo. Esto difiere del concepto original de Khun, según el cual generalmente habría un único paradigma para una ciencia y uno nuevo reemplazaría al anterior. Un “giro” en este contexto implica un cambio rápido de dirección dentro de un campo de estudio, afectando los temas considerados relevantes e importantes y las formas apropiadas de estudiarlos. Un giro se puede caracterizar como “algún tipo de interrupción cognitiva en una tradición de investigación”, y como “un proyecto intelectual reconocible en el que un grupo de académicos adopta entusiastamente un nuevo conjunto de compromisos teóricos, metodológicos o sustantivos y típicamente critican el statu quo y centran la atención en una agenda o frontera de investigación diferente”. Ha habido numerosos paradigmas y giros nombrados en las ciencias de la información. Estos incluyen el paradigma del sistema, el del usuario, el del comportamiento, el de la información, el del objeto, el bibliométrico, el cognitivo, el de la comunicación, el físico y el socio-cognitivo. Algunos de ellos se superponen, mientras que otros no han sido influyentes. Cronin menciona el giro del usuario y el giro sociológico, así como el giro lingüístico. Nolin y Åström identifican el giro cognitivo, informático, centrado en el usuario, epistemológico y el giro pragmático. Señalan que estos a menudo tienen un alcance más allá de las ciencias de la información; por ejemplo, el giro cognitivo se originó en la psicología. Hartel describe siete paradigmas en las ciencias de la información: cognitivo, afectivo, neo-documental, socio-cognitivo, vida cotidiana, constructivista social y encarnado, también tres giros en la investigación: lingüístico, cultural y material. 4.1 PARADIGMA DE LOS SISTEMAS O FÍSICO Reconocible a partir de la década de 1950, es el paradigma original de las ciencias de la información, utilizado como base para la evaluación y mejora de los sistemas y servicios de información. Con una perspectiva realista, siguiendo los métodos de las ciencias naturales, enfatizaba los métodos cuantitativos y experimentales para evaluar el rendimiento de los sistemas, especialmente de los de recuperación. A veces se le denomina paradigma de Cranfield, en referencia a sus experimentos de recuperación de información, que fueron los primeros estudios, en su caso, comparando sistemas alternativos de indización y clasificación. Este estilo experimental de investigación todavía es popular en estudios de algoritmos de recuperación e interfaces de sistema. 4.2 PARADIGMA COGNITIVO A partir de la década de 1970 y con mayor impacto en la del 1980, el paradigma cognitivo representó un alejamiento del paradigma de los sistemas y se centró en el mundo del pensamiento interno del usuario de información individual. Basado en la filosofía de Popper, fue particularmente influenciado por la “ecuación fundamental de la ciencia de la información” propuesta por Brookes (1980): K(S) + ∆I = K (S + ∆S) Una estructura de conocimiento, K(S), se transforma en una estructura de conocimiento alterada K(S + ∆S) mediante una entrada de información, ∆I. ∆S indica el efecto de la modificación. La misma información puede tener diferentes efectos en diferentes estructuras de conocimiento. Es una descripción del proceso de comunicación de información tal como afecta el conocimiento de un individuo. Se propusieron varias teorías y modelos basados en aspectos cognitivos del uso de la información, considerando los modelos mentales de los usuarios y aplicados en contexto de recuperación y su comportamiento en relación a la información. El ejemplo más conocido, la idea de un Estado Anómalo de Conocimiento (ASK), asume que un usuario reconoce alguna anomalía o insuficiencia en su conocimiento sobre algún tema, que luego se traduce en una necesidad de información y en consultas a algún sistema de información. Las respuestas ayudan a resolver en cierta medida la anomalía en su conocimiento, pero pueden generar más necesidades de información. Este tipo de análisis llevó a ideas para sistemas de recuperación construidos sobre principios diferentes a los disponibles, generalmente con un mayor grados de interacción. Algunos autores creen que este fue el paradigma más influyente en la historia de la información. 4.3 PARADIGMA SOCIO-COGNITIVO Se originó en la década de 1990 y se basa en la idea de que el comportamiento y las prácticas de información están enraizados en un contexto específico: social, profesional, educativo o disciplinario (Hjørland, 1995; 2002). Se centra en la construcción y uso del conocimiento dentro de las comunidades y que ofrece un marco para la investigación, el desarrollo disciplinario y la práctica profesional. Aunque se centra en la comunidad, no descuida al individuo. 4.4 PARADIGMA NEO-DOCUMENTAL Se originó en la década de 1990, con un enfoque en la información registrada en documentos de todo tipo en el corazón de la ciencia de la información. Se remonta a los pioneros del movimiento de la documentación, en particular a Otlet y Briet, y fue inspirado por el concepto de información-como-objeto de Michel Buckland. Esta perspectiva se ha desarrollado en torno a la nueva teoría del documento de diversos autores. El interés de este punto de vista radica en la naturaleza y tipos de documentos, en su significado y uso dentro de la sociedad, y en los procesos de documentación (autoría, anotación, preservación, recuperación, etc.). 1. INFORMACIÓN EN COMPUTACIÓN Y COMUNICACIONES: TEORÍA DE SHANNON Hasta mediados del siglo XX, la información se consideraba la comunicación de hechos o conocimientos significativos, sin definición formal. La primera definición cuantitativa formal fue de Claude Shannon en su Teoría Matemática de la Comunicación. Shannon se preocupaba por la eficiencia de la transmisión de información en la comunicación por telégrafo y teléfono, no por el significado de los mensajes enviados. La teoría de Shannon era un formalismo puramente estadístico que relacionaba el contenido de información de un mensaje con la probabilidad de ocurrencia de sus símbolos, independientemente de su significado. Shannon la denominó una teoría de comunicación, no de información. En la teoría de Shannon un alto contenido de información se relaciona con combinaciones de símbolos de baja probabilidad, de manera que la información se equipara con la aleatoriedad, causando problemas al aplicar la teoría a información con significado. El formalismo de Shannon es aceptado como la base de cualquier teoría de la información. Fue presentado en un artículo en 1948 y posteriormente publicado en forma de libro. 2. INFORMACIÓN EN EL MUNDO FÍSICO En el mundo físico, la información ha sido introducida en las últimas décadas como una cantidad explícita en las teorías físicas, un concepto físico como la energía o la materia. En la tecnología de la computación y las comunicaciones, la información se procesa mediante dispositivos físicos, por lo que parece natural pensar en la información en este dominio como una cantidad física, por lo que la información siempre debe estar en algún sistema físico. Tenemos la cuestión está la relación sutil entre la información y la entropía, que es una medida del desorden en los sistemas físicos. Existe la idea de la información como opuesta a la entropía, ya que cuanto mayor sea la entropía del sistema, más información contiene. Podría ser paradójico para los que asocian la información con la organización y la comprensión intuitivamente, pero pensemos en el hecho de que se necesitan muchas más palabras para describir en detalle un sistema desordenado que uno ordenado y más simple; las palabras adicionales necesarias se deben a la entropía/información adicional en el sistema. 3. INFORMACIÓN EN EL MUNDO BIOLÓGICO El físico alemán Erwin Schrödinger, uno de los pioneros de la mecánica cuántica, sugirió que los organismos vivos se alimentan de neguentropía (idea de información como opuesta a la entropía, popularizada por Leon Brillouin en 1956 con esta etiqueta). Desde entonces, la información se ha convertido en un concepto central en las ciencias biológicas, y la capacidad de procesar y transmitir información se considera parte de la definición de vida. Existen varias instancias específicas para aplicar conceptos de información en biología: - La codificación de información genética en el ADN - La comunicación de información entre células vivas, plantas y animales - La idea de que especies no humanas puedan usar dispositivos de memoria externa, como telas de araña 4. INFORMACIÓN EN EL MUNDO SOCIAL En el mundo social, la información se considera como algo asociado al significado y a la comunicación de hechos y conocimientos. De acuerdo con la visión filosófica de que el conocimiento debe ser verdadero, es común considerar que la información es algo veraz y distinguirla de la desinformación (información incorrecta). También podemos distinguir la malinformación, que es información verdadera pero comunicada con malas intenciones. Todas estas variedades de información se engloban bajo el epígrafe de contenido semántico, y es el contenido semántico el que constituye la información registrada de la que se ocupa la ciencia de la información. Otra cualidad de la información en el ámbito social es en qué medida es relevante para sus usuarios potenciales. La provisión de información relevante es una tarea central para todos los servicios de información, y la cantidad de información relevante dada es una métrica importante para juzgar el éxito de dichos servicios. Saracevic (2007, 2019) sugiere que la relevancia es “una, si no la, noción clave en la ciencia de la información en general”. Sin embargo, el concepto de relevancia es complejo y objeto de debate, y se han propuesto diversos conceptos relacionados ligeramente diferentes, como utilidad, uso, pertinencia temática. Un documento puede ser relevante en términos de su tema, pero si es antiguo, está escrito en un idioma que el usuario no puede leer o está dirigido a expertos, puede tener utilidad limitada. Otra cualidad de la información es que los cuerpos humanos pueden ser fuentes y depósitos de información, implica en la forma en que se comprenden el comportamiento y las prácticas en relación con la información. En el mundo social, la información implica significado y comunicación entre personas. Buckland distingue tres usos de “información”: - Información como cosa, asociada con un documento, es física y objetiva. - Información como proceso, donde la información es aquello que cambia el estado de conocimiento de alguien. - Información como conocimiento, donde la información se iguala con el conocimiento que transmite. Buckland argumenta a favor de la información como cosa, ya que es muy relevante para la ciencia de la información que trata principalmente con información en forma de documentos. La información como proceso subyace a las teorías del comportamiento en relación con la información con un enfoque en la experiencia de las personas, mientras que la información como conocimiento evoca la idea de que la información y el conocimiento están muy relacionados, sin especificar una relación exacta. La jerarquía DIKW (o DIKUW, con Understanding) es un modelo piramidal que sitúa la información en un espectro con los datos y el conocimiento u otras entidades, implicando que son “el mismo tipo de cosa” y que uno puede transformarse en otro. Las capas inferiores contienen una gran cantidad de material, que se “refina” en una cantidad menor en niveles superiores. EL refinamiento se realiza mediante procesos de valor añadido dentro de los sistemas de información, como la recopilación, comparación, evaluación, contextualización y resumen. Ha sido criticado por su excesiva simplicidad, pero ha mantenido su influencia. Datos: es la mínima unidad elemental del conocimiento y base para la creación de información, son hechos y observaciones sin procesar. No tienen contexto ni significado inherente. Según el modelo Datos-Información- Conocimiento-Tecnología de Newman, el control y monitoreo de los procesos producirá solo datos. Información: es el resultado de organizar, estructurar y, dar sentido y significado a los datos. Como cualquier mensaje, la información tiene un emisor y un receptor, y puede ser juzgado como “ruido”. Los datos se pueden transformar en información dándoles valor: o Contextualizando: se sabe en qué contexto y para qué propósito se generaron los datos. o Categorizando: se conocen las unidades de análisis que ayudan a interpretar los datos. o Calculando: los datos pueden haber sido procesados matemática o estadísticamente. o Corrigiendo: se han eliminado errores de los datos. o Condensando: los datos se han podido resumir de forma más concisa. Conocimiento: implica la comprensión y la aplicación de la información. Se adquiere a través de la experiencia y el aprendizaje, y permite a las personas utilizar la información de manera efectiva para resolver problemas y tomar decisiones informadas. Comprensión: a veces se incluye en la jerarquía, implica integrar y sintetizar el conocimiento, identificar patrones y relaciones, y tener una visión más profunda de un tema. Sabiduría: nivel más alto de conocimiento y comprensión. Implica la capacidad de aplicar el conocimiento y la comprensión de manera ética y reflexiva, teniendo en cuenta los valores y el contexto más amplio. La sabiduría se basa en la experiencia y la capacidad de tomar decisiones beneficiosas. 5. TEORÍAS UNIFICADAS DE LA INFORMACIÓN 5.1 TOM STONIER Tom Stonier propuso una concepción de la información integrada en los ámbitos físico, biológico y mental: la información es una entidad física análoga a la materia, siendo la capacidad de crear y mantener la organización. Esta función organizativa de la información se expresa en el mundo biológico y luego en la inteligencia humana, y finalmente en el significado, expresado en la información registrada. 5.2 MARCIA BATES Marcia Bates presentó modelo integral que caracteriza como evolutivo, distingue entidades “similar a la información”: Información 1: el patrón de organización de la materia y la energía. Información 2: algún patrón de organización de la materia y la energía que adquiere significado por un ser vivo. Datos 1: información disponible por un organismo sensorial percibida o procesada por dicho organismo. Datos 2: información seleccionada o generada por seres humanos con fines sociales. Conocimiento: información dotada de significado e integrada con otros contenidos de comprensión. 5.3 LUCIANO FLORIDI Forma parte de su Filosofía de la Información, definiéndola como “datos bien formados, significativos y verídicos”. Los datos se entienden como una falta de uniformidad, una diferencia o distinción notable en algo. Para ser considerados información, los elementos de datos individuales deben compilarse en una colección bien formada (ensamblada correctamente según la sintaxis relevante), sea significativa (cumpla con la semántica relevante) y verídica, a diferencia de la desinformación (falsa) y la información errónea (falsedad deliberada). 5.4 OTRAS TEORÍAS - Teoría General Matemática de la Información (Burgin). - La Metafilosofía centrada en la información donde la información puede estar directamente relacionada con aspectos del mundo físico y biológico (Brenner y Wu). - La Teoría Unificada de la Información que ha ideado un “superconcepto” que abarcaría todas las diferentes manifestaciones de la información, incluyendo lo físico y lo no físico, a través de un marco basado en la teoría de sistemas complejos y propiedades emergentes. - La cibersemiótica de Brier proporciona un marco transdisciplinario para la comunicación de la información, centrándose en los signos, el significado y la interpretación en sistemas biológicos, incluyendo lo humano y lo social, y evitando una fundamentación puramente lógica y matemática. 6. TEORÍA DEL DOCUMENTO El trabajo de los primeros documentalistas: Paul Otlet, Henri La Fontaine, Frits Donker Duvys y Suzanne Briet, fue una respuesta al gran aumento del volumen de información académica publicada, desde mediados del siglo XIX, y a la necesidad consecuente de mejores formas de controlarla. Se basó en el estudio anterior de la bibliografía, que desde el siglo XVIII había estudiado la selección, organización y difusión de obras impresas. Los documentalistas consideraban que la bibliografía era un aspecto de un tema más amplio de la documentación, que también abarcaba la autoría, la impresión, la publicación y los servicios bibliotecarios. Plantearon por primera vez las preguntas sobre los límites de lo que es un documento y los procesos de documentación, llegando a la conclusión de que cualquier objeto debería considerarse un documento si daba información y evidencia. Michael Buckland publicó a través de su artículo “¿Qué es un documento?” en 1997 sus opiniones que derivan de su defensa de la idea de “información como cosa” no como conocimiento o como proceso. Al revisar y criticar las opiniones del movimiento de documentación temprano, mostró cómo ampliaron la idea de un documento más allá de los textos impresos, e incluso que de los elementos creados para comunicar información. El énfasis se trasladó de la comunicación a la evidencia: un documento era algún elemento físico que proporcionaba evidencia y era informativo. La teoría moderna del documento o neo-documental, examina el concepto de “documento” y cómo puede utilizarse en conjunto con otros conceptos para comprender mejor la comunicación de información y conocimiento en una infosfera donde muchos documentos adoptan forma digital. Junto con la naturaleza y atributos de los documentos, la teoría del documento estudia los procesos de documentación, mediante los cuales se crean, organizan y utilizan los documentos. Se pueden presentar de dos formas: - Documentos intencionales: creados deliberadamente como documentos, libros y fotografías. - Documentos atributivos: objetos que no fueron creados como documentos, pero que posteriormente lo son. 6.1 ATRIBUTOS DE LOS DOCUMENTOS - Indizabilidad: deben tratar sobre algo o señalar algo. Tiene una “sobriedad” y puede actuar como un símbolo. - Documentalidad: función social en un contexto particular, en un momento y lugar determinados. - Complementariedad: tres formas de atributo: material, su composición física o técnica; informativa, relacionada con la actividad mental y cognitiva; y social, su significado económico, político o cultural y sus connotaciones. - Fijeza: deben ser estables con el tiempo. - Productividad: se pueden crear nuevos documentos a partir del original. Esto fue considerado por los teóricos originales del documento como un proceso jerárquico, documento primario da lugar a secundarios y terciarios. 6.2 CATEGORIZACIÓN Y ORGANIZACIÓN DE DOCUMENTOS Una categorización simple por nivel de recurso ha sido un principio organizativo útil en las disciplinas de la información, toda categorización es subjetiva según como el usuario utilice y vea el recurso. Los niveles son: - Cero: información en bruto antes de ingresar a la cadena de comunicación. - Primario: la “información original”. - Secundario: información de valor agregado, resultante de la organización de material primario. - Terciario: materiales que apuntan y facilitan el uso de materiales primarios y secundarios. - Cuaternario: proporciona acceso a listados de recursos a un nivel superior, esencialmente “listas de listas”. - Quinario: listas, de listas de listas. Una colección es un conjunto organizado de elementos que contienen información seleccionados para un propósito específico en un contexto, es fundamental para las ciencias de la información. Sirve de base para las actividades de centros de información, bibliotecas, centros de archivos, museos y galerías. Las disciplinas que fundamentan estas actividades profesionales a menudo se denominan “ciencias de la colección”. 7. DOMINIOS DE INFORMACIÓN Los contextos de comunicación y uso de información se pueden describir por área geográfica, por tipo de institución o por la demografía de los usuarios. La distinción más útil es el dominio de información que a menudo se alinea con una disciplina académica, una actividad profesional o vocacional, ocio o la información cotidiana. Los dominios se definen y explican por dimensiones: ontológica (define el dominio por su principal objeto de interés), epistemológica (relacionada con el tipo de conocimiento) y sociológica (relacionada con el tipo de personas y grupos involucrados). Afecta a alfabetización informacional, el comportamiento de búsqueda y el intercambio de información. 7.1 TERMINOLOGÍA DE DOMINIO La terminología, la denominación estructurada de las cosas y todos los dominios la tienen, es una de las herramientas más básicas y familiares para organizar información y comunicarla de manera precisa y sin ambigüedades. Comprender la terminología de un dominio es una necesidad para la provisión efectiva de información. Categorías: diccionarios generales, diccionarios y glosarios para temas específicos, diccionarios de uso especial, diccionarios de nombres propios de personas y de lugares, tesauros, listas de nombres específicos y herramientas destinadas principalmente a la recuperación, pero que pueden funcionar como terminologías. 7.2 ANÁLISIS DEL DOMINIO Desarrollado por el danés Birger Hjørland, es proporcionar una base teórica para el estudio de los dominios de información. Es un enfoque dentro del paradigma sociocognitivo de la ciencia de la información. Hjørland considera que el análisis de dominio es fundamental para el trabajo del científico de la información y abarca once enfoques distintos mediante los cuales la ciencia de la información puede abordar un dominio: - Estudios epistemológicos y críticos - Producción guías de literatura y portales temáticos - Estudios de terminología y lenguajes especiales, y análisis del discurso - Producción clasificaciones especiales y tesauros - Investigación sobre indización y recuperación en temas especializados - Estudios bibliométricos - Estudios en cognición, informática e inteligencia artificial - Estudios históricos - Estudios empíricos de usuarios - Estudios de documentos y “géneros” - Estudios de estructuras y organizaciones en la comunicación de información TRABAJO DE INFORMACIÓN ESPECIALIZADO EN DOMINIOS Un profesional de la información especializado en un dominio no necesita el mismo grado de conocimiento de la materia que sus usuarios, necesita tener una comprensión de la lógica y el lenguaje de un área de estudio. El profesional: - Actuar como instructor, capacitador, consultor y asesor - Proporcionar conocimientos actualizados - Coordinar conocimientos y facilitar comunidades de conocimiento - Evaluar e interpretar información - Gestión de datos de investigación - Asistir o liderar revisiones sistemáticas - Catalogar y describir recursos - Realizar búsquedas y consultas de referencia ‘difíciles’ - Promover recursos especializados - Crear terminologías y taxonomías - Sugerir nuevos recursos y ayudar en el desarrollo de colecciones - Crear guías para usuarios 1. FUNDAMENTOS DE LA ORGANIZACIÓN DE LA INFORMACIÓN Siguiendo a Gnoli, podemos identificar dimensiones en las que se ha desarrollado la organización de la información: - Fenómeno: organización según los fenómenos de la realidad, las cosas que existen en lugar de como las pensamos. Estas consideraciones han llevado al desarrollo de esquemas de clasificación como Brown e Integrative Levels. - Perspectiva: enraizada en la epistemología. Organización según como se estructura nuestro conocimiento, típicamente por disciplina académica, y lleva a una clasificación basada en disciplinas como Dewey. - Documento: transmiten información como las unidades a organizar conduce a formatos de metadatos y a la inclusión de indicadores de tipo de documento o publicación en esquemas de clasificación, tesauros, etc. Puede llevar al desarrollo de herramientas de la Organización de la información basadas en la garantía literaria para que solo se incluyan en un vocabulario los temas, y temas que aparecen en documentos existentes. - Colección: la Organización de la información se aplica a menudo a una colección de alguna tipología documental con el propósito de estructurar la colección para que sea comprensible y utilizable. - Usuario: los sistemas de Organización deben respetar las necesidades, preferencias y capacidades de los usuarios. Hjørland propone que existen cuatro enfoques básicos aplicables a la Organización de la información: - Racionalismo, basado en la aplicación lógica de reglas fundamentales. - Empirismo, basado en la evaluación de similitud según la comparación neutral de todos los criterios disponibles. - Historicismo, basado en el análisis del desarrollo a lo largo del tiempo, reuniendo entidades que tienen un ancestro común o que están relacionadas en el desarrollo de la teoría. - Pragmatismo, basado en un análisis crítico y subjetivo del propósito de la organización para resaltar relaciones significativas para ese propósito. Se identifican varias ideas fundamentales dentro de la Organización de la información: a) CONCEPTOS Y CATEGORÍAS Concepto: unidad mínima de conocimiento, una idea. Los conceptos son significativos para la Organización de la información de dos maneras principales. El análisis de la naturaleza conceptual del documento determina su temática, por la cual puede ser clasificado. Y las herramientas de la Organización de la información como esquemas de clasificación y los tesauros, están construidas a partir de conceptos. Los conceptos se dividen en categorías, grupos de conceptos generalmente similares o con algo en común que pueden ser superpuestos o mutuamente excluyentes. La idea de categorías y cómo se forman se remonta a Aristóteles. b) JERARQUÍA Y FACETAS La división en categorías se realiza típicamente mediante una jerarquía, otra idea que se remonta a la Grecia clásica. Genérica: por tipo o clase → PLANTA → PLANTAS CON FLORES → ROSAS Partitiva: por parte de un todo → CUERPO HUMANO → BRAZO → MANO Enumerativa: por instancia o ejemplo → OCÉANOS → ATLÁNTICO La jerarquía proporciona una forma de organizar cualquier estructura de conocimiento o colección de información, pero es rígida y unidimensional, y no permite mostrar otras relaciones entre los conceptos. Las facetas son aspectos no jerárquicos de un área temática utilizadas para formar clases, y su análisis implica dividir los conceptos dentro de un dominio temático en secciones consistentes. Fue originado por el bibliotecario y documentalista indio S. R. Ranganathan, quien propuso un conjunto de cinco “facetas fundamentales” aplicables a cualquier tema: Personalidad, Materia, Energía, Espacio y Tiempo (PMEST). Posteriormente se han propuesto extensiones y conjuntos alternativos de facetas fundamentales, pero suelen adaptarse a cada caso. c) VOCABULARIO CONTROLADO Conjunto de términos acordados y estandarizados que se utilizan con algún propósito de Organización de la información, principalmente en la indización y en la recuperación. Varían desde los más simples: listas de palabras clave y anillos de sinónimos, hasta otros más complejos: términos y explicaciones de términos. Lo opuesto es el lenguaje natural, aquel que no recibe control ni limitaciones: texto completo, palabras clave y etiquetas elegidas libremente, etc. El término Sistema de Organización de Conocimiento (KOS) se utiliza como el concepto más amplio para las herramientas de Organización de la información, que incluyen todos los vocabularios controlados, listas de términos no controlados y también taxonomías científicas. Suelen describirse como alfabéticos, con los términos dispuestos en orden alfabético según el idioma del vocabulario, o sistemáticos, con los términos dispuestos según el sistema de una clasificación o taxonomía. Los simples se limitan a una forma, como una lista de términos sin ninguna relación presentada en orden alfabético o en un orden arbitrario, los complejos son clasificaciones como Dewey con índices alfabéticos, y las taxonomías y tesauros. Representan conceptos y temas, en lugar de nombres propios. Tipos: Lista de descriptores: términos normalizados y controlados. Forma más simple de vocabulario controlado alfabético, incluyen sinónimos y su uso es muy limitado. Encabezamientos de materia: lista de términos que se utilizan para la indización y recuperación, y a veces para la navegación. Incluyen sinónimos y a veces relaciones jerárquicas y “VER TAMBIÉN”. Los Encabezamientos de Materia de la Biblioteca del Congreso (LCSH) es el más utilizado. Publicado en 1914. Tiene más de 250.000 términos que cubren todas las áreas temáticas, con aproximadamente 4.000 añadidos al año. Las relaciones USE/USE FOR, BROADER TERM, NARROWER TERM y RELATED TERM están incluidas. Es precisa. Tesauros: la norma ISO 25964 define como vocabulario controlado en el que los conceptos están representados por términos, organizados para que las relaciones entre los conceptos se hagan explícitas, y los términos preferidos van acompañados de entradas principales para sinónimos o cuasi-sinónimos. Relaciones: o Equivalencia: mediante USE y USADO POR. Denota términos sinónimos o cuasi-sinónimos. Muestra que el principio rector del vocabulario es la conveniencia pragmática, más que el realismo ontológico. o Jerarquía: se establecen términos generales (TG) y términos específicos (TE), cuando un término está dentro del ámbito del otro. Permite su conversión a taxonomía. Puede ser genérica, parte-todo, instancia. o Asociativa: señala términos adicionales útiles para los indizadores o usuarios durante la búsqueda de información, términos relacionados (TR) o Véase además (V.a.). La norma ISO 25964 recomienda NA, notas de alcance, definiciones de términos y/o prescriben su uso en la indización o recuperación. 2. METADATOS PARA LA ORGANIZACIÓN DE LA INFORMACIÓN Datos que describen y proporcionan información sobre otros datos. En el contexto de la Organización de la información, son datos que describen la naturaleza y el tema de un documento; registros cortos, estructurados y estandarizados, que pueden actuar como sustitutos del documento original para la búsqueda y visualización. Son cruciales para la Organización de la información, ya que proporcionan la información necesaria para organizar, gestionar, buscar y acceder a los documentos. La creación y uso de metadatos han sido considerados como procesos intelectuales llevados a cabo por personas expertas, aunque están siendo creados por máquinas. Existen algunos estándares destinados a su uso automatizado, como la familia de estándares ONIX (Intercambio de Información en Línea) creados y usados por la industria editorial, que se utiliza para transmitir datos bibliográficos y de licencias. Enfoques en relación con los metadatos: Bibliográfico de larga data, relacionado con las bibliotecas y ejemplificado por el estándar de Catalogación Legible por Máquina (MARC) Recursos digitales e internet, ejemplificado por Dublin Core. Los metadatos descriptivos incluyen una descripción del ítem, como su título, autor, fecha de publicación o creación, forma física, etc., y una indicación de su contenido. PROPÓSITOS Haynes (2018): - Identificar y describir recursos de información - Gestionar los derechos de propiedad intelectual - Recuperar información - Respaldar el gobierno y el comercio electrónico - Gestionar recursos de información - Permitir la gobernanza de la información ESTÁNDARES/FORMATOS/ESQUEMAS DE METADATOS Conjunto de campos con reglas para su uso, diseñado para un contexto particular. Evolucionan constantemente y dan lugar a ramificaciones. Se considera que todos tienen tres componentes: semántica, reglas de contenido y sintaxis. Zeng y Qin distinguen cuatro categorías de estándares 1. Estándares para estructuras de datos: más conocida, a veces denominados vocabularios o conjuntos de elementos de metadatos. Gobiernan la semántica de los metadatos, especificando los elementos o campos que se deben utilizar. Incluyen: o Estándar Dublin Core para materiales web y estándares de metadatos bibliográficos como la familia MARC, MODS (Esquema de Descripción de Objetos de Metadatos) y BIBFRAME o Estándares para contextos específicos: ▪ EAD (Descripción de Archivos Codificados) para archivos. ▪ CDWA (Categorías para la Descripción de Obras de Arte) para museos y galerías. ▪ CIDOC CRM (Modelo de Referencia Cultural) para patrimonio cultural. ▪ VRA Core (Asociación de Recursos Visuales) para materiales visuales. 2. Estándares para el contenido de datos: especifican cómo se debe crear el contenido de los metadatos. Ejemplos: ▪ AACR (Reglas Angloamericanas de Catalogación) y RDA (Descripción de Recursos y Acceso). ▪ ISAD (G) (Norma Internacional para la Descripción Archivística) o DACS (Describiendo Archivos: un Estándar de Contenido) para archivos. ▪ CCO (Catalogación de Objetos Culturales) para galerías y museos. 3. Estándares para el intercambio de datos: estos gobiernan la sintaxis de los metadatos. Ejemplos: ▪ XML, para expresar conjuntos de elementos y crear esquemas de metadatos con un espacio de nombres que denota la ubicación de los componentes y definiciones. ▪ RDF (Marco de Descripción de Recursos), para proporcionar metadatos en forma de datos enlazados, basados en la descripción de recursos en tripletas. RDF y XML construyen modelos de metadatos más específicos, como el lenguaje de ontologías web (OWL), diseñado para representar ontologías, y el Sistema Simple de Organización del Conocimiento (SKOS), un modelo para representar vocabularios controlados como esquemas de clasificación, taxonomías, listas de encabezamientos de materia y tesauros. Existen estándares para datos estructurales, “estándares de empaquetado”: definen cómo se crean documentos digitales a partir de unidades más pequeñas. Un ejemplo es el Estándar de Codificación y Transmisión de Metadatos (METS), desarrollado originalmente por la Biblioteca del Congreso para archivar elementos digitales. Estándares para metadatos de preservación, como PREMIS (Estrategias de Implementación de Metadatos de Preservación), y estándares para el marcado de documentos, proporcionan coherencia al etiquetar partes de documentos. Un resumen del documento también pueden ser parte de los metadatos. Su origen fue en la época clásica, con los primeros diarios de abstracción reconocibles y secciones de resúmenes en diarios generales del siglo XVIII, su uso se expandió considerablemente en el siglo XIX, junto con la creación de servicios de abstracción e indización especializados por temas. La abstracción e indización automáticas han sido investigadas, desde las primeras realizadas por H. P. Luhn a finales de la década de 1950 hasta ahora. Son informativos si proporcionan suficiente información como remplazar el original, indicativo si proporciona lo suficiente como para que el lector decida si le interesa. 3. DESCRIPCIÓN DE RECURSOS Provisión de metadatos descriptivos para documentos, siguiendo reglas de contenido. En la práctica, describe la forma del documento, su tema, verifica los archivos de autoridad y codifica el registro en un formato adecuado. Charles Ammi Cutter (1837-1903), bibliotecario estadounidense, uno de los creadores de ideas modernas sobre la descripción de recursos en el siglo XIX, argumentó que un catálogo debería cumplir: - Permitir a un usuario encontrar un recurso del cual conoce al menos al autor, título o tema. - Mostrar qué recursos están disponibles escritos por autores específicos o sobre temas determinados. - Ayudar al usuario a elegir el mejor recurso para sus necesidades, considerando la edición y las características. El Modelo de Referencia de Bibliotecas (LRM) de la Federación Internacional de Asociaciones de Bibliotecarios y Bibliotecas (IFLA) establece ideas similares con tareas que la descripción de recursos debería permitir al usuario lograr: - Encontrar: reunir información sobre uno o más recursos de interés mediante la búsqueda de criterios relevantes. - Identificar: comprender claramente la naturaleza de los recursos encontrados y distinguir entre recursos similares. - Seleccionar: determinar la idoneidad del recurso encontrado y tener la capacidad de aceptar o rechazar recursos. - Obtener: acceder al contenido del recurso. - Explorar: descubrir recursos utilizando las relaciones entre ellos y ubicar los recursos en contexto. Aunque hay evidencia de alguna forma de descripción bibliográfica en las bibliotecas y archivos del mundo antiguo, con un desarrollo continuo desde entonces, es a partir del siglo XIX cuando se ha desarrollado la descripción de recursos tal y como se entiende actualmente. El objetivo ha sido tener reglas consistentes, aplicadas de manera amplia y basadas en principios, en lugar de la tradición y el pragmatismo, ejemplos: 1. El primer paso importante fue dado por Sir Anthony Pannizzi cuando creó las reglas para la Compilación del Catálogo, que proporcionaban 91 reglas para el catálogo de libros de la biblioteca del Museo Británico. Posteriormente, este enfoque fue desarrollado en Estados Unidos por Charles Jewett con On the Constructions of Catalogues of Libraries y las Reglas de Cutter para un Catálogo de Diccionario. 2. El deseo de estándares internacionales llevó al desarrollo de las Instrucciones prusianas para los países de habla alemana en 1890, y luego a las primeras Reglas Angloamericanas de Catalogación (AACR) en 1908 y su revisión posterior en 1967. 3. El deseo de contar con un conjunto de principios más racionales llevó al desarrollo de la Descripción Bibliográfica Internacional Normalizada (ISBD) en 1969, la cual establecía a nivel general lo que era necesario al describir un ítem bibliográfico. Esto requería que se especificara: Título y declaración de responsabilidad ['autor’] Descripción física [tamaño, etc.] Edición Serie Material o tipo de publicación [‘forma física’] Nota Publicación, distribución, etc. [‘editor’] Número estándar y condiciones de responsabilidad El número estándar requerido por la ISBD es un identificador único para una obra publicada. Ejemplos: Número Internacional Normalizado del Libro (ISBN) para una obra individual y el Número Internacional Normalizado de Publicaciones Seriadas (ISSN) para publicaciones periódicas, datan de 1960 y 1970 respectivamente, y el Identificador de Objeto Digital (DOI) para objetos digitales de mayor granularidad, como artículos de revistas, introducido en 2000. 4. Una revisión de las AACR en 1978 incorporó estos principios, pero a costa de un detalle para cada tipo de documento, con capítulos separados para libros, mapas, partituras, etc. Las limitaciones percibidas de dichos códigos llevaron al reconocimiento de la ventaja de contar con un modelo formal de datos para la descripción bibliográfica, evitando la complejidad de reglas separadas para describir diferentes tipos de material y minimizando las reglas ad hoc. 5. El primer modelo de este tipo, los Requisitos Funcionales para Registros Bibliográficos (FRBR), se introdujo en 1998. El FRBR se basa en un modelo de entidad-relación, que establece relaciones entre diferentes tipos de documentos y sus atributos, y las personas y organizaciones que los crean y diseminan. 6. Estos modelos son la base del último estándar para el contenido de metadatos, Resource Description and Access (RDA). La versión original, introducida en 2013, se basa en FRBR; las versiones posteriores se basan en el Modelo de Referencia de Biblioteca (LRM). 4. CLASIFICACIÓN Y CATEGORIZACIÓN Formas de Organización de la información que buscan mostrar las relaciones entre conceptos, generalmente relaciones jerárquicas, mediante la agrupación de términos que representan conceptos con significados similares. La clasificación es un sistema para organizar colecciones de materiales impresos por tema, pero también es útil para visualizar y explorar materiales digitales. Puede ofrecer un mapa de un tema o colección, mostrando la interrelación de todas sus partes. 4.1 PRINCIPIOS GENERALES DE LA CLASIFICACIÓN Gran parte de la teoría de la clasificación proviene de la filosofía y ciencias taxonómicas, en particular de la biología. Las raíces filosóficas de la clasificación se encuentran en la división jerárquica del mundo según los atributos de sus entidades, formulada por Aristóteles, con categorías no superpuestas creadas mediante la aplicación de un criterio de división a la vez, y alternativamente en las ideas de Wittgenstein (1889-1951) sobre categorías superpuestas basadas en “semejanzas familiares” con múltiples similitudes. Los dos enfoques, aplicables tanto a la taxonomía científica como a la clasificación del conocimiento y documentos, se denominan monotéticos (única característica común) y politéticos. Dado que las clasificaciones, en la Organización de la información, se crean con base en conceptos y su significado, son necesariamente subjetivas, ya que las todas las formas en que los conceptos se pueden categorizar y ordenar son válidas. El problema se da en los temas y documentos que tratan un solo concepto, no podemos decir que un documento trata un solo tema y, por lo tanto, tiene un único lugar en un esquema de clasificación. Lo que se puede lograr es especificar un orden de los aspectos, el orden de cita, e idealmente tener un sistema que permita el acceso por cualquier aspecto. 4.2 TIPOS DE CLASIFICACIÓN POR DISCIPLINAS Se organiza por áreas de estudio. Todas las clasificaciones bibliográficas son de este tipo. Es conveniente para encontrar materiales de naturaleza general y perspectiva requerida, pero dispersa cualquier concepto o entidad particular. ENUMERATIVA Enumera todos los aspectos del conocimiento dentro de su ámbito; invariablemente se organizan de forma jerárquica, dividiendo y subdividiendo el conocimiento. Adecuadas para organizar grandes volúmenes de material, por lo que son ampliamente utilizadas para una clasificación en bibliotecas. Son estáticas, por lo que son problemáticas para cambios de estudio que cambian rápidamente. ESQUEMAS GENERALES DE CLASIFICACIÓN - Clasificación Decimal Dewey: más utilizada. Diseñada por el bibliotecario estadounidense Melville Dewey y publicada por primera vez en 1876, va por 23ª edición. Originalmente era un esquema enumerativo, con sus conocidas diez clases disciplinarias principales, divididas y subdivididas para permitir su notación decimal. Su estructura refleja el mundo occidental del siglo XIX y el entorno de las “artes liberales”. Base teórica limitada. - Clasificación Decimal Universal: creada en 1905 por los documentalistas Paul Otlet y Henri La Fontaine como una extensión del esquema de Dewey, para permitir la recuperación de documentos en lugar de simplemente la disposición en estanterías de libros. Fue el primer esquema con naturaleza analítico-sintética, y era más flexible para tratar temas detallados y complejos que las clasificaciones anteriores. - Clasificación de la Biblioteca del Congreso: concebida por esa biblioteca en 1901. Ejemplo más puro de esquema enumerativo grande que tiene capacidades sintéticas limitadas y proporciona listados de temas muy detallados basados en la enumeración dentro de 21 clases disciplinarias principales. - Clasificación de Colón: clasificación disciplinaria completamente facetada, la primera de su tipo, publicada por Ranganathan en 1933 y desarrollada a través de dos revisiones principales y numerosas ediciones. Organizada según el principio de análisis de facetas PMEST (Personalidad, Materia, Energía, Espacio y Tiempo), destinada a ser usada con cualquier tipo de documento en el contexto de una biblioteca. - Clasificación Bibliográfica de Bliss: la primera edición fue publicada en 1930 por Henry Evelyn Bliss (1870-1955), uno de los primeros teóricos de la organización de la información. Se consideraba el más académico y filosóficamente sólido de los esquemas enumerativos. - Clasificación de Temas Brown: desarrollada por el bibliotecario británico James Duff Brown (1862-1914) y publicada en 1906, es unejemplo temprano de una clasificación de fenómenos, con una naturaleza analítico-sintética. No se utiliza en la práctica. - Clasificación de Niveles Integrativos: clasificación de fenómenos completamente facetada basada en la idea de niveles de realidad en teorías generales de sistemas y aplicable a cualquier documento. Se está desarrollando principalmente para concretar ideas de la teoría de clasificación. - Clasificación de Conceptos Básicos: clasificación de fenómenos completamente facetada en desarrollo, diseñada para conectar a los usuarios con cualquier documento, objeto o idea, y proporcionar una clasificación general de particular valor para cuestiones interdisciplinarias. Se construye en la medida de lo posible a partir de conceptos que son tan fundamentales que se entienden de la misma manera en todos los contextos y sociedades. 5. TAXONOMÍAS Clasificación científica de algún aspecto del mundo natural. Características: Clasificaciones jerárquicas y se pretende que representen un aspecto del mundo tal como es en realidad. Clasificación diseñada para un entorno o conjunto de información; no tiene porqué cubrir un área temática. Suelen ser construcciones intelectuales, pero también pueden generarse y mantenerse automáticamente. Herramienta popular para organizar recursos de información digital y apoyar la navegación y búsqueda. Pueden estar vinculadas a un tesauro para ver los términos de la taxonomía en orden alfabético. Puede diferir de las normas aplicadas en la clasificación, como al repetir conceptos en distintos niveles. Pueden ser una descripción de alto nivel de un tema. Pueden incluir mucha información descriptiva sobre los conceptos y elementos, actuando como un glosario. Puede incluir muchos ejemplos específicos. Puede tener más similitud con un tesauro que con una clasificación de biblioteca. Se utilizan para dar acceso a diversas formas de materiales, para respaldar programas de gestión del conocimiento. 6. ONTOLOGÍAS En las ciencias de la información se aplica para dar una descripción formal de un dominio de conocimiento, en términos de las entidades dentro de él y sus relaciones, que pueden procesarse por computadora. Características: Se utilizan en las ciencias naturales, para organizar y codificar la base de conocimientos de un tema, estandarizar el uso de términos y facilitar la interoperabilidad entre sistemas y bases de datos, indización y recuperación de info. Destinadas a representar la realidad, presentan una clasificación correcta de las entidades: realidad ontológica. Incluyen cualquier tipo de relaciones entre entidades necesarias para representar la verdad, son específicas y detalladas, y van más allá de las relaciones de la jerarquía y asociación de los vocabularios de LIS (Library and Information Science). Pueden incluir axiomas y reglas para ayudar al procesamiento automático. Diseñadas para ser representadas en lenguajes formales, como OWL (Web Ontology Language, su extensión en RDF), para su procesamiento por computadora. A menudo se sugiere que los vocabularios de LIS, como las clasifiaciones, taxonomías y tesauros, son ontologías simples, limitadas en el rango de relaciones entre entidades permitidas, mientras que otros argumentan que las ontologías deben considerarse distintas de otras formas de voacbulario debido a la forma en que se definen las entidades y se crean las relaciones. Se diferencian en que los vocabularios LIS reconocen la subjetividad y el pragmatismo en su creación, a diferencia de la afirmación del realismo ontológico. En LIS se utilizan cada vez más para la organización y recuperación de información en vez de taxonomías o tesauros. En LIS existe una superposición creciente entre la naturaleza y uso de las ontologías y otros vocabularios, especialmente cuando las taxonomías y los tesauros se representan comúnmente en lenguajes de ontología (OWL). 7. INDIZACIÓN Representar por medio de palabras clave en lenguaje natural, el contenido íntegro de un objeto documental registrado. Etapas: comprensión y análisis del contenido, y traducción de conceptos en términos de indización. Criterios: exhaustividad y profundidad. 1. TECNOLOGÍAS DIGITALES Cualquier dispositivo digital representa datos en forma de dígitos binarios o bits, 0 y 1. El código más utilizado desde el inicio de la era de la computadora fue el código ASCII (Código Estándar Estadounidense para el Intercambio de Información) de 7 bits del Instituto Nacional Estadounidense de Estándares (ASNI), está limitado al alfabeto latino, números arábigos y otros símbolos. Ha sido reemplazado por Unicode puede manejar más símbolos y escrituras. La idea de que una máquina de cómputo de propósito general podría ser posible deriva de los estudios teóricos del matemático británico Alan Turing (1912-1954), cuyo concepto de la máquina de Turing, desarrollado en la década de 1930, demostró que una sola máquina limitada a unas pocas operaciones simples podría realizar cualquier tarea. Los ordenadores están conectados virtualmente a través de algún tipo de red, permite la comunicación, el acceso y el intercambio de información. La World Wide Web es un sistema que permite el acceso a documentos de hipertexto interconectados almacenados en ordenadores en red, lo creó Sir Tim Berners-Lee en el CERN. El Internet de las Cosas (IoT) es la agregación de dispositivos “inteligentes” habilitados para la red de todo tipo, para recopilar y compartir datos. El software proporciona las instrucciones para que las computadoras digitales realicen sus tareas y se puede clasificar en software de sistema (firmware y sistemas operativos) y software de operaciones. El firmware, como el BIOS (Sistema Básico de Entrada/Salida), EFI (Interfaz de Firmware Extensible) y UEFI (Interfaz de Firmware Extensible Unificado), se instala en fábrica, y se activa cuando se enciende la computadora para iniciar el hardware y el sistema operativo. El sistema operativo, específico para un tipo particular de computadora, controla el hardware, asigna recursos del sistema y ejecuta aplicaciones. Hay cuatro tipos de lenguajes de software: lenguajes de programación de bajo nivel, de alto nivel, lenguajes de script y de marcado. La IA es un recurso creciente de agencia interactiva, autónoma y de autoaprendizaje, que permite que los artefactos computacionales realicen tareas que de otro modo requerirían al humano para llevarse a cabo con éxito. El artículo de Alan Turing de 1950 “Computing Machinery and Intelligence”, fue la primera investigación filosófica sobre si las máquinas pueden pensar. Aprenden de tres formas: Aprendizaje supervisado: se proporciona un conjunto de datos etiquetados que incluye entradas y salidas esperadas. El objetivo es que aprenda a hacer predicciones precisas basadas en estos ejemplos. Aprendizaje por refuerzo: el modelo aprende a tomar decisiones secuenciales por una interacción con el entorno, desde el que recibe recompensas y penalizaciones en función de las acciones que toma. Maximiza recompensas. Aprendizaje no supervisado: el modelo se entrena con un conjunto de datos no etiquetados y se le pide que encuentre patrones o estructuradas en los datos por sí mismo. 2. INTERFACES, INTERACCIÓN Y ARQUITECTURA DE LA INFORMACIÓN Las formas en la que las personas interactúan con las computadoras, interacción persona-computadora (HCI), interacción humano-información, diseño de interacción o usabilidad, son áreas importantes para las ciencias de la información. Se ocupa especialmente del diseño y la evaluación de interfaces para sistemas de información. La arquitectura de la información es la organización y estructuración de espacios complejos de información digital, típicamente en sitios web. Se basa en los principios del diseño de información en la página impresa, de la HCI y de la categorización y taxonomía. El término “arquitectura de la información” fue acuñado por Saul Wurman en la década de 1970, quien llegó a creer que los principios detrás de diseños de lugares físicos podrían ser aplicables a los espacios de información. Cobró importancia a finales de la década de 1990, al establecer orden y estructuras en la expansión web. 3. SISTEMAS DE DATOS Ciencia de datos: combina estadística, matemáticas y programación, sirve para buscar patrones de grandes cantidades de información. Su crecimiento junto con el énfasis creciente de la gestión y curación de datos ha sido una influencia importante en la ciencia de la información desde 2010. Manipulación de datos: actividades relacionadas con el manejo de datos. o Recolección: es más simple ir escribiendo los datos desde cero. Si ya están impresos con una estructura reconocible, se puede utilizar el reconocimiento óptico de caracteres (OCR), aunque rara vez no genera errores y la entrada debe ir seguida de una limpieza. Si son digitales, se pueden seleccionar y copiar. Si los datos requeridos se encuentran en una o más páginas web, se puede utilizar un proceso de extracción de datos web para obtenerlos. Implica la extracción automática de información de sitios web, tomando elementos de datos no estructurados de sitios web y creando datos estructurados a partir de ello, se puede realizar a través de un código o una extensión de navegador como Crawly o Parsehub. Más fácil con Interfaz de Programación de Aplicaciones. o Almacenamiento: los datos se pueden almacenar en sistemas de bases de datos como MySQL, Oracle y Microsoft Access, y paquetes de análisis de datos como SAS o SPSS. El más común es Microsoft Excel. Los formatos de intercambio son simples y se utilizan para mover datos entre formatos o sistemas más complejos. Ejemplos: ▪ CSV (Comma Separated Values): almacena datos en forma de texto plano como una serie de valores separados por comas en líneas, siendo como una tabla. ▪ JOSN (Javascript Object Notation): similar a XML y puede representar diversas estructuras y relaciones. o Limpieza: procesos para crear datos ordenados. Para ello, los datos se pueden escanear virtualmente y corregir errores manualmente. Un proceso automatizado es más eficiente y menos propenso a errores. EL medio más preciso para la limpieza algorítmica de datos utiliza Expresiones Regulares (RegEx), un subconjunto de un lenguaje formal para describir patrones en texto, que garantiza la consistencia. Es usar las matemáticas para describir formalmente todas las operaciones que las computadoras pueden realizar al manipular texto. EN la práctica, las expresiones regulares son cadenas de búsqueda con caracteres especiales que indican exactamente lo que se desea: ▪ “.” Coincide con cualquier carácter. ▪ “[]” Coincide con cualquiera de los caracteres dentro de los corchetes. ▪ “^” coincide con el inicio de una línea de texto. o Combinación y reutilización: los datos digitales permiten combinar e integrar diferentes formatos y medios. ▪ Mashups: datos de más de una fuente mostrados en una vista única. ▪ Remix: modificación o reutilización de datos con el fin de crear algo novedoso. Técnicas para encontrar significado en los datos: o Minería de datos y análisis estadístico: identifican elementos valiosos en grandes volúmenes de datos no útiles y prueban la significancia de lo que se encuentra mediante métodos estadísticos. o Visualización de datos: hay muchas formas, incluyendo rutinas en bibliotecas de código, funciones en hojas de cálculo y software de bases de datos, y paquetes de software especializados. Una forma útil para la ciencia de la información es el diagrama de red, que muestra nodos con su tamaño y enlaces con su fuerza. o Visualización de texto: se han identificado más de 400 técnicas, pero pocas han alcanzado un uso generalizado. La más común es la “nube de palabras”, herramienta que genera imágenes compuestas por las palabras del texto, dándole mayor prominencia a las palabras más repetidas. Pero se les ha criticado por dar vistas simplistas de datos complejos, lo mismo ocurre con los métodos “termsberry” y “streamgraph”. 4. SISTEMA DE INFORMACIÓN Sistema socio-técnico formal para recopilar, procesar y compartir información de cualquier tipo. Es un medio para vincular personas, información y tecnología para realizar tareas de manera definida. Pueden ser generales o específicos. Las formas en que se crean y modifican los sistemas de información se denominan análisis y diseño de sistemas. Han cambiado mucho desde su inicio, con una variedad de modelos formales que se ven complementados por enfoques más flexibles, denominados de diversas formas como centrados en el usuario, participativos, receptivos, persuasivos e interactivos, modificando el sistema para adaptarse a las necesidades del usuario, en lugar de lo contrario. En el contexto de los sistemas de gestión de bibliotecas, pero aplicables de manera más general, Breeding enumera 10 principios o conceptos para la evaluación, introducción y uso de sistemas de información: 1. Estrategia 2. Privacidad 3. Seguridad 4. Accesibilidad 5. Eficiencia 6. Confiabilidad 7. Valor 8. Durabilidad 9. Transparencia 10. Innovación 5. RECUPERACIÓN DE INFORMACIÓN, BASES DE DATOS Y HERRAMIENTAS DE DESCUBRIMIENTO Las bases de datos son colecciones de datos. El sistema de gestión de bases de datos (DBMS), o en un sentido más restringido, el sistema de gestión de bases de datos relacionales (RDBMS) son sistemas que manejan datos estructurados, típicamente como números y fragmentos cortos de texto. En Information Science el término se utiliza para los sistemas de recuperación de información (SIR), estos manejan datos menos estructurados que los hechos y cifras tratados por los DBMS, pero más estructurados que los motores de búsqueda web. La “base de datos bibliográfica clásica” jerarquizada: Sistema anfitrión: da acceso a una variedad de bases de datos a través de una interfaz de búsqueda común. Base de datos: colección de material sobre un tema común, producida por una única organización en un formato común. Inicialmente eran equivalentes digitales de servicios de resúmenes e indización impresos, bibliografías, etc., Archivo: forma de búsqueda de una base de datos. La base de datos y el archivo suelen ser l