Teoría TEMA 1 PDF
Document Details
Uploaded by RapturousTroll
Tags
Summary
This document discusses computer systems and the storage and organization of data. It covers the characteristics of data, such as who it is for, the possibility of reusing it, and how data can be shared. It also includes different ways data can be stored, like text and binary data, and looks at how this relates to applications like data used for computers by humans.
Full Transcript
21/11/24, 17:47 Teoría TEMA 1 Tema 1 Reconocimiento de las características de los lenguajes de marcas Una definición poco estricta de lo que es un ordenador podría ser que "es una máquina electrónica que recibe y procesa datos para convertirlos en información útil”. Uno de los componentes básico...
21/11/24, 17:47 Teoría TEMA 1 Tema 1 Reconocimiento de las características de los lenguajes de marcas Una definición poco estricta de lo que es un ordenador podría ser que "es una máquina electrónica que recibe y procesa datos para convertirlos en información útil”. Uno de los componentes básicos en un sistema informático son los datos que puedan introducirse en ellos y cómo lo hace este sistema para almacenarlos para su posterior uso o mostrarlos de nuevo. Por tanto, una de las tareas básicas que realizan los ordenadores es almacenar la información que les proporcionamos para poder ser procesada posteriormente. Esta información puede ser de muchos tipos diferentes (texto, imágenes, vídeos, música...) pero lo realmente importante será cómo lo almacena el ordenador para poder tratarla posteriormente de manera eficiente para generar más información. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 1/39 21/11/24, 17:47 Teoría TEMA 1 1.1. Los datos Los datos son representaciones de aspectos del mundo real y se suelen recoger para realizar cálculos, mostrarlos, organizarlos, etc., con el objetivo de que posteriormente alguien pueda hacer algo: tomar decisiones, generar nuevos datos... Si no se es muy estricto se podría decir que en un sistema informático cualquiera las únicas tareas que se desarrollan consisten en almacenar datos para procesarlos por medio de un programa que o bien aportará algún tipo de información o bien se utilizarán de nuevo para generar nuevos datos. 1.1. Los datos: Las características de los datos Entre las características interesantes sobre los datos destacan sobre todo tres aspectos: o A quién van dirigidas o La posibilidad de reutilizarlas o Que se puedan compartir https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 2/39 21/11/24, 17:47 Teoría TEMA 1 1.1. Los datos: Las características de los datos Destinatario de datos Si se intenta ser algo más práctico se verá que realmente los datos tendrán una forma u otra en función del destinatario al que vayan dirigidos: 1. Datos destinados a los humanos : generalmente los datos destinados a humanos requerirán que tengan alguna estructura concreta, con unos formatos determinados, con textos decorados de alguna manera. Aparecerán títulos, caracteres en negrita, etc. Generalmente no es necesario conocer qué significado tienen los datos, ya que la interpretación se deja al lector. 2. Datos destinados a los programas: los programas generalmente no necesitan que los datos tengan información sobre cómo deben representarse, sino que basta con que sean fácilmente identificables, que quede claro de qué tipo son y que haya alguna manera de determinar qué significan para poder tratarlas automáticamente. 1.1. Los datos: Las características de los datos Reutilización de los datos Muy a menudo los datos querrán reutilizarse para poder realizar tareas diferentes. Un error corriente suele ser almacenarlas especificamente para realizar una tarea concreta, ya que esto puede provocar que posteriormente sea mucho más complicado utilizarlas para realizar otras tareas. Por tanto, es básico disponer de un sistema de almacenamiento que permita conseguir que los datos puedan ser reutilizados fácilmente y si puede que puedan ser reutilizados tanto por las personas como por los programas. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 3/39 21/11/24, 17:47 Teoría TEMA 1 1.1. Los datos: Las características de los datos... Compartición de los datos En el pasado, con los ordenadores centrales la información se generaba y se procesaba en el mismo sitio. Pero la aparición de los ordenadores personales, la eclosión de las redes y, sobre todo, el éxito de Internet, ha creado toda una serie de problemáticas que hasta el momento no existían: los datos generados en un sitio ahora pueden ser consumidos en un sitio totalmente diferente, tales como: o en sistemas operativos totalmente distintos. o en máquinas que pueden funcionar de formas muy diversas. Por tanto, en un sistema informático moderno se debe tener en cuenta esta posibilidad a la hora de almacenar datos. Existe la posibilidad de que estos datos sean compartidos y, por tanto, es necesario almacenarlos de alguna manera que no tenga problemas para usarlos en sistemas diferentes. 1.2. Almacenamiento de datos en ordenadores Dada su arquitectura, los ordenadores almacenan la información en binario y, por tanto, toda la información que se puede almacenar siempre se representará en unos y ceros (1, 0). Esto hace que para representar cualquier tipo de datos (imágenes, vídeos, texto...) sea necesario realizar algún tipo de proceso que convierta los datos a una representación en formato binario. Tradicionalmente en los ordenadores los datos se organizan de dos formas: o Datos de texto o Datos binarios https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 4/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios Almacenar los datos de forma binaria es la forma natural de almacenar datos en ordenadores. Estrictamente hablando, los datos binarios están en el formato que utiliza el ordenador, ya que sólo son una tira de bits uno tras otro. Por tanto, normalmente, un ordenador no deberá realizar ningún proceso especial para almacenar y leer datos binarios. Los datos en formato binario tienen una serie de características que los hacen ideales para los ordenadores: o Generalmente están optimizados para ocupar el espacio necesario. o Los ordenadores los leen fácilmente. o Pueden tener estructura. o Es relativamente fácil añadir metadatos. 1.2. Almacenamiento de datos en ordenadores: Datos binarios Si un programa quiere usar los datos binarios normalmente sólo necesitará conocer el tamaño en bits y, sobre todo, conocer cómo se ha almacenado la información. Para almacenar el número 150 basta con convertir este valor decimal a su representación en binario (10010110) y almacenarlo, Es trivial comprobar que puede ser almacenado en un solo byte (3 bits). Una ventaja añadida de la representación de números en binario es que ya están disponibles inmediatamente para realizar cálculos numéricos, ya que realmente se trata de números. No será necesario realizar ninguna transformación para poder usar este número en cualquier cálculo. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 5/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios Metadatos Muy a menudo no se almacenan directamente los datos tal y como están sino que se procesan para optimizarlos, como almacenando información sobre su contenido o aplicando procedimientos de optimización. Estas optimizaciones son transparentes por el usuario final, que visualizará los datos normalmente. Una de las formas más sencillas de representar una imagen en un ordenador consiste en representar cada uno de los puntos de color que la forman. O sea, que basta con decir de qué color será cada uno de los puntos para poder almacenar la imagen en un archivo. 1.2. Almacenamiento de datos en ordenadores: Datos binarios Podemos utilizar un método sencillo para representar la imagen, como podría definirse si cada uno de los puntos es de color blanco (0) o negro (1). La imagen podrá ser representada de esta forma: pe1100 010010 010010 011110 010010 el10010 https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 6/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios En realidad un ordenador no almacenará la información de esta forma sino de forma lineal, ignorando los saltos de línea. Una representación más cercana a cómo lo haría realmente un ordenador sería ésta: es1100010010019010011110010010010010 Representar la información de este modo hace que las imágenes ocupen mucho espacio y por este motivo normalmente se utilizan métodos para optimizar su almacenamiento. Una de las formas de optimizar el espacio ocupado por la imagen podría ser darse cuenta de que existen varias repeticiones de los colores. De modo que se podría intentar aprovechar esta característica para conseguir un archivo binario más pequeño. 1.2. Almacenamiento de datos en ordenadores: Datos binarios Se podría hacer que en lugar de especificar los puntos uno por uno si existe una repetición se pudiera especificar el número de veces que se repite el color, De esta forma un punto blanco aislado se representará normalmente, pero si se encuentran cuatro puntos blancos, en vez de almacenar 0000se puede representar con 40(4 blancos) El resultado de aplicar este procedimiento en la misma imagen nos dará: 202130120120120120412012012012010 Este procedimiento tiene la ventaja añadida de que con el nuevo sistema los datos ocupan un 10% menos de espacio (33 caracteres) que antes (36 caracteres). A pesar de que con el nuevo sistema no se almacenan todos los puntos, un programa puede conseguir fácilmente representarlos en pantalla siguiendo las especificaciones. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 7/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios Puede verse que en la representación binaria hay toda una serie de valores que estrictamente no son datos de la imagen (los números 2, 3 y 4) sino que son datos que hacen referencia a la forma en que se han almacenado los datos. Estos datos se llaman ” metadatos”. Los metadatos son datos sobre los datos. El uso de metadatos optimiza el almacenamiento de información pero al mismo tiempo hace que la compartición de la información contenida en el archivo sea mucho más compleja. Pero eso sí, es necesario que el programa que quiera recuperar la información conozca el procedimiento que se ha utilizado o no obtendrá los datos correctos. 1.2. Almacenamiento de datos en ordenadores: Datos binarios Datos estructurados Los datos en la forma en que los generamos los humanos no están en un formato que facilite su tratamiento automático por parte de un ordenador. De ahí que a menudo los datos que deben ser procesados por los ordenadores se convierten a algún formato que sea más idóneo para el tratamiento. Lo corriente es tratar los datos para que tengan algún tipo de estructura. Los tipos de datos estructurados son agrupaciones de otros tipos de datos (normalmente tipos más sencillos). https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 8/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios La forma más corriente de estructurar datos binarios suele ser tenerlos agrupados en registros que contienen la información repetitiva de un dato en concreto. Es habitual que los lenguajes de programación tengan alguna forma de definir datos estructurados. Por ejemplo, para estas tareas el lenguaje C utiliza los struct, struct alumno ( char nombre [ 10 ] ; char apellido [ 10 ] ; int nota ; ) Si se puede acceder a cada uno de los registros del fichero se puede acceder de repente a los datos de un alumno, se puede identificar rápidamente la parte de los datos que es el nombre, apellido o nota, y además sabemos si los datos deben ser interpretadas como números o como texto. 1.2. Almacenamiento de datos en ordenadores: Datos binarios En el ejemplo siguiente puede ver que se puede identificar a qué dato corresponde cada uno de los caracteres. Los diez primeros son el nombre, los 10 siguientes son el apellido y los cuatro siguientes son el número entero (32 bits). D 3 15 24 lelelelele] | [|| 1 mlalely[tialelz! | [elelels] NOMBRE APELLIDO NOTA Generalmente estos datos estructurados se almacenan en forma de listas o conjuntos de registros, de modo que el desarrollador del programa podrá acceder a los datos de todos los alumnessimplemente recorriendo los distintos registros uno por uno. Los datos estructurados facilitarán que las aplicaciones puedan tratarlas de forma automática. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 9/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios Estructura de los datos Uno de los problemas de dar estructura a los datos es que esta estructura sólo la entenderán los programas que tengan información sobre la estructura. Al definir cuáles son los datos que utilizará el programa se define qué tamaño tendrá cada campo y cómo se guardarán los datos dentro del archivo binario. 1.2. Almacenamiento de datos en ordenadores: Datos binarios Si tomamos el ejemplo que hemos visto en la figura anterior, para que un programa pueda representar la imagen de manera correcta es necesario que tenga información suficiente para hacerlo: o Primero debe conocer que lo que hay representado es una imagen. o También debe saber que se guarda cada punto de color con un solo carácter. o Es básico que conozca la equivalencia de colores que hemos realizado: O es blanco, 1 es negro. o Y necesita saber que la imagen es de 6 caracteres de longitud por 6 caracteres de ancho o el resultado será muy diferente al inicialmente. o Si se ha representado la imagen utilizando el sistema optimizado debe conocer que los valores numéricos superiores a 1 indican que este valor no es un color sino que son el número de repeticiones del siguiente color. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 10/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios Por ejemplo, aquí vemos algunos intentos de representar el gráfico sin conocer sus dimensiones: H 4 1.2. Almacenamiento de datos en ordenadores: Datos binarios Forma de lectura del procesador De la misma forma que en los lenguajes humanos existen idiomas que se escriben de izquierda a derecha y otros de derecha a izquierda, todos los procesadores no almacenan la información de la misma manera (técnicamente se hace referencia al orden de lectura en las direcciones de memoria). Hay dos grandes sistemas para almacenar la información en ordenadores: o Big endian: los datos se escriben en el orden en que se crean. Así, para escribir "hola" en el ordenador se almacenaría h, o, l, a. Este sistema es el que utilizan los procesadores de Motorola. o Little endian: los datos se guardan de menos aventajado a más aventajado: a, l, o, h. Este sistema es el que utilizan los procesadores de Intel. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 11/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos binarios Lo habitual es que los ordenadores sólo utilicen uno de los dos sistemas, aunque algunos pueden funcionar con ambos indistintamente (ARM, PowerPC, PA-RISC...). Esto no es importante cuando los datos se pasan entre ordenadores que funcionan con el mismo tipo, pero es un aspecto vital a tener en cuenta si los ordenadores que se pasan la información son de tipos diferentes, ya que los datos binarios pasados de un sistema al otro pueden ser totalmente malinterpretadas por culpa de que se almacenan internamente de forma diferente. 1.2. Almacenamiento de datos en ordenadores: Datos binarios Lectura por humanos Un problema distinto es que los datos en formato binario están pensados para ser leídos por máquinas pero no por humanos, por lo que son ideales para ser almacenados en máquinas, van bien para la comunicación de información entre máquinas, pero en cambio para que un humano pueda utilizarlas habrá que tener un programa específico para leerlas. Y además, no sirve cualquier programa, sino que es necesario que el programa entienda la estructura de los datos que contiene el archivo. Por ejemplo, los datos generados por Microsoft Word no pueden ser abiertos con el programa de dibujo Gimp porque no está preparado para entenderlos. Si quien ha desarrollado el programa no ha hecho pública cómo se guardan los datos binarios que se generan será muy difícil compartir datos con otros usuarios si no disponen del mismo programa. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 12/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos de texto Para solucionar el problema que sea necesario recurrir a programas específicos para recuperar los datos que hay en un fichero una posibilidad es hacer lo obvio, hacer lo mismo que han hecho los humanos durante siglos. Los humanos al escribir ya están utilizando una codificación y, por tanto, si se utiliza la misma codificación tendremos los datos en un formato fácil de utilizar y entender que no tendrá problemas para ser leído por los programas. Los archivos de texto almacenan la información letra por letra de forma similar a como lo haría un humano al escribir. Esto hace que se esté generando una información que se podrá leer de la misma forma que se lee un documento de papel. Para un ordenador no hay mucha diferencia a la hora de almacenar los archivos de texto o los archivos binarios, ya que los archivos de texto también son tiras de bits. La diferencia es que esta vez los bits están agrupados de forma estándar y conocida: un código de caracteres. 1.2. Almacenamiento de datos en ordenadores: Datos de texto Representar los datos en un ordenador en forma de texto implica que para poder representar una palabra cualquiera en el ordenador previamente deberá ser codificada para que pueda ser representada en binario (recordemos que los ordenadores sólo pueden representar datos en binario). Esta codificación suele consistir en determinar una cantidad de bits predefinida para marcar un carácter y posteriormente se asocia un valor numérico a cada uno de los caracteres. La equivalencia entre los caracteres y sus valores numéricos no puede realizarse de forma aleatoria, ya que se estaría creando el mismo problema que existe con los datos binarios. Si se quiere conseguir que los datos se puedan leer en diferentes sistemas es necesario seguir algún tipo de norma conocida por todos, Por este motivo aparecieron los estándares de codificación de caracteres. El procedimiento de tener una tabla con los valores numéricos asociados y simplemente realizar la conversión es el procedimiento más habitual pero también se dan casos en los que la codificación deba cumplir algún tipo de reglas o restricciones a la hora de realizar la conversión. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 13/39 21/11/24, 17:47 1.2. Almacenamiento de datos en ordenadores: Datos de texto ASCII Uno de los primeros estándares que fue adoptado mayoritariamente fue ASCII (American standard code for information interchange), que puede verse en la tabla. ASCII codifica cada uno de los caracteres con siete bits Teoría TEMA 1 y define a qué valor numérico se corresponde cada uno de los caracteres de la lengua inglesa. 1.2. Almacenamiento de datos en ordenadores: Datos de texto Carácter Valordecimal Carácter Valordecimal Carácter Valordecimal C: Valor decimal Carácter Valor decimal 32 3 51 F 70 Y 89 1 108 ! 33 4 52 G n z 90 m 109 34 5 53 H 72 [ 91 n 110 * 35 6 Y 73 A 92 o nm Ss 36 7 55 J 74 ] 93 p nu %6 37 8 56 K 75 m 9 q 13 £ 38 9 57 L 76 pe 95 r 14 : 39 : 58 M 77 96 s 15 ( 40 z 59 N 78 a 97 Es 116 ) 4 < 60 o 79 b 98 u 17 + 42 = ÓL Pp 80 c 99 v 118 + 43 > 62 Q 81 d 100 w 19 44 ? 63 R 32 e 101 x 120 45 e 64 s 83 E 102 y 121 a 46 En 65 T 84 8 103 z 122 / 47 B 66 U 85 h 104 1 123 o 48 a 67 Y 86 y 105 | 124 1 49 D 68 w 87 j 106 y 125 2 50 E 69 x 88 k 107 - 126 https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 14/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos de texto La codificación que se realiza en ASCII es relativamente sencilla: simplemente se compara cada uno de los caracteres del texto para codificar en la tabla y se obtiene su valor numérico en binario. Por ejemplo, para codificar la palabra Hola en un ordenador que esté funcionando con el código ASCII deberemos convertir cada uno de los caracteres en su equivalente numérico. Carácter decimal binario H 7 1001000 o 111 1101111 1 108 1101100 a 97 1100001 1.2. Almacenamiento de datos en ordenadores: Datos de texto El primer problema que se encontró para ASCII era que sólo estaba pensado para el inglés y, por tanto, no se disponía de caracteres de uso corriente en otras lenguas: c, á, á, Á, etc. Por tanto, para poder expandirse a otras zonas se creó un ASCII expandido, que incrementó el número de bits a 8, y gracias a este bit extra se podían especificar los caracteres específicos de cada idioma que el inglés no tenía. De esta forma se permitía crear textos en otros idiomas que utilizaran el alfabeto latino. Esto hizo que aparecieran muchas variedades de ASCII, especializadas en un grupo de idiomas (ISO 8859-1, ISO 8859-2, etc.). Pero como cada idioma utilizaba los valores nuevos para añadir sus caracteres propios la información representada utilizando uno de estos “ ASCII ” no siempre se veía bien en otro de los “ASCII”. Además, ASCII y ASCII expandido sólo estaban pensados para idiomas que utilizaran el alfabeto latino y, por tanto, los idiomas no basados en el alfabeto latino debían recurrir a otras codificaciones. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 15/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos de texto Unicode Unicode es un intento de sustituir los códigos de caracteres existentes por uno genérico que sirva para todas las lenguas, y por tanto supere todos los problemas de incompatibilidad que se producían en entornos multilingúes y permita añadir los caracteres no latinos. La idea básica de Unicode es dar a cada uno de los símbolos un identificador único universal de forma que se puedan utilizar en el mismo documento idiomas distintos sin que ello comporte problemas de representación. La adopción de Unicode resuelve de una vez todos los problemas de representación de caracteres en archivos de texto. 1.2. Almacenamiento de datos en ordenadores: Datos de texto Unicode define tres formas de codificación básicas UTF ( Unicode transformation format): o UTF-8: Sistema basado en un byte con algunos símbolos de longitud variable o UTF-16: Sistema de longitud variable basada en dos bytes o UTF-32: Sistema de longitud fija que utiliza 32 bits por cada carácter Unicode ha sido adoptado de forma general por la mayoría de sistemas operativos modernos. Actualmente casi todos los sistemas operativos utilizan alguna variedad de Unicode (Linux suele utilizar UTF-8 y Windows adapta UTF-16). https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 16/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos de texto Gracias al uso de estándares de códigos de caracteres la información en forma de texto es más fácilmente compartida que la información binaria, ya que los códigos de caracteres que utilizan los sistemas para representar el texto son conocidos y pueden ser implementados libremente, Por tanto, almacenar los datos en formato de texto aporta dos grandes ventajas: o Pueden usarlas una gran cantidad de programas que ya existen (editores de texto, navegadores, etc.). o Pueden leídas por humanos. Con uno de los programas más simples que existen, un editor de texto, se puede crear un documento que se podrá compartir con cualquier persona que entienda el idioma en el que ha sido escrito. Y como todos los sistemas operativos llevan de serie programas capaces de cargar archivos, si se envía el archivo a alguien éste no tendrá ningún problema para interpretar los datos cuando los reciba. 1.2. Almacenamiento de datos en ordenadores: Datos de texto Generar información en archivos de texto también tiene algunos problemas: o Ocupan más espacio en el disco que los binarios. o Existen múltiples códigos de caracteres diferentes. o La forma en que los tratan los diferentes sistemas operativos. o Falta de estructuración de datos, Pero a pesar de los problemas, estos son mucho menos importantes que los que tenemos para compartir archivos binarios. Por tanto los archivos de texto son la manera más sencilla de asegurarnos de que podemos compartir la información que hay con otras personas. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 17139 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos de texto Uno de los problemas que tienen los archivos de texto es que la información ocupa mucho más espacio de lo que ocuparía si se almacenara en formato binario. Por tanto, si queremos almacenar el número 150 en un ordenador, el resultado será diferente en función del formato elegido. Para almacenar el número en formato binario simplemente se convierte a binario y se podrá almacenar en un byte (8 bits) mientras que si se desea almacenar en formato de texto utilizando ISO-8869-1 deberán guardarse por separado cada uno del tres caracteres ( 1, 5y 0). Con el segundo sistema se necesitarán 3 bytes (24 bits): ¡el triple de espacio! Pero además, si la información guardada en formato binario es necesaria para realizar algún cálculo, ya se puede utilizar inmediatamente, ya que se almacena realmente el número; mientras que si tenemos el número en formato de texto deberemos convertirlo en su equivalente numérico antes de poder realizar cualquier operación matemática. 1.2. Almacenamiento de datos en ordenadores: Datos de texto Representación de caracteres no textuales Otro problema que suele haber en la lectura de datos de texto cuando se hace en diferentes sistemas operativos suele estar relacionada con cómo se realiza el tratamiento de los caracteres no textuales. El ejemplo más conocido es el diferente tratamiento que hacen de los saltos de línea los sistemas Windows y las distintas variedades de Unix y Linux. Para representar los saltos de línea en el texto los sistemas operativos utilizan alguno de los caracteres no imprimibles del código de caracteres, y por tanto, de este modo tienen una manera “transparente al usuario” de poder representar el texto tal como el ha escrito. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 18/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos de texto Lectura de datos automatizada Los programas de ordenador todavía no son muy buenos interpretando los datos si están en texto narrativo y, por tanto, generalmente conviene que los datos que tendrán que ser tratados por programas de ordenador estén definidos con algún tipo de estructura para que los sean más fáciles de tratar. Se han inventado sistemas para que los datos de los archivos de texto puedan ser estructurados. Uno de los formatos que se ha utilizado durante mucho tiempo para exportar datos estructurados contenidos en bases de datos u hojas de cálculo a texto ha sido el CSV ( comma separated values ). 1.2. Almacenamiento de datos en ordenadores: Datos de texto El CSV simplemente se limita a separar cada uno de los registros de la estructura en líneas y los campos se separan con comas. Además, para poder definir los tipos de datos, envuelve de comillas los datos de texto, mientras que no se ponen comillas en las numéricas. "Manuel", "García", "Hernández", 8 "Pedro”, "González", "Solís", 5 "María”, "López", "Verde", 7 https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 19/39 21/11/24, 17:47 Teoría TEMA 1 1.2. Almacenamiento de datos en ordenadores: Datos de texto Además, una ventaja añadida de CSV es que es relativamente fácil añadir más datos a un archivo que esté en formato CSV, ya que sólo es necesario un editor de texto y respetar las reglas de separar los datos con comas y dar un salto de línea para cada registro. Por tanto un programa puede deducir fácilmente que los datos de texto se identifican por estar entre comillas y los numéricos por no estarlo. Pero los sistemas de estructurar datos en archivos de texto también tienen problemas. Si necesitamos añadir más datos a cada registro es casi seguro que obligará a realizar cambios en el programa que los tratará. El programa necesita saber qué datos hay en cada una de las columnas para poder trabajar y, por tanto, si modificamos las columnas puede malinterpretar los datos. 1.3. Archivos de marcas Se puede decir que los archivos de marcas son una manera diferente de almacenar información en ordenadores que se añade a los modos de almacenar la información por medio de archivos binarios o archivos de texto. El objetivo principal de los archivos de marcas es intentar recoger las mejores características de los archivos de texto y binarios y esquivar sus problemas. Los archivos de marcas toman como base los archivos de texto para aprovecharse de las características más interesantes de este tipo de archivos: o La facilidad de creación y lectura. o El cumplimiento de estándares de almacenamiento definidos y públicos. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 20/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas Puesto que los archivos de texto siempre están almacenados en algún código de caracteres conocido ( ASCII, UTF-8, etc.) se consigue que puedan ser transportados y leídos en cualquier plataforma, sistema operativo o programa que pueda interpretar estos códigos de caracteres, Por tanto, los lenguajes de marcas se aprovecharán de esta característica, al estar basados en el formato de texto. Además, también tendrán la ventaja de que podrán ser abiertos y creados con los programas de edición de texto estándar. Desde editores tan simples como el Bloque de notas de los sistemas Windows o Gedit de sistemas Unix hasta editores más complejos como Microsoft Word, pasando por editores especializados en XML como Oxygen XML Editor. Los archivos de marcas, por tanto, se aprovechan de una de las grandes ventajas de los archivos de texto sobre los archivos binarios, ya que estos últimos requieren ser abiertos con un programa específico que pueda interpretar su formato. 1.3. Archivos de marcas Pero los archivos de marcas no sólo se intentan aprovechar de las características de los archivos de texto sino que también intentan conseguir las características más interesantes de los archivos binarios, como: o Laincorporación de metadatos. o La definición de la estructura de los datos. Esto hace que los lenguajes de marcas adquieran una de las características más interesantes de los archivos binarios, que es la posibilidad de incorporar información sobre los datos -metadatos- pero intentando que afecte lo menos posible a la legibilidad del documento. También permiten definir los datos y su estructura de forma que sea sencillo para un programa poder interpretarlos. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 21/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas Gracias a las ventajas que ofrecen los lenguajes de marcas, éstas se han convertido rápidamente en una de las formas habituales de representar datos y se pueden encontrar continuamente en las tareas habituales con ordenadores: o El exponente más popular es Internet -la Web-, basada totalmente en los lenguajes de marcas. o Muchos de los programas de ordenador que utiliza habitualmente utilizan en algún momento alguna u otra forma de algún lenguaje de marcas para almacenar sus datos de configuración o de resultados: o Internamente los formatos de documentos de Microsoft Office o de OpenOffice.org o LibreOffice están basados en lenguajes de marcas. o Microsoft Visual Studio guarda su configuración utilizando lenguajes de marcas. o etc. 1.3. Archivos de marcas: Las marcas Las marcas son una serie de códigos que se incorporan a los documentos electrónicos para determinar su formato, la forma en que deben imprimirse, la estructura de los datos, etc. Por tanto, son anotaciones que se incorporan a los datos pero que no forman parte de ellos. Las marcas, por tanto, deben ser fácilmente distinguibles del texto normal (por su posición, porque siguen algún tipo de sintaxis, etc.). Las marcas más usadas son las que están formadas por textos descriptivos y están rodeadas de los símbolos de “más pequeño” () y normalmente suele haber una al principio y una al final: Manuel García Hernández https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 22/39 21/11/24, 17:47 1.3. Archivos de marcas: Las marcas Teoría TEMA 1 Estas marcas pueden estar tabuladas para indicar estructuras de datos : Manuel García Hernández Pedro González López María Varga Iglesias 1.3. Archivos de marcas: Las marcas Estas marcas pueden estar tabuladas para indicar estructuras de datos : Manuel García Hernández Pedro González López María Varga Iglesias https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 23/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Las marcas Pero hay otras muchas formas de marcas. Otra idea consiste en encontrar alguna combinación de caracteres que raramente salga en el lenguaje habitual. El TeX utiliza las barras invertidas para indicar el inicio de las marcas: Asectionf[Personas) Wegin(itemizej Vitem Manuel García Hernández Vitem pedro González López Vitem María Varga Giménez Yend(itemize) 1.3. Archivos de marcas: Las marcas Otros lenguajes de marcas utilizan caracteres no habituales en determinadas posiciones para indicar que son marcas. Por ejemplo con Wiki Markup los caracteres "=" en la primera posición de una línea se utilizan para indicar que el texto es un título de apartado y el *para las listas de puntos: Personas = Manuel García Hernández Pedro González López María Varga Giménez E £ 1 La idea general es que es necesario que las marcas sean fácilmente identificables para poder aprovecharnos de las ventajas que ofrecen los lenguajes de marcas. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 24/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Características de los lenguajes de marcas Los lenguajes de marcas han destacado por una serie de características que les han convertido en los tipos de lenguajes más usados en la informática actual para almacenar y representar los datos. Entre las características más interesantes que ofrecen los lenguajes de marcas se encuentran: o Que se basan en el texto plano. o Que permiten utilizar metadatos. o Que son fáciles de interpretar y procesar. o Que son fáciles de crear y lo suficientemente flexibles para representar datos muy diversos. Las aplicaciones de Internet y muchos de los programas de ordenador que se utilizan habitualmente utilizan de algún modo u otro algún lenguaje de marcas. 1.3. Archivos de marcas: Características de los lenguajes de marcas Basados en texto plano Los lenguajes de marcas se basan en texto plano sin formato. Estos caracteres pueden estar codificados en diferentes códigos de caracteres: ASCII, I50-8859-1, UTF-8, etc. Una de las ventajas que intentan aportar los lenguajes de marcas es que se pueden interpretar directamente y esto sólo es posible si utilizamos el formato de texto, ya que los binarios requieren un programa para interpretarlos. Pero además tienen la ventaja de que son independientes de la plataforma, sistema operativo O programa. El hecho de que estén basados en formato de texto hace que sean fáciles de crear y modificar porque sólo requieren un simple editor de textos. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 25/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Características de los lenguajes de marcas Uso de metadatos Las marcas se intercalan entre el contenido del documento, por lo que generalmente estas etiquetas suelen ser descriptivas de qué es lo que indica el contenido de los datos que contienen. Estas marcas son la forma en que se añaden los metadatos a los documentos de texto y cómo se consiguen superar las limitaciones del formato de texto y conseguir algunas de las ventajas de los archivos binarios. 1.3. Archivos de marcas: Características de los lenguajes de marcas Facilidad de proceso Los lenguajes de marcas permiten que el procesamiento de los datos que contengan pueda ser automatizado de alguna manera, ya que el archivo contiene la estructura de los datos que contiene. El hecho de incluir la estructura permitirá que un programa pueda interpretar cada uno de los datos de un archivo de marcas para representarlo o tratarlo convenientemente, ya que muestran la estructura de los datos que contienen. Posteriormente, un programa podrá interpretar gracias a las marcas qué es lo que significa cada uno de los datos del documento. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 26/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Características de los lenguajes de marcas Facilidad de creación y representación de datos diversos A pesar de que fueron pensados para contener datos de texto, los lenguajes de marcas han demostrado ser capaces de contener datos de muchos tipos diferentes. Actualmente se están utilizando archivos de marcas para representar imágenes vectoriales, fórmulas matemáticas, crear páginas web, ejecutar funciones remotas por medio de servicios web, representar música o sonidos, etc. Y sin importar qué tipo de datos se representen siempre habrá la posibilidad de crear estos archivos desde un editor de texto básico. 1.3. Archivos de marcas: Clasificación de los lenguajes de marcas Es complicado hacer una clasificación de los lenguajes de marcas que existen pero generalmente se acepta que tenemos dos grandes grupos basándonos en cuál es el objetivo básico del lenguaje de marcas: o Lenguajes procedimentales y de presentación, orientados a especificar cómo debe representarse la información. o Lenguajes descriptivos o semánticos: orientados a describir la estructura de los datos que contiene. Esta es la clasificación más aceptada pero, como a menudo ocurre en el ámbito de la Informática, podemos encontrar lenguajes que tengan aspectos de ambos grupos y permitan tanto definir la forma de presentar la información como definir su estructura. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 27/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Clasificación de los lenguajes de marcas Procedimentales y de presentación En estos lenguajes lo que se hace es indicar de qué forma se debe realizar la presentación de los datos. Ya sea por medio de información para el diseño (marcar negritas, títulos, etc.) o de procedimientos que debe realizar el software de representación. El ejemplo más popular de estos lenguajes es el HTML pero hay muchos más: TeX, Wikitext... En estos casos los documentos pueden servirnos para determinar de qué manera se mostrará el documento a quien lo lea. 1.3. Archivos de marcas: Clasificación de los lenguajes de marcas Descriptivos o semánticos En estos lenguajes se describe qué estructura lógica tiene el documento ignorante de qué forma será representada en los programas. Sólo se ponen las marcas con el objetivo de definir las partes que dan estructura al documento. El ejemplo más importante es el XML pero hay otro que está teniendo mucho apoyo, como por ejemplo JSON. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 28/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Clasificación de los lenguajes de marcas Sistema de etiquetado Tanto si el sistema es descriptivo como de presentación, las marcas no han sido colocadas de cualquier manera sino que se ha ido siguiendo un sistema determinado. Á menudo, las marcas rodean el contenido que queremos que tenga un significado o que sea representado de una manera determinada. No se pueden colocar las marcas de cualquier manera, ya que una de las cosas a evitar son posibles malinterpretaciones. Por eso, además de definir las marcas que se pondrán, los lenguajes de marcas definen unas reglas de uso que especifican cómo deben ser las marcas, en qué condiciones se permite utilizarlas ya veces incluso qué significan. 1.3. Archivos de marcas: Historia Se considera que el origen de los lenguajes de marcas está en las modificaciones que los impresores hacían con lápices en manuscritos. Cuando alguien quería imprimir un libro que había escrito, los impresores, con un lápiz generalmente de color azul, escribían en el texto qué características debía tener cada parte del texto, si debía hacerse en negrita, si era el título del libro, etc. Se cree que éstos son los antecedentes de las marcas. SGML A principios de los años ochenta en IBM necesitaban alguna forma de almacenar y compartir una gran cantidad de información entre diferentes plataformas y que permitiera integrar los datos en sistemas de datos, editores, etc., y desarrollaron GML, que posteriormente terminó con el nombre SGML en el momento en que fue estandarizado en 1986 por la organización de estándares internacional ISO (International Organization for Standardisation). La especificación se encuentra bajo el nombre 150-8879, https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 29/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia Aunque no se considera el primer lenguaje de marcas, fue el primer lenguaje reconocido como estándar ISO. SGML (standard generalized markup language) es un lenguaje basado en los datos de texto que se puede utilizar para poner metadatos a los datos. Es un sistema para organizar y etiquetar elementos de un documento poniendo énfasis en los aspectos de la estructura de un documento y dejando que sea el intérprete el que se encarga de realizar la representación visual de estos datos. Lo hace definiendo unas reglas estrictas que especifican cómo se pueden hacer las etiquetas. SGML se diseñó para ser una forma estándar de etiquetar datos genéricos de modo que no importara si los datos para etiquetar provenían del mundo de las matemáticas o bien eran los resultados financieros de una empresa. Todos los datos se podían etiquetar con sentido utilizando SGML. 1.3. Archivos de marcas: Historia SGML se utilizaba sobre todo en documentos que debían tener muchos cambios y que posteriormente debían representarse en formatos diferentes. Por tanto, con SGML tenemos las siguientes ventajas: o Tenemos una forma de reutilizar los datos. o Permite un mayor control sobre los datos y garantiza su integridad. o Es portable. o Es flexible. o Nos garantiza la perdurabilidad de la información. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 30/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia Pero no todo son ventajas en el SGML: o La mayoría de los documentos que se creaban sólo estaban destinados a la impresión. o Esterriblemente complejo, por lo que no se utiliza en ordenadores personales. 1.3. Archivos de marcas: Historia HTML En 1989, Tim Berners-Lee y Anders Berglund, dos investigadores del CERN (acrónimo de Conseil Européen pour la Recherche Nucléaire, Organización Europea para la Investigación Nuclear), crearon un lenguaje basado en etiquetas basado en SGML destinado a compartir información por Internet : HTML ( hypertext markup language ). HTML se basa en la forma de definir e interpretar etiquetas de SGML pero no es totalmente compatible con SGML (algunas de las reglas que se han definido incumplen las reglas SGML). HTML se concentra en definir un formato para describir la visualización de la información en una página web y es muy sencillo. Su sencillez ha sido uno de los factores que ha llevado a la rápida popularidad del World Wide Web y al mismo tiempo de Internet. Es uno de los motivos por los que cada día se generan millones de nuevas páginas web. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 31/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia El gran éxito de las tecnologías basadas en HTML ha hecho que no paren de evolucionar y, por tanto, que HTML tuviera que evolucionar muy rápidamente para adaptarse cada vez a más cambios ya las nuevas necesidades de los usuarios. Esto, sumado al propósito de no incrementar la dificultad del lenguaje, ha provocado que no siempre se hayan hecho las cosas de la misma forma y que, por tanto, la creación de intérpretes de HTML (en especial los navegadores) cada vez sea más compleja. Atodo esto hay que sumar que, a pesar de no estar pensado para representar la información, HTML no define muy estrictamente algunas de las reglas de cómo se debe visualizar la información, y por tanto a menudo los navegadores deben hacer interpretaciones que no siempre coinciden con las que realizan los demás navegadores. Es conocido por todos los diseñadores de páginas web que las páginas no siempre se ven igual en todos los navegadores. 1.3. Archivos de marcas: Historia Por otra parte, HTML funciona bien a la hora de presentar información a los humanos pero tiene algunos problemas que lo hacen poco eficiente para las nuevas aplicaciones actuales: es muy difícil reutilizar la información que contiene para generar resultados en formatos distintos a los que ha definido al diseñador y es muy complejo para los programas automáticos interpretar de qué tipo son los datos contenidos en un documento HTML. Por tanto, era necesario alguna manera de poder realizar búsquedas inteligentes en los documentos HTML y seleccionar sus resultados según criterios personalizables. Y por ese motivo apareció el XML. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 32/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia XML El consorcio W3C desarrolló una alternativa al HTML que pudiera satisfacer las necesidades futuras de la web. En 1996, el consorcio W3C se propuso introducir el poder y la flexibilidad del SGML en la web. SGML ofrecía tres ventajas que el HTML no tenía: o Extensibilidad o Estructura o Validación 1.3. Archivos de marcas: Historia En febrero de 1998 se lanza la especificación 1.0 de XML ( www.w3.org/TR/2004/REC-xml-20040204 ) y posteriormente en 2004 salió la versión 1.1 ( www.w3. org/TR/xml11 ). Estas especificaciones se han revisado periódicamente. XML es un lenguaje simple de descripción de información: o Esun estándar que permite diseñar y desarrollar lenguajes de marca. o Es un formato de texto estandarizado que sirve para representar y transportar información estructurada. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 33/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia Al HTML le ha ido bien con un número finito de etiquetas y, por tanto, a la hora de diseñar el XML se hicieron varios intentos de crear un número finito de etiquetas. Pero todos los intentos de crear un finito conjunto de etiquetas fallaron porque restringir las etiquetas restaba flexibilidad al lenguaje. Se vio que cada conjunto de usuarios necesita un subconjunto de etiquetas diferente y que a menudo eran divergentes (los matemáticos utilizaban uno, los químicos necesitaban otro, etc.), o sea, que la solución final adoptada fue la más lógica: si restringir las etiquetas resta flexibilidad lo fácil es no restringirlas, XML define un número infinito de etiquetas. Por tanto, el XML permitirá que cada persona pueda definir las etiquetas que le hagan falta para poder representar los datos más adecuadamente. 1.3. Archivos de marcas: Historia Otra idea que se tuvo en cuenta a la hora de desarrollar el XML era que los datos que contuviera se pudieran reutilizar para generar otros resultados y, por tanto, era necesario que pudiera ser interpretado fácilmente por medio de programas de ordenador. Por tanto, los datos contenidos en documentos debían tener una estructura. Por tanto, el XML se diseñó con la idea de dar estructura a los datos y no preocuparse de cómo se presentarán los datos a los usuarios. Para ello ya se desarrollarían otras alternativas: CSS , XML-FO, etc. Una de las ideas más importantes de XML es separar los datos de la presentación. Esto hace que a la hora de crear un documento XML debe pensarse cómo se deben estructurar los datos y nunca especificar nada de cómo se tendrán que representar. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 34/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia El hecho de que el XML se concentre en la estructura de los datos y que, por tanto, sea relativamente fácil determinar qué datos contiene, lo hace un sistema ideal para el transporte de datos entre diferentes plataformas. Por tanto, si tenemos un documento XML como este: Podemos ver que observando este documento es relativamente sencillo responder a las preguntas: Manuel Garcia o ¿Qué información contiene el archivo? o ¿Cuál es la estructura de la información? Pedro o o González o ¿Qué etiquetas se han creado para describir su información? 1.3. Archivos de marcas: Historia Es evidente que la libertad que da tener un número infinito de etiquetas no es necesaria en la mayoría de los ámbitos de actuación. Por este motivo, normalmente cuando alguien desee almacenar información definirá un número finito de etiquetas y en qué orden deben aparecer. Para poder solucionar estos problemas en XML se pueden definir archivos que definan cuál será la estructura del documento, y que, por tanto, se pueda comprobar si el documento sigue la estructura correcta o no. Esto a la vez permite que si definimos el vocabulario de forma pública cualquiera nos pueda enviar documentos y detectar si están bien formados o no. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 35/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia De hecho, ya hay toda una serie de documentos basados en XML que se han convertido en estándares públicos en diferentes ámbitos, algunos de los cuales se pueden ver: 1. SVG: Pensado para gráficos vectoriales en 2D con o sin animaciones. 2. MathML: Lenguaje para representar fórmulas matemáticas 3. CML: Lenguaje para el intercambio de información química 4. SMIL: Tratamiento de información multimedia 5. SSML: Síntesis de voz 6. ChessGML: Para representar partidas de ajedrez 7. XFRML: Para realizar informes financieros 1.3. Archivos de marcas: Historia Pero no termina aquí, ya que la lista es inmensa: SML, SMBXML, CIML, NAML, TML, SCORM, LMML, OpenMath, PetroXML, ProductionML, GeophysicsML, X3D, MML, SMDL, BGML, etc. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 36/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia Otra de las ventajas de XML es que es fácilmente extensible y adaptable a las necesidades que tengamos. XML permite que se mezclen diferentes vocabularios en el mismo documento. Esto hace que podamos definir un documento XML con un vocabulario creado por nosotros que defina una lista de alumnos y que a la vez podamos añadir una imagen con el logotipo de la escuela en formato SVG (un estándar XML de gráficos vectoriales) y al mismo tiempo definir la presentación en XHTML, Por tanto, tenemos suficiente flexibilidad para representar los datos que necesitemos en cada momento. 1.3. Archivos de marcas: Historia Actualmente los usos de XML son muy diversos: o Mostrar el contenido de páginas web. Uno de los lenguajes XML es XHTML, que intenta modificar el HTML para hacerlo más sencillo de interpretar. o Comunicar sistemas distribuidos que incluso ejecuten sistemas operativos distintos o estén en plataformas totalmente diferentes. o En comercio electrónico, en un sistema conocido como Bussines2Bussines que permite a las empresas compartir datos de forma automática. o Reducir la carga de servidores distribuyéndola entre servidores. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 37/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia Muchos programas que utilizaban formatos binarios para almacenar sus datos han pasado a algún tipo de XML: o Microsoft Office: pasó de guardar los documentos en binario.DOC a XML.DOCX (OOXML) al estandarizarlo. o OpenOffice.org: guarda sus documentos en un formato XML. 1.3. Archivos de marcas: Historia A pesar de las múltiples ventajas que ofrece XML, también se le han hecho críticas, como el hecho de que los archivos XML tienen la tendencia a ser muy grandes. Casi siempre ocupan una cantidad mucho mayor de espacio en disco que sus equivalentes en formato binario. El hecho de utilizar archivos muy grandes puede tener un impacto importante en el rendimiento de los programas, ya que antes de poder trabajar deben cargar el archivo o descargarlo de la red. Hay gente que considera que el problema del tamaño de los archivos a veces es compensado por: o La facilidad de interoperatividad entre programas. o El precio del almacenamiento es cada vez más bajo y por ahora parece que la tendencia es que todavía baje más. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 38/39 21/11/24, 17:47 Teoría TEMA 1 1.3. Archivos de marcas: Historia Pero no todo el mundo está de acuerdo, y por este motivo han aparecido toda una serie de alternativas al XML que se conocen como lenguajes de marcas ligeros, que normalmente tienen como objetivo conseguir que los archivos de marcas ocupen mucho menos espacio: o Al ocupar menos espacio ahorran ancho de banda y espacio en disco. o Normalmente se pueden convertir a XML sin problemas. o Ocupan menos memoria RAM cuando son procesados. Los lenguajes de marcas ligeros más usados actualmente son JSON ( JavaScript object notation) y los lenguajes de marcas de los wikis. https:/Awww.ciclosonline.fpaspasia.com/mod/hvp/view.php?id=22718 39/39