UD 4: Introducción a los Lenguajes de Marcas (SMR) - IES Oretania
Document Details
Uploaded by Deleted User
I.E.S. Oretania
Tags
Summary
Esta presentación de la asignatura Sistemas Microinformáticos y Redes (SMR) describe los lenguajes de marcas, incluyendo sus orígenes, clasificación, características, y ámbitos de aplicación. Se centra en temas como documentos GML, SGML, y HTML, enfocándose en la evolución histórica de estos lenguajes y su importancia en la actualidad.
Full Transcript
Departamento de Informática y Comunicaciones – I.E.S. Oretania UD 4: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS 2º SISTEMAS MICROINFORMÁTICOS Y REDES (SMR) Departamento de Informática y Comunicaciones – I.E.S. Oretania Ín...
Departamento de Informática y Comunicaciones – I.E.S. Oretania UD 4: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS 2º SISTEMAS MICROINFORMÁTICOS Y REDES (SMR) Departamento de Informática y Comunicaciones – I.E.S. Oretania Índice 1. Definición 2. Historia de los lenguajes de marcas 2.1. Orígenes 2.2. GML o el origen de los lenguajes de marcas 2.3. SGML, el padre de XML 2.4. HTML y la popularización de la web 2.5. XML (Extended Markup Language) 3. Clasificación 4. Características 5. Ámbitos de aplicación Departamento de Informática y Comunicaciones – I.E.S. Oretania 1. Definición Un lenguaje de marcas o lenguaje de marcado es aquel que permite representar información, así como su estructura y su formato. Figura 1: Fragmento de un documento XML Los lenguajes de marcas no son lenguajes de programación. No contienen instrucciones ni aplican acciones directas. Son reglas que organizan la información con el objetivo de darle una estructura uniforme y facilitar su procesamiento automático Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas Dibujo 1. Evolución de los lenguajes de marcas. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.1 Orígenes. Los lenguajes de marcas comenzaron a usarse a finales de la década de los 60 para poder introducir anotaciones dentro de documentos electrónicos, de la misma forma que se hacía cuando la documentación estaba en papel. Figura 2. Imagen de marcas de imprenta Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.1 Orígenes. Ejemplo de documento GML Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.1 Orígenes. Los lenguajes de marcas nacieron de la necesidad de almacenar, procesar e intercambiar información de distinta naturaleza entre distintos tipos de software y que todos ellos entendieran esta información sin ningún problema. En 1969 Charles F. Goldfarb inició un proyecto de investigación en IBM, desarrollando el lenguaje GML (Generalized Markup Language), el cual propone establecer un formato estándar para todos los documentos que se manejaban dentro de la empresa. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.2. GML o el origen de los lenguajes de marcas GML fue creado bajo dos premisas fundamentales que establecieron sus bases: El marcado no debe reflejar las características físicas de un documento sino su estructura. El marcado no puede ser ambiguo, debe ser comprendido por una persona o una computadora sin dar cabida a equivocaciones. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.2. GML o el origen de los lenguajes de marcas GML era un lenguaje enormemente complejo y por tanto, requería de herramientas software muy costosas. El Doctor Goldfarb utilizó los principios en los que se fundamentó el proyecto GML para realizar para la ANSI (American National Standards Institute) el desarrollo de un nuevo esquema de marcado generalizado. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.3. SGML, el padre de XML A finales de los años 70, el ANSI (Instituto Nacional Americano de Normalización) empezó a desarrollar las especificaciones del metalenguaje SGML (Standard Generalized Markup Language) puede ser considerado uno de los estándares más importantes dentro del campo de la estructuración de documentos de gran tamaño. Su principal función es la de definir lenguajes para realizar el formato de documentos. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.3. SGML, el padre de XML SGML es un lenguaje basado en los datos de texto que se puede usar para poner metadatos a los datos. Es un sistema para organizar y etiquetar elementos de un documento poniendo énfasis en los aspectos de la estructura de un documento y dejando que sea el intérprete el que se encarga de hacer la representación visual de estos datos. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.3. SGML, el padre de XML Se denomina aplicación SGML a cada uno de los lenguajes de formato de documentos que han sido definidos usando SGML y está compuesta de: La declaración SGML. Es el encargado de indicar al sistema receptor los caracteres y delimitadores que pueden aparecer en la aplicación. La definición de tipo de documento (DTD). El DTD describe la sintaxis y la estructura del documento. La especificación. Describe la semántica que debe ser conferida al código de formato. También incluye restricciones de sintaxis que no pueden incluirse dentro del DTD. Una instancia del documento. Contiene los datos (contenido) y el marcado. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.3. SGML, el padre de XML SGML ofrecía las siguientes ventajas: Tenemos una manera de reutilizar los datos. Permite un mayor control sobre los datos y garantiza la integridad. Es portable. Es flexible. Nos garantiza la perdurabilidad de la información. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.3. SGML, el padre de XML Sin embargo, no todo eran ventajas en SGML: La mayoría de los documentos que se creaban sólo estaban destinados a la impresión. Es terriblemente complejo, por lo que no se utiliza en ordenadores personales. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.4. HTML y la popularización de la web En 1990 Tim-Berners-Lee creó la World Wide Web (WWW) y para ella creó un lenguaje de descripción de documentos llamado HTML, utilizado para la publicación de hipertexto en la Web. HTML es una aplicación SGML pensada para compartir información usando las redes de ordenadores y, de forma más general, a través de Internet. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.4. HTML y la popularización de la web A pesar de todas estas ventajas, HTML no es un lenguaje perfecto, sus principales desventajas son: El lenguaje no es flexible, ya que las etiquetas son limitadas. No permite mostrar contenido dinámico La estructura y el diseño están mezclados en el documento. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.4. HTML y la popularización de la web Figura 3: Ejemplo de documento HTML Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.4. HTML y la popularización de la web Al ejecutarlo en un navegador como, por ejemplo, Mozilla Firefox obtendremos lo siguiente: Figura 4: Código HTML visualizado en Mozilla Firefox Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.5. XML (Extended Markup Language) En 1998, la W3C hizo público un nuevo metalenguaje estandarizado al que llamaron XML (eXtended Markup Language), este metalenguaje era mucho más sencillo que SGML y a la vez tenía más potencia que HTML. XML se puede describir como una simplificación de SGML. El principal objetivo que se persigue con XML es diferenciar el contenido y estructura de un documento de su presentación tanto en pantalla como en papel para que estos documentos puedan intercambiarse y procesarse fácilmente por distintos sistemas informáticos. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.5. XML (Extended Markup Language) Figura 6: Comparación de SGML con XML Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.5. XML (Extended Markup Language) Las principales metas que se establecieron con el diseño de XML fueron: XML debía de ser directamente utilizable a través de Internet. XML soportaría una grande y variada cantidad de aplicaciones. XML tendría que ser compatible con SGML. Los programas que fuesen a procesar los documentos XML serían fáciles de escribir. Las características opcionales en XML deberían intentar reducirse a cero. Los documentos XML deberían ser claros y legibles por el ser humano. El diseño XML debía de prepararse rápidamente y debía ser formal y conciso. Los documentos XML serían fáciles de crear. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.5. XML (Extended Markup Language) El principal objetivo que se persigue con XML es diferenciar el contenido y estructura de un documento de su presentación tanto en pantalla como en papel para que estos documentos puedan intercambiarse y procesarse fácilmente por distintos sistemas informáticos. XML se utiliza para crear lenguajes de marcas (es un metalenguaje). El marcado codifica una descripción de la disposición de almacenamiento del documento y de la estructura lógica. XML proporciona un mecanismo para imponer restricciones en el diseño de almacenamiento y la estructura lógica. Departamento de Informática y Comunicaciones – I.E.S. Oretania 2. Historia de los lenguajes de marcas 2.5. XML (Extended Markup Language) Algunos de los lenguajes de marcas o aplicaciones XML creados usando el metalenguaje XML son: Para la consulta de datos: XQuery y Xpath Para la codificación de imágenes: SVG (Gráficos vectoriales escalables) y VML Para la presentación de información: XSL, XLink, CSS, etc. Para voz: VoiceXML, SRGS (Reconocimiento del habla) Para matemáticas: MathML Para programación: JDOM, SAX. Departamento de Informática y Comunicaciones – I.E.S. Oretania 3. Clasificación Departamento de Informática y Comunicaciones – I.E.S. Oretania 3. Clasificación Los lenguajes de marcas pueden clasificarse en: Lenguajes de Presentación. Indican el formato del texto, es decir, cómo ha de presentarse el documento. Las etiquetas de marcado aparecen ocultas al usuario final. Ejemplo: Procesadores de textos, RTF,... Lenguajes de Procedurales. Las etiquetas están orientadas a la presentación pero se integran dentro de un marco procedural que permite definir macros (secuencia de acciones) y subrutinas. Ejemplo: TeX, Postcript. Lenguajes Descriptivos o Semánticos. Indican las partes en las que se estructura un documento, pero sin especificar cómo deben representarse ni en qué orden. Ejemplo: XML y todas las aplicaciones derivadas de éste: YAML, OWL, XSLT, RSS, Lenguajes Híbridos. Son lenguajes que contienen marcas de los dos tipos indistintamente. Ejemplo: HTML, XHTML, LaTeX, … Departamento de Informática y Comunicaciones – I.E.S. Oretania 4. Características Las características fundamentales de los lenguajes de marcas son las siguientes: Independencia. Su uso no debe depender de ninguna plataforma hardware ni sistema software concreto. Almacenados en texto plano. El documento está compuesto únicamente por caracteres de texto. Flexibilidad. Los lenguajes de marcas deben ser lo suficientemente flexibles para poder utilizarse en diferentes contextos. Compacidad. Las marcas y el contenido se encuentran en el mismo documento. Facilidad de procesamiento. El formato debe ser diseñado de tal manera que el procesamiento automático sea más sencillo. Departamento de Informática y Comunicaciones – I.E.S. Oretania 5. Ámbitos de aplicación Actualmente, los lenguajes de marcas más habituales tienen como objetivos principales la representación de información (HTML y XHTML) o el almacenamiento e intercambio de información (XML y sus dialectos, y el formato de intercambio JSON). Departamento de Informática y Comunicaciones – I.E.S. Oretania 5. Ámbitos de aplicación A continuación se van a presentar algunos de los lenguajes de marcas y dialectos de uso más común en la actualidad, pero no son los únicos. En XML, en concreto, existen multitud de dialectos para prácticamente cualquier campo de conocimiento. HTML. Es el lenguaje de marcas más conocido y utilizado y el W3C se encarga de su mantenimiento y estandarización. La primera versión de HTML5 se publicó en octubre de 2014 y supuso un cambio radical y muy exitoso en el lenguaje. Su objetivo principal sigue siendo el concebido por Tim Berners-Lee: proporcionar un mecanismo para diseñar páginas web que van a ser representadas en un navegador, ya sea ejecutado en un ordenador, en una videoconsola o en un dispositivo móvil. Departamento de Informática y Comunicaciones – I.E.S. Oretania 5. Ámbitos de aplicación XML. Lenguaje de intercambio de información entre los sistemas por excelencia. Un documento XML puede servir para almacenar: la configuración de una aplicación, los mejores marcadores de un videojuego, el diseño de una interfaz de usuario o la información de un gráfico vectorial. Departamento de Informática y Comunicaciones – I.E.S. Oretania 5. Ámbitos de aplicación XHTML. Se puede definir de una manera simplificada como la versión en formato XML del lenguaje de marcas HTML. Se presentó en el año 2000 como una recomendación del W3C. XHTML tiene la misma relación con XML que HTML con SGML. Tanto HTML como XHTML surgen a partir de un metalenguaje y ambos son lenguaje de marcado para el desarrollo de páginas web. La diferencia fundamental es que XHTML tiene una sintaxis más estricta y formal que HTML. Departamento de Informática y Comunicaciones – I.E.S. Oretania 5. Ámbitos de aplicación JSON. Es el formato de texto en el que Es el formato de texto en el que JavaScript representa sus objetos, incluidos los arrays. JSON se ha universalizado como alternativa a XML para el almacenamiento e intercambio de datos entre sistemas independientemente de la plataforma y del lenguaje de programación. Departamento de Informática y Comunicaciones – I.E.S. Oretania 5. Ámbitos de aplicación SVG. MathML. NewsML. FXML. XAML. Android. RSS y Atom. XSL.