Full Transcript

Gestión de los datos corporativos TEMARIO OPOSICIONES COIICV | TEMA 36 49 (8) Clark, P., Boswell, R. (2000). Data mining. Pra ctical machine learning tools and techniques with java implementations. Morgan Kaufmann Publishers. (9) Dixon, J. (2015). Pentaho, hadoop and data lake s. James Dixon’s Blog....

Gestión de los datos corporativos TEMARIO OPOSICIONES COIICV | TEMA 36 49 (8) Clark, P., Boswell, R. (2000). Data mining. Pra ctical machine learning tools and techniques with java implementations. Morgan Kaufmann Publishers. (9) Dixon, J. (2015). Pentaho, hadoop and data lake s. James Dixon’s Blog. (10) Harrington, P. (2012). Machine learning in act ion. Manning Publications. (11) Hashem, I. A. T., Yaqoob, I., Anuar, N. B., Mo khtar, S., Gani, A., & Khan, S. U. (2015). The rise of “big data” on cloud computing: Review and o pen research issues. Information Systems. (12) Hayes, R., Wheelright, S. (1985). Restoring ou r competitive edge: competing through manufacturing. John Whiley & Sons. (13) Hernández-Orallo, J., Ramírez-Quintana, M. J., Ferri-Ramírez, C. (2004). Introducción a la minería de datos. Pearson Educación. Prentice Hall. (14) Hewitt, E. (2011). Cassandra: the definitive g uide. O’Reilly. (15) Inose, H, Pierce, J.H. (1984). Information tec hnology and civilization. W.H. Freeman and Company. (16) Jones, O. M., Robinson, A. (2009). Scientific programming and simulation using r. Taylor & Francis Group. (17) Koller, T. (1994). What is value-based managem ent? The McKinsey Quarterly. (18) Lam, C. (2011). Hadoop in action. Manning Publ ications. (19) Leskovec, J., Rajaraman, A., Ullman, J. D. (20 14). Mining of massive datasets. Stanford University Press. (20) Marmanis, H., Babenko, D. (2009). Algorithms o f the intelligent web. Manning Publications. (21) Mateos, P. (2005) Dirección y objetivos de la empresa actual. Editorial Centro de Estudios Ramón Areces. (22) Mitchel, T. M. (1986). Machine learning. Sprin ger. (23) Moore, G. E. (1965). Cramming more components onto integrated circuits. Electronics Magazine. Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Francisco Manuel Rangel Pardo 50 TEMARIO OPOSICIONES COIICV | TEMA 36 (24) Owen, S., Anil, R., Dunning, T., Friedman, E. (2013). Mahout in action. Manning Publications Co.  (25) Porter, M.E. (1979). How competitive forces sh ape strategy. Harvard Business Review Boston. (26) Robinson, I., Webber, J., Eifrem, E. (2013). G raph databases. O’Reilly. (27) Snijders, C.; Matzat, U.; Reips, U.D. (2012). Big data: big gaps of knowledge in the field of interent. International Journal of Internet Science . (28) Stanton, J. (2012). An introduction to data sc ience. Syracuse University. (29) Witten, I. H., Frank, E., Hall, M. A. (2011). Data mining. Practical machine learning tools and techniques. Morgan Kaufmann Publishers. Enlaces web: Big Data y Social Media en retrospectiva. Blog Fran cisco Rangel (2015): http://www.kicorangel.com/big-data-y-social-media-e n-retrospectiva/ Cosmos Intelligence: http://www.autoritas.net/#section-herramienta El análisis masivo de datos está transformando a la empresa. John Veihmeyer (2015): http://economia.elpais.com/economia/2015/01/22/actu alidad/1421926110_795741.html Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019TEMARIO OPOSICIONES COIICV | TEMA 37 1 Tema 37. Diseño y desarrollo de portales web. Lenguajes y herramientas para la utilización de redes globales. HTML y XML Pedro Garrido Águila Colegiado 0879 Hoy en día, los documentos HTML son los más abundan tes del mundo digital. Se desarrollan todo tipo de aplicaciones web, estática s aunque casi en su totalidad dinámicas; y con indefinidas funcionalidades: blog, comercio electrónico, de descargas, de desarrollo, institucionales, comunida des virtuales, directorios, informativas, redes sociales, personales, wikis, ed ucativas, juegos, etc. Los documentos HTML, cuyos orígenes se remontan a p rincipio de los noventa, y que actualmente se encuentra en su versión HTML5, permi ten incorporar contenido similar a los procesadores de texto actuales, aunque sobre todo, permiten la interactuación por parte del usuario, mediante enlaces, pudiendo a cceder entre documentos, gracias al hipertexto. El lenguaje HTML es sin duda el más empleado para i mplementar aplicaciones web, pero trabaja de la mano de CSS y JavaScript para ex plotar al máximo sus posibilidades. HTML por sí sólo es capaz de organiz ar la información, mientras las hojas de estilos CSS aportan el diseño para hacer q ue los documentos sean mucho más atractivos. Paralelamente, JavaScript dota a HT ML de una serie de funcionalidades extra para permitir programaciones en el lado del cliente. Y para que el diseño no llegue a dificultar el acceso a la doc umento, se han desarrollado estándares de accesibilidad, que aseguran sobre tod o el acceso a la información a personas con discapacidades de cualquier índole. Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Pedro Garrido Águila 2 TEMARIO OPOSICIONES COIICV | TEMA 37 1. Lenguajes de marcas 1.1. Principios Los lenguajes de marcas o de marcado definen la est ructura, la semántica y controlan el procesamiento de un documento digital. Los lenguaje s de descripción de páginas (archivos PostScript, PDF, etc.) y los lenguajes de programac ión (Java, Basic, Perl, C++, ect.) no son lenguajes de marcas. En un documento existen distintos niveles de inform ación, por un lado la información del contenido del documento y por otro la información del etiquet ado, marcado o markup . Los lenguajes de marcas aparecieron ante la problem ática de intercambio de información con pérdidas de formato y otras características. Para r esolver el problema, se acordó que las marcas deberían constar de caracteres ASCII reservados y s e deberían cumplir una serie de reglas sintácticas especiales. Ello provocó el nacimiento de un lenguaje especial normalizado internacional para la formulación de este tipo de r eglas denominado Standard GeneralizedMarkupLanguage o SGML. La aceptación de SGML fue muy grande y es empleado en una gran cantidad de campos en los que se requiere documentación a gran escala. Y ello a pesar de que inicialmente los procesadores de textos, decidieron optar por editores WYSIWYG en lugar de emplear lenguajes de marcado. Otro de los puntos clave para que tenga la relevanc ia actual, fue la aparición del HTML utilizando la sintaxis SGML. La sencillez del lenguaje fue uno de los principales factores junto a las ventajas que el propio lenguaje ofrece. También existía el p roblema de la mala estructuración de la información y la falta de respeto por los estándare s por diseñadores y fabricantes de software. La respuesta a los problemas del HTML vino de la ma no del XML (e Xtensible Markup Language), desarrollado por el World Wide Web Consortium (W3C) , meta-lenguaje que permite crear etiquetas adaptadas a las necesidades, pero el uso de mismo e xige cumplir dos condiciones: ser válido y estar bien formado. XML no es sólo la base de HTML, sino que además tie ne infinitas aplicaciones, algunas de ellas estandarizadas y otras definidas por cualquier usua rio. Para además asegurar la válidez de los documentos, pueden definirse DTDs (documenttypedefi nition), el cual permite definir la estructura y sintaxis. Por ejemplo, para comprobar la validez de los documentos HTML, existe un validador online de la W3C: https://validator.w3.org/ Existen 3 utilizaciones básicas para los lenguajes de marcas: Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Diseño y desarrollo de portales web TEMARIO OPOSICIONES COIICV | TEMA 37 3 • Para describir contenido, por ejemplo bases de dato s. • Para definir formato, por ejemplo procesadores de t extos. • Para describir contenido y además dar formato, por ejemplo el lenguaje HTML. 1.2. Historia del HTML En 1880, Tim Berners-Lee, trabajador de Centro Euro peo de Investigaciones Nucleares (CERN), publica que estaba trabajando en un sistema de hipe rtexto para compartir archivos a través de redes TCP-IP, en concreto para lo que hoy se conoce como Internet. Finalmente, en 1990, junto a Robert Cailliau, presentaron la propuesta ganadora llamada WorldWideWeb (W3). Durante 1990 se desarrolló el primer sistema que fa cilitaba la lectura de información, mediante un navegador web. Inicialmente fue llamado WorldWideWe b, aunque fue posteriormente rebautizado como Nexus, para evitar confusiones al compartir no mbre con la tipología. La primera propuesta oficial para convertir HTML en un estándar se realizó en 1993 por parte del organismo IETF (Internet EngineeringTaskForce).El p ropio lenguaje HTML seguía desarrollándose y ese mismo año, se creó HTML+, que al igual que su predecesor, nunca se llegó a estandarizar. En 1995 la IETF creó grupos de trabajo de HTML, con siguiendo ser publicado HTML 3.0 y convirtiéndose a su vez en el primer estándar ofici al de HTML. Entre las grandes mejoras se encontraban la posibilidad de incorporar applets de java y textos alrededor de imágenes. En 1998 se publicó HTML 4.0, suponiendo un gran sal to con respecto a sus predecesores, al incluir una gran cantidad de mejoras como la inclus ión de hojas de estilo CSS, scripts, mejoras de accesibilidad, tablas complejas y mejoras en los fo rmularios. En el año 2000, de forma paralela, fue reescrito HT ML 4.0 para cumplir estrictamente los estándares de XML, creándose XHTML. Las diferencias son pocas, como por ejemplo la obligatoriedad de escribir las etiquetas en minúscu las o los elementos de etiqueta única precisan cierre. Desde la publicación del HTML 4.01, la actividad de estandarización se detuvo por la W3C al dar mayor relevancia al desarrollo de XML. Ello provocó que en 2004, las grandes organizaciones Apple, Mozilla y Opera se asociaran en WHATWG (Web HypertextApplicationTechnologyWorkingGroup), con el objetivo de desarrollar HTML5. En 2006, el W3C se interesó en el desarrollo de HTM L5, para en 2007 unirse al grupo de trabajo de WHATWG para unificar el proyecto. Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Pedro Garrido Águila 4 TEMARIO OPOSICIONES COIICV | TEMA 37 La versión definitiva de HTML5, publicó su estándar en 2014 y es la primera vez en la que se ha desarrollado en paralelo HTML y la variante XHTML. La cantidad de mejoras introducidas son muchas, pero a groso modo se podría decir que inten ta resolver por sí mismo las necesidades de audio, vídeo, eventos, etc., sin la necesidades de applets externos, además de numerosas etiquetas para ayudar a la Web Semántica o Web 3.0 y en consecuencia a los buscadores. 2. HTML5 El Lenguaje HTML5, no es complejo en sí, pero como como cualquier otro lenguaje hay que conocer su propia sintaxis. A lo largo del capítulo se va a realizar una introducción a la última versión de HTML, aunque siempre hay que tener en cu enta la íntima relación que tiene junto a CSS y Javascript para dotarlo por un lado de estruc tura y contenido en la pantalla y por otro de funcionalidades añadidas. Por otro lado, los documentos HTML, que por cierto son los más abundantes de entre todos los formatos digitales, están escritos sobre un fichero de texto plano y pueden ejecutarse en cualquier navegador con tan sólo guardarlo con la extensión . html. 2.1. Estructura global Los documentos se encuentran estrictamente organiza dos. La primera línea deberá ser siempre: Figura 1: Elemento Seguidamente se debe comenzar a construir la estruc tura HTML, siempre en estructura de tipo árbol empleando el elemento raíz . Además se especifica el atributo lang para identificar idioma. Figura 2: Elemento Las dos siguientes secciones son el y el . El elemento se emplea para definir título, descripción, hojas de estilos o fic heros javascript externos, etc. En segundo lugar aparecerá el , donde se incluirá toda la part e visible de la web. <!DOCTYPEhtml> <!DOCTYPEhtml> <htmllang=”es”> Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Diseño y desarrollo de portales web TEMARIO OPOSICIONES COIICV | TEMA 37 5 Figura 3: Elementos y Dentro de la cabecera se incorporan distintas etiqu etas para añadir metadatos, como por ejemplo la codificación, la descripción, las palabr as clave, etc. Estas etiquetas, al ser únicas, pueden emplear o no emplear la barra de cierre. Figura 4: Elementos La etiqueta especifica el título al documen to, visualizándose habitualmente en la cabecera del navegador empleado. La inmensa mayoría de documentos HTML emplean la et iqueta , la cual permite añadir un enlace a un fichero externo, pudiéndose ser hojas d e estilos, código Javascript o iconos. Figura 5: Elementos y 2.2. Estructura del cuerpo La estructura del cuerpo es la definida dentro de l a etiqueta . Para ayudar a estructurar el contenido, inicialmente se hacía uso del elemento < table>, a pesar de que las tablas no tienen esta finalidad. Hasta que empezó a utilizarse elemento < div>, sobre todo tras una mayor integración del HTML con CSS y Javascript. Esta etiqueta es mucho m ás genérica, y aunque no ofrece información directamente sobre de qué clase de divi sión se trata, esta sigue siendo empleada junto a otras más específicas aparecidas en esta última v ersión de HTML. <!DOCTYPEhtml> <htmllang=“es”> … <metaname=”description” content=”Ejemplo de HTML5”> <metaname=”keywords” content=”HTML5, CSS3, Javascri pt”> … … Este texto es el título del documento <linkrel=”stylesheet” href=”misestilos.css”> … Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Pedro Garrido Águila 6 TEMARIO OPOSICIONES COIICV | TEMA 37 Actualmente, la mayoría de webs emplean un diseño b ase similar al que aparece a continuación, aunque como siempre, pueden optar por otras alterna tivas. Figura 6: Ejemplo de estructura dentro del La etiqueta se emplea para en su interior colocar la cabecera visible de la web, con elementos como el logo, contacto, etc. El es la barra de navegación o menú, aunque h aber uno o varios dentro de una misma página. Para identificar cada una de las secciones del menú, suele emplearse una lista de opciones, bajo las etiquetas de para identific ar la lista y para los elementos. Figura 7: Uso del elemento La información más relevante de la página suele enc ontrarse dentro de la etiqueta . A su vez dentro de dicha etiqueta, podemos definir la et iqueta , que sería contenido independiente al resto de la página. En ese podemos incluir por ejemplo noticias, comentarios, etc. … inicio productos contacto … Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Diseño y desarrollo de portales web TEMARIO OPOSICIONES COIICV | TEMA 37 7 Lateralmente a este bloque, suele encontrarse el o barra lateral, para incorporar datos relacionados con la información principal, o destac ar otros contenidos de importancia. Por último, en la parte inferior, suele ubicarse el o pie de página, el cual se emplea para incorporar información de la web como por ejemplo d e contacto o por ejemplo también incorporar un menú secundario de baja relevancia. 2.3. Texto Antes de incluir el texto, es necesario identificar las secciones, para determinar la organización de la información. Para ello se emplean los títulos de sección que son las etiquetas , , , , y , siendo la primera de ellas la má s relevante y la última la menos y pudiendo usarse cada una de ellas en varias ocasiones. Entre las distintas secciones, puede incluirse text o dentro de las etiquetas , identificando cada una de ellas a un párrafo. Figura 8: Ejemplo de uso de las etiquetas , y , justo a su código. En ocasiones, determinadas palabras o frases han de destacarse y para ello se disponen de diversas etiquetas que lo permiten. A continuación se muestra una tabla con las más habituales: Titular de la página Párrafo de introducción… La primera sub-sección Párrafo de contenido… Otra subsección Más párrafos de contenido… Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019Pedro Garrido Águila 8 TEMARIO OPOSICIONES COIICV | TEMA 37 Tabla I: Etiquetas para destacar texto Etiqueta Función Atributos Destaca con cursiva - Destaca con negrita - Indica que es una cita textual cite=”u rl”: indica la url origen Indica que es una abreviatura title = “texto” - Indica el significado Indica que es un acrónimo title = “texto” - Indica el significado Fuerza un salto de línea - Muestra texto respetando espacios - Muestra texto en formato código fuente - 2.4. Enlaces El lenguaje HTML se definió en su día para permitir los vínculos entre documentos, de hecho las letras “HT” de sus siglas vienen de hipertexto . El elemento en cuestión se denomina anchor en inglés y enlace web o enlace en castellano. Los enlaces a páginas dentro de la misma web, puede n ser relativos o absolutos, según pueda interesar por la estructura del portal web o la pro gramación de la misma. En el caso de emplear las URLs relativas, es el propio navegador el encargado de hacer la conversión a URL absoluta. La diferencia entre ambas es la siguiente: Las URLs absolutas incluyen todas las partes de la ruta: protocolo, servidor y ruta completa. Las URLs relativas prescinden de parte de la URL pa ra hacerla más breve y parte desde el directorio actual. Figura 9: Ejemplos de URL abosluta y relativa Detalles problemáticos a tener en cuenta en las URL s, es la inclusión en las mismas de espacios o caracteres especiales como acentos o la letra ñ, si endo más sencillo evitar los nombres de archivos con estos caracteres o en su defecto es ne cesario emplear codificaciones alternativas de esos caracteres, teniendo también en cuenta la codi ficación del documento HTML. URL absoluta: http://www.ejemplo.com/ruta1/ruta2/pa gina2.html URL relativa: /ruta1/ruta2/pagina2.html Se autoriza el uso exclusivo de este documento a María Amparo Pavía García, DNI 20013968N, a 26 de julio de 2019