Apuntes GBD - Gestión de Bases de Datos - Universidad Miguel Hernández de Elche
Document Details
Uploaded by IntelligibleNovaculite4824
Universidad Miguel Hernández de Elche
Tags
Summary
Estos apuntes de Gestión de Bases de Datos para el primer curso de Periodismo en la Universidad Miguel Hernández de Elche, cubren temas sobre bases de datos, tipos de información (estructurada, semi-estructurada y no estructurada), y terminología, incluyendo conceptos fundamentales del almacenamiento de datos.
Full Transcript
APUNTES-GBD-completos.pdf user_2346532 Gestion de Bases de Datos 1º Grado en Periodismo Facultad de Ciencias Sociales y Jurídicas Universidad Miguel Hernández de Elche Reservados todos los derechos. No se permite la expl...
APUNTES-GBD-completos.pdf user_2346532 Gestion de Bases de Datos 1º Grado en Periodismo Facultad de Ciencias Sociales y Jurídicas Universidad Miguel Hernández de Elche Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS PERIODISMO DE BASE DE DATOS, TRATAMIENTO INICIAL Y TIPOLOGÍAS DE INFORMACIÓN El proceso del periodista con la información: Localizar las fuentes de datos Analizar qué hacer con los datos Manipular los datos (en hojas de cálculo) Realizar los primeros cálculos MOSTRAR ALGO Tipología de información: sobre la que se puede trabajar: Base de datos relacional (Access) Estructurada Base de datos documental (Drive) Otras bases de datos Información Semi – estructurada Ficheros XML Base de datos NO-SQL No estructurada Ficheros de texto (Powe Point, Word…) No texto (videos, flash…) PREGUNTA EXAMEN: DIFERENCIA ENTRE ESTRUCTURADA, SEMI – ESTRUCTURADA Y NO ESTRUCTURADA INTRODUCCIÓN A LA ORGANIZACIÓN BÁSICA DE LA INFORMACIÓN Y La estructuradaTERMINOLOGÍA es rígida, tiene unas normas (en el caso de Access: poner claves principales y foráneas) BÁSICA en cambio la no estructurada es mucho más libre (como Word) Información: conjunto de datos significativos y pertinentes que describan sucesos Datos: símbolos que describan condiciones, hechos o situaciones 1 de enero de 2016 1 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS CONCEPTOS FUNDAMENTALES EN EL ALMACENAMIENTO DE DATOS Ficheros: lugar de almacenamiento de datos del mismo tipo que carece de estructura intrínseca Campo: tipo básico de información, un espacio de almacenamiento para un dato en particular Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Registro: está formado por un conjunto de campos que contienen los datos que pertenecen a una instancia o repetición del fichero EL SISTEMA DE BASE DE DATOS ESTRUCTURADOS, VENTAJAS Y CLASIFICACIÓN El concepto de base de datos aparece por primera vez en los 60 como conjunto de Datos Relacionados entre sí. Hoy se habla de: - Sistema Gestor de Base de Dato - Sistema Gestor de Base de Datos Relacional - Sistema Gestor de base de Datos Documental PREGUNTA EXAMEN: DIFERENCIA ENTRE BASE DE DATOS RELACIONAL Y DOCUMENTAL La base de datos relaciona es estructurada y la base de datos documental no INTRODUCCIÓN A LAS BASES DE DATOS DOCUMENTALES Están enfocadas a trabajar con información relativa a documentos, su concepto central es el documento Funciones: encaminadas al tratamiento del texto contenido en los documentos Formatos más usuales: formatos binarios = PDP y DOC El número de campos de cada registro es variable, siempre en función de si conocemos o no su valor. 1 de enero de 2016 2 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS BASE DE DATOS EN INTERNET (BIG DATA) En BIG DATA es el sector de tecnologías de la información y la Comunicación que utiliza herramientas (las cookies por ejemplo) para analizar comportamientos, comparar, recoger información del comportamiento de los usuarios en Internet con finalidades comerciales (para vender productos) y de control (la CÍA controla a la población a través Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. de los datos e información que recibe) Esto conlleva a que el ciudadano hoy en día esté totalmente controlado CONEXIÓN ONLINE La conexión a Internet es la conexión con la que un ordenador o red de ordenadores cuentan para conectarse a Internet, lo que les permite visualizar las páginas Web desde un navegador y acceder a otros servicios que ofrece esta red. INTERNET DE LAS COSAS – IOT Es un concepto que se refiere a la interconexión digital de objetos cotidianos con internet. Nació en el Instituto de Tecnología de Massachusetts (MIT) y se trata una revolución en las relaciones entre los objetos y las personas, incluso entre los objetos directamente, que se conectaran entre ellos y con la Red y ofrecerán datos en tiempo real. Es la digitalización del mundo físico. SMARTCITIES Ciudad inteligente: se refiere a un tipo de desarrollo urbano basado en la sostenibilidad que es capaz de responder adecuadamente a las necesidades básicas de instituciones, empresas y de los habitantes, tanto en el plano económico, como en los aspectos operativos, sociales y ambientales. 1 de enero de 2016 3 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS Una ciudad podrá ser calificada de inteligente en la medida que las inversiones que se realicen en capital humano (educación permanente, enseñanza inicial, enseñanza media y superior, educación de adultos…), aspectos sociales, infraestructuras de energía (electricidad, gas), tecnologías de comunicación (electrónica, Internet) e infraestructuras de transporte, contemplen y promuevan una calidad de vida elevada, un desarrollo económico-ambiental durable y sostenible, una gobernanza participativa, una gestión prudente y reflexiva de los recursos naturales, y un buen aprovechamiento del tiempo de los ciudadanos. OPEN DATA Gobierno abierto: Están intentado fomentar más transparencia en las administraciones públicas. Esto busca que haya una reutilización del dato, cuanto más publiquen en que invierten y en que gastan más lo sabrán los ciudadanos y los periodistas podrán beneficiarse de ello. MEMORANDO DE OBAMA: Es una corriente que ha generado que los otros países la sigan 1. TRANSPARENCIA: un gobierno tiene que ser transparente, tiene que poner en que invierte y en que gasta (Rendición de cuentas + proporcionar datos a la ciudadanía) 2. PARTICIPACIÓN: las administraciones públicas cada vez están fomentando más que la ciudadanía pueda intervenir (preguntar y recibir respuestas) 3. COLABORACIÓN: la ciudadanía puede denunciar, aportar información, etc En España existe una ley (2013) de transparencia de obligado cumplimiento: las administraciones públicas están obligadas a informar El gobierno abierto surge como un nuevo modelo de relación entre los gobernantes, las administraciones y la sociedad. 1 de enero de 2016 4 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS Datos abiertos: - Por una parte tenemos todo lo que se usa de Wikipedia se rige por el Creative Commos Attribution 4.0 que consiste en que tienes que citar al autor sino estás incumpliendo un requisito de la licencia. - Por otra parte tenemos la Licencia de datos abiertos que da la posibilidad de Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. tener una versión cerrada de los datos siempre y cuando se suministre una versión abierta - Decálogo de apertura de datos: Toda persona que quiera abrir un portal de datos abiertos debe seguir estas directrices: 1. Publicar datos en formatos abiertos 2. Usar esquemas conservados 3. Hacer un inventario en un catálogo de datos estructurado 4. Los datos tienen que ser accesibles desde direcciones web persistentes y amigables 5. Hay que exponer un conjunto mínimo de datos relativos al nivel de competencias del organismo 6. Compromiso de servicio: actualización y calidad del dato 7. Monitorizar y evaluar el uso 8. Los datos deben estar bajo condiciones de uso no restrictivas y comunes 9. Educar el uso de datos 10. Recopilar herramientas para facilitar la reutilización - Impacto de datos abiertos: Impacto social: cuantos más datos abiertos haya más acceso tendrá la ciudadanía Impacto económico: se puede hacer negocio con la información pública - RISP y la “economía del dato”: la información es el petróleo de la nueva era. Ejemplo de aplicaciones = Citymapper (sugiere trayectos combinando transportes públicos) o Sin Barrera (busca espacios accesibles y aparcamientos adaptados) - Portal de datos abiertos: Opendata España, Opendata EEUU, Opendata UK, Censo EEUU, etc. PREGUNTA EXAMEN: ¿En las bases de datos relacionales todos los registros contienen los mismos campos? Sí (en las documentales no). 1 de enero de 2016 5 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS TIPOS DE DATOS Y DOMINIOS Modelo relacional: es una manera de estructurar la información de problema concreto a resolver con una Base de Datos Relacional. Es el modelo más utilizado actualmente Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. para modelar problemas reales y administrar datos dinámicamente. Una base de datos relacional es un conjunto de una o más tablas formada por un conjunto de filas (registros) y columnas (campos) que se vinculan entre sí por un campo común. El dominio de un campo es el conjunto de valores que éste puede tomar, cada campo de una base de datos relacional se define sobre un dominio (Ejemplo: en una empresa la tabla de clientes podría incluir los campos de número de teléfono y fax que están definidos sobre el mismo dominio) Los valores válidos y el dominio de un campo vienen determinados por el tipo de dato. En Access por cada tipo de dato hay una serie de propiedades que pueden ser comunes a varios tipos de dato o específica para un tipo. Mediante el uso de ciertas propiedades se pueden restringir el conjunto de valores que un campo puede tomar. Para ello se utilizarán estas propiedades: - Regla de Validación: Ejemplo: el campo DNI del alumno es un número entero y positivo por tanto su regla de validación es mayor que 0 (>0) - Requerido: Ejemplo: Requerido a sí indica que es obligatorio introducir un dato en el campo - Permitir longitud cero: Ejemplo: si se permite la longitud 0 se permitirá que se guarden cadenas de longitud cero en un campo de tipo Texto o Memo - No hay que confundir texto de validación con regla de validación = diferencia: el texto de validación es el mensaje que se le da al usuario en caso de que el dato introducido no cumpla la regla de validación 1 de enero de 2016 6 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS Hay otros elementos que restringen los valores permitidos para un campo: - Clave principal: no puede quedar vacía y su valor no puede estar repetido en ese campo en ninguno de los registros de la tabla. Es única y puede ser un campo o un conjunto de campos. - Clave foránea: es un campo que se ha introducido en una tabla para mostrar su relación con otra. Siempre hace referencia a un campo que es clave principal (o parte de ésta). Una tabla puede tener 0, 1 o muchas. PREGUNTA EXAMEN: ¿Una tabla puede estar relacionada con sí misma? Sí. TIPOS DE RELACIONES Existen 3 tipos de relaciones binarias (donde sólo intervienen dos tablas): 1. Los elementos (registros) de las tablas que intervienen en la relación se asocian uno a uno (Ejemplo: Ayuntamientos Alcaldes. Este tipo de relación se da poco en la práctica porque un Alcalde sólo regenta un Ayuntamiento y un Ayuntamiento sólo es regentado por un Alcalde) 2. Un elemento (registro) de una tabla está asociado con muchos de la otra (Ejemplo: Departamentos Profesores. Este caso va de uno a muchos, un departamento pertenece a muchos profesores, pero un profesor sólo pertenece a un departamento) 1 de enero de 2016 7 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS 3. Cada elemento (registro) de cualquiera de las 2 tablas de la relación puede estar relacionado con muchos de la otra y viceversa (Ejemplos: Alumnos asignaturas / Autores libros. Este es de muchos a muchos, muchos alumnos cursan muchas asignaturas) Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. CONSULTAS En Access existen 2 tipos de consultas: 1. Consultas de selección: son las que permiten seleccionar un conjunto de datos de una o más tablas relacionadas sin alterarlos. 2. Consultas de acción: también permite seleccionar un conjunto de datos de una o más tablas relacionadas pero además proporciona la opción de operar sobre los datos seleccionados. Tiene 3 subtipos: Consultas de actualización: permiten realizar cambios sobre los campos que cumplen una serie de condiciones Consultas de eliminación: permiten eliminar registros que cumplan una serie de condiciones Consultas de datos anexados: permiten añadir datos a las tablas que cumplan una serie de condiciones ¿Cómo se diseña una consulta de selección? Dentro de la pestaña CREAR en la opción DISEÑO DE CONSULTA Herramienta de parámetros: es muy útil para el uso de condiciones dinámicas 1 de enero de 2016 8 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS FORMULARIOS E INFORMES Los formularios se utilizan fundamentalmente para: - Consultar registros existentes - Anexar o crear nuevos registros Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. - Eliminar registros existentes - Modificar los valores de los campos de registro existentes ¿Cómo se crea un formulario? Invocamos al asistente (darle click a un sitio donde pone “Asistente para formularios”) y después seleccionamos una tabla de los campos que queremos incluir, seleccionamos dichos campos y la distribución de éstos y le damos un nombre. ¿Qué herramientas hay que utilizar para trabajar con el formulario? - Primer y último registro - Registro anterior y siguiente - Nuevo registro - Buscar - Eliminar ¿Cómo se construye un informe? Invocamos al asistente (darle click a un sitio donde pone “Asistente para formularios”) y después seleccionamos una tabla de los campos que queremos incluir, seleccionamos dichos campos y la forma de ver los datos (si hay más de una tabla) EXPORTACIÓN E IMPORTACIÓN DE DATOS Se trata de un intercambio de datos donde el origen y el destino pueden ser diferentes. Trabajaremos con el origen de datos en Access, donde tenemos una serie de tablas Proceso de exportación: consiste en poner los datos en las tablas y consultas a disposición de: Access, aplicaciones dentro del entorno de Microsoft (Word, Excel) y archivos de texto. EXPORTAR EXCEL DESTINATARIO WORD ACESS TABLAS ARCHIVO DE TEXTO 1 de enero de 2016 9 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS ORIGEN Proceso de importación: consiste en poner a disposición de Access los datos que provienen de: Access, aplicaciones dentro del entorno de Microsoft y archivos de texto. MI ACCESS La importación puede ser de dos tipos: copia y vínculo DESTINO ¿Cómo importar y/o exportar? En la pestaña datos externos nos encontramos con la opción de: - EXPORTAR: hay que seleccionar el origen de los datos de Access tablas, consultas, etc (todos los datos que quieres exportar). - IMPORTAR o VINCULAR: hay que señalizar desde donde queremos traer los datos PREGUNTA EXAMEN: DIFERENCIA VINCULAR - IMPORTAR Vincular es como abrir una ventana al exterior y ver los datos, solo estás vinculando, mirando la información, NO PUEDES AÑADIR NI MODIFICAR los registros. Una tabla vinculada es una ventana a otro sistema, lo consulto, miro los datos pero no puede modificarlo. INTRODUCCIÓN El objetivo principal de las bases de datos documentales es el tratamiento en general de los documentos (almacenarlos, acceder, etc). Los criterios básicos para clasificar las BDD son: - Según el organismo productor (estatales, autonómicas = cita previa para el médico, empresas privadas = Vodafone, ong = médicos sin fronteras) - Según el modo de acceso - Según la cobertura temática (pueden ser multidisciplinares o especializada en solo una disciplina) 1 de enero de 2016 10 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS - Según la cobertura documental (de un único tipo de documento o de varios tipos de documentos) - Según el modelo de tratamiento documental Las bases de datos se componen de diferentes registros con su correspondiente identificación. Según el modelo de base de datos y el tipo de documentos vaciado en la Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. misma se establece una estructura de campos particular, por ejemplo, en una base de datos donde se incorporan referencias de artículos de revista se suelen encontrar campos como los siguientes: - Autor o autores del documento original - Título del artículo - Título de la revista en la que aparece - Año de publicación - Etc MECANISMOS DE ACCESO A BASES DE DATOS DOCUMENTALES 1. Acceso local: solo se puede acceder desde el realizador, por ejemplo bases de datos internas de bibliotecas y centros de documentación 2. En soporte: en CD, USB, DVD. Sistema muy utilizado antes de la universalización de Internet 3. En línea: Acceso vía web. Ejemplo: Wikipedia, Dialnet, cualquier página en la que busques información a través de Internet ESTRUCTURA DE ALMACENAMIENTO DE LA INFORMACIÓN DOCUMENTAL Los registros de las BDD pueden incluir o no el contenido completo de los documentos que describen, podemos distinguir tres categorías: 1. Bases de datos de texto completo: aquellas constituidas por el texto completo en formato electrónico 2. Archivos electrónicos de imágenes: están formados por enlaces directos a la imagen del documento original 3. Bases de datos referenciales: no contienen el texto original, solo la información fundamental para describir y permitir la localización de los documentos TIPOS Y TRATAMIENTOS DE LOS DOCUMENTOS Según el modelo de tratamiento del documento pueden ser: 1. Sin análisis de contenido: información básica, se componen de referencias bibliográficas sencillas pero el realizador solo nos da datos de la fuente sin analizar el contenido 2. Catálogo de bibliotecas: solo trata los contenidos de una biblioteca o una red de éstas 1 de enero de 2016 11 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS 3. BDD con análisis documental más completo: se incluye un resumen del contenido original y más información para el usuario, pero requiere que éste esté familiarizado con la terminología de la descripción PREGUNTA EXAMEN: ¿QUÉ ES LA INDIZACIÓN? Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Es un proceso que consiste en extraer los conceptos representativos del contenido de un documento con la ayuda de un lenguaje documental PREGUNTA EXAMEN: DIFERENCIA ENTRE CITA Y REFERENCIA Una referencia es el documento que yo menciono (fuente) y la cita son los que me mencionan a mí. PREGUNTA EXAMEN: ¿EN LAS BASES DE DATOS RELACIONALES TODOS LOS REGISTROS CONTIENEN LOS MISMOS CAMPOS? Sí, en las documentales no 1 de enero de 2016 12 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS CONCEPTOS FUNDAMENTALES DE INTERNET Y TECNOLOGÍAS WEB Historia de Internet 1957: Se crea la Agencia de Proyectos de Investigaciones avanzadas de Defensa (ARPA) 1967: Hombre llega a la luna y marca el inicio de las comunicaciones globales 1969: ARPA crea ARPAnet 1970: Protocolo IP 1990: Aparece MILNET Worl Wide Web (WWW: Es un medio de comunicación de texto, gráficos y otros objetos a través de Internet. Web 1.0 La inicio Tim Bernerns que propuso un sistema que se llemaba hipertexto y servía para compartir documentos. Es un sistema basado en hipertexto que permite clasificar información de diversos tipos, enlaza páginas o documentos localizados en la red sin importar su ubicación física, por eso se la considera como una gran telaraña. HTTP: utilizarlo es lo mismo que decir que utilizo un protocolo de transparencia de hipertexto Protocolos HTML: formato hipertextual e hipergráfico para publicar documentos en la red. Es importante saber que cuando en un navegador buscamos una página html estamos buscando una dirección en un conjunto de hipertextos 1. Pocos productores de contenidos 2. Muchos lectores de estos contenidos 3. Páginas estáticas 4. La actualización no es periódica Características 5. Sitios no colaborativos 6. Interacción mínima 7. Evolución: 1.0: web estática con documentos que jamás se actualizaban 1.5: construidas dinámicamente a partir de una o varias bases de datos 1 de enero de 2016 13 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS Web 2.0 Diferenciación con la 1.0 -> hay interactividad, tu subes y recibes no sólo recibes - Sistema de Gestión de Contenidos (CMS): un cms permite la creación y administración de contenidos principalmente en páginas web. Es un interfaz que controla una o varias bases de datos donde aloja el contenido, además permite Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. manejar de manera independiente el contenido y el diseño - Evolución de los CMS: Páginas Páginas estáticas dinámicas. Gran (HTML). Difícil Páginas flexibilidad. actualización. dinámicas. Poca Separación total Contenido y flexibilidad entre contenido y diseño unidos diseño 1. El usuario participa activamente, es el centro, crea y comparte Características 2. Participación: publica comentarios, conocimiento compartido 3. Usabilidad: no son necesarios grandes conocimientos - JavaScript: acciones interactivas en el ordenador (por ejemplo cuando pones el ratón sobre una foto se mueve) - Blogs: sitios donde los usuarios escriben periódicamente artículos y los lectores dejan sus comentarios - Wiki: es una colección de páginas de hipertexto, la plataforma de wiki te permite buscar palabras concretas y te facilita la búsqueda - RSS: formato que permite recibir los contenidos de una web sin visitarla, un usuario puede suscribirse a varias páginas web y recibir la información sin necesidad de entrar a la web Web 3.0 Se puede interactuar: compartir videos, publicar comentarios, subir información etc. Está empezando a utilizarse la web semántica, por ejemplo: esta escuela pertenece a tal colegio, en tal ciudad (por tanto la web semántica permite contextualizar). 1. Web semántica: facilita las aplicaciones de software para que se pueda anticipar lo que realmente quieres saber o hacer 2. 3D web: permite presentar imágenes tridimensionales Característica 3. Media-centric web: es la búsqueda visual: mediante la presentación s de una fotografía puedes conseguir varias fotos similares (como en Google cuando buscamos una imagen) o se puede reconocer una canción entera con solo un trozo 1 de enero de 2016 14 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS 4. Pervasive Web: Internet y la Web penetrará mucho más en las casas Características conectándose con otros aparatos electrónicos 5. Base de datos como página web: Se puede acceder y gestionar una base de datos en la Web de manera abierta y sencilla Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. ¿Web 4.0? Cada vez más los aparatos, dispositivos, etc se van conectando entre sí, interactúan entre ellos, de esta manera se nos facilitarán tareas a los humanos. Esta es la visión de futuro que se preveé y que está empezando a utilizarse (por ejemplo: el reloj ya está conectado con el móvil). 1. Web Ubicua: es lo opuesto a realidad virtual en ella la persona entra en el mundo de los ordenadores pero en la web ubicua son los Características ordenadores los que entran en la vida cotidiana 2. Unir las inteligencias: sincronizar los aparatos electrónicos 3. Crear una web que conozca, aprenda y razones como los humanos TÉCNICAS DE ACCESO A LAS BASES DE DATOS EN INTERNET - Formatos de datos en la web La información que sale en Internet está dividida en: Bases de datos relacionales ESTRUCTURADA Bases de datos documentales Otras bases de datos INFORMACIÓN Ficheros XML SEMI - ESTRUCTURADA Bases de datos no-SQL Ficheros de texto NO ESTRUCTURADA No texto Los formatos más extendidos son: - Webs (HTML): el 80% de Internet está concebido en este tipo de formato 1 de enero de 2016 15 Las descargas sin publicidad se realizan con las coins a64b0469ff35958ef4ab887a898bd50bdfbbe91a-10742839 GESTIÓN DE BASE DE DATOS - Portales OpenData: una pequeña parte está en extensión XLS (suelen estar en este formato los ficheros que descargamos), CSV (los campos están separados por comas) etc. - PDF (Portable Document Format): almacena documentos digitales, es un formato estable, que no se puede editar (una imagen no tratable) por esta razón puedes abrirlo en cualquier equipo, dependiendo como se haya creado y tratado ese pdf nosotros podemos extraer o no información: PDF creado a través de un escaneo: no contiene texto original, por tanto no podemos meterle una hoja de Excel y extraer un cálculo, podemos leerlo pero no modificarlo. Para extraer la información de este tipo de ficheros es necesario utilizar programas de “Reconocimiento Óptico de Caracteres” (OCR) que intentar reconocer el texto original a partir de “las manchas negras sobre fondo blanco” que aparecen en la imagen. Dependiendo el PDF generado digitalmente: podemos guardar un Excel en pdf por tanto origen del PDF ahí sí que tendremos herramientas que nos permitan extraer podemos información. Como el texto se ha creado se puede buscar y extraer de el: explotarlo de una - Podemos seleccionar y copiar texto manera u otra - Para copiar información y mantener la estructura de ésta podemos utilizar programas como el tabula - PDF’s digitales con datos complejos: power point - Técnicas de acceso a Tablas HTML: cuando tienes que acceder a Internet a una página que tiene una tabla con datos se pueden usar extensiones de nuestros navegadores para que resulte más sencillo: Table2 Clipboar en Firefox TableCapture para Chrome TÉCNICAS DE ACCESO A CONTENIDOS EN LA WEB (SCRAPING) Busca información en las páginas web donde tú le dices y se va descargando dicha información, es muy útil porque a veces retiran la información de dichas páginas y de esta manera puedes volver a consultarla TRATAMIENTO Y LIMPIEZA DE DATOS EN LA WEB HERRAMIENTAS DE LIMPIEZA Hoja de cálculo (Excel) Google Refine Base de Datos (Acess) HERRAMIENTAS DE EXPLOTACIÓN Google Fusion Tableau Public Google Public Hojas de cáclulo Tables Data (Excel) 1 de enero de 2016 16 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.