Unidad 1 Base de Datos PDF
Document Details
Uploaded by FerventVigor
Universidad Nacional de Asunción
Tags
Summary
Estos apuntes de la unidad 1 de base de datos aplican a sistemas de información geográfica, enfocándose en bases de datos relacionales en el contexto de ingeniería ambiental en la Universidad Nacional de Asunción. Se revisan los conceptos fundamentales, desde la estructura hasta la gestión de los datos.
Full Transcript
Ingeniería Ambiental Los Sistemas de Información Geográfica, sobre todo los vectoriales, basan su almacenamiento de datos en estructuras de bases de datos de tipo relacional, por lo que es preciso la explicación de los conceptos básicos de estas estructura y la forma de elaboración de consul...
Ingeniería Ambiental Los Sistemas de Información Geográfica, sobre todo los vectoriales, basan su almacenamiento de datos en estructuras de bases de datos de tipo relacional, por lo que es preciso la explicación de los conceptos básicos de estas estructura y la forma de elaboración de consultas y operaciones entre sus componentes. Las bases de datos son las encargadas en los SIG de almacenar los atributos de los objetos cartográficos representados y deben combinarse con las bases de datos que almacenan la topología y geometría de dichos objetos. Esta complejidad de almacenamiento de información es lo que hace considerar a los SIG vectoriales más complejos y/o potentes. A cada objeto contenido en una categoría se le asigna un único identificador. Cada objeto está caracterizado por una localización única (atributos gráficos con relación a unas coordenadas geográficas) y por un conjunto de descripciones (atributos no gráficos) El modelo de datos permite relacionar y ligar atributos gráficos y no gráficos. Las relaciones se establecen tanto desde el punto de vista posicional como topológico. Los datos posicionales dicen donde está el elemento y los datos topológicos informan sobre la ubicación del elemento con relación a los otros elementos. Los atributos no gráficos dicen qué es, y cómo es el objeto. El número identificador que es único para cada objeto de la categoría es almacenado tanto en el archivo o mapa de objetos como en la tabla de atributos, lo cual garantiza una correspondencia estricta entre los atributos gráficos y no gráficos. La esencia de un SIG está constituida por una base de datos geográfica. Esta es, una colección de datos acerca de objetos localizados en una determinada área de interés en la superficie de la tierra, organizados en una forma tal que puede servir eficientemente a una o varias aplicaciones. Una base de datos geográfica requiere de un conjunto de procedimientos que permitan hacer un mantenimiento de ella tanto desde el punto de vista de su documentación como de su administración. La eficiencia está determinada por los diferentes tipos de datos almacenados en diferentes estructuras. El vínculo entre las diferentes estructuras se obtiene mediante el campo clave que contiene el número identificador de los elementos. Tal número identificador aparece tanto en los atributos gráficos como en los no gráficos. Los atributos no gráficos son guardados en tablas y manipulados por medio de un sistema manejador de bases de datos. Los atributos gráficos son guardados en archivos y manejados por el software de un sistema SIG. Los objetos geográficos son organizados por temas de información, o capas de información, llamadas también niveles o coberturas. Aunque los puntos, líneas y polígonos pueden ser almacenados en niveles separados, lo que permite la agrupación de la información en temas son los atributos no gráficos. Los elementos simplemente son agrupados por lo que ellos representan. Así por ejemplo, en una categoría dada, ríos y carreteras aun siendo ambos objetos línea están almacenados en distintos niveles por cuanto sus atributos son diferentes. Los formatos estándar para un archivo de diseño son el formato RASTER y el formato tipo VECTOR, en el primero de ellos se define una grilla o una malla de rectángulos o cuadrados a los que se les denomina grilla, cada retícula posee información alfanumérica asociada que representa las características de la zona o superficie geográfica que cubre, como ejemplos de este formato se pueden citar la salida de un proceso de fotografía satelital, la fotografía aérea es otro buen ejemplo. De otro lado, el formato vectorial representa la información por medio de vectores formados por pares ordenados de coordenadas, este ordenamiento da lugar a las entidades universales con las que se representan los objetos gráficos, así: un punto se representa mediante un par de coordenadas, una línea como mínimo por dos pares de coordenadas, y un polígono como una serie de líneas que se inicia y se cierra en el mismo punto. Base de datos: conjunto de datos informáticos relacionados entre sí que están almacenados de forma que son recuperable fácilmente, con la posibilidad de relacionados, ordenarlos siguiendo un criterio, etc. Sistema de gestión de bases de datos (SGBD): son el conjunto de programas responsables de la generación, mantenimiento, actualización e integridad de las bases de datos. Modelo relacional: es el más utilizado actualmente tanto en el modelado como en la administración de datos. Su estructura se basa en el concepto de tablas, compuestas de registros (filas) y campos (columnas). La información es almacenada y recuperada por medio de consultas muy flexibles. El lenguaje utilizado para la realización de las consultas es SQL (Structurate Query Language – Lenguaje de Consulta Estructurado). Centrándonos en las bases de datos de tipo relacional, por ser aquellas que gestión los atributos de los elementos de los objetos SIG se pueden diferenciar los siguientes elementos que la conforman: Entidad: son los objetos existentes en la realidad o bien abstractos, acerca de los cuales se quiere almacenar y recuperar información en una base de datos y que se diferenciarán unos de otros por una serie de atributos o características. Grupo de entidades: será la agrupación de entidades del mismo tipo. Atributo: son los datos reales que caracterizan una entidad que los describe. Dominio: es el conjunto de datos admitidos para un atributo. Campos: son la columnas de la tabla y se corresponden con cada uno de los atributos que componen un registro y hacen referencia a un dominio de la entidad que deseamos describir. Están definidos por el tipo de datos que contienen. Clave: El campo o conjunto de campos que representa a cada entidad de forma única. Registro lógico, fila : son las filas o fichas de la tabla y contienen todos los datos de interés de una entidad. Estos registros pueden ser de dos tipo atendiendo a su longitud, fija o variable. Tablas: es un contenedor de datos dividido en filas o registros y columnas o campos. Tienen las siguientes propiedades: Cada entrada en la tabla corresponde a un ítem individual. Todos los ítems de una columna son de la misma clase. Cada columna tiene asignado un nombre único en el conjunto de columnas de la tabla. Para una tabla dada todas las filas son diferentes. Tanto las filas como las columnas pueden ser consideradas en cualquier secuencia sin afectar ni el contenido ni la representación de la información. Las operaciones básicas que pueden realizarse en una bases de datos conforman lo que se denomina algebra relacional y establece las bases operativas del lenguaje SQL, que debe cumplir cualquier gestor que se ajuste a este estándar. Estas operaciones básicas son: Unión: permite combinar datos de varias relaciones. Es necesario para realizar esta operación que las tablas a unir tengan las mismas estructuras y los campos los mismos valores. Intersección: permite identificar filas que son comunes en dos relaciones. Diferencia: permite identificar que filas están en una relación y no en otra. Producto: es la obtención de un producto cartesiano entre dos tablas dando como resultado todas las posibles combinaciones entre los registros de la primera y la segunda tabla. Las operaciones básicas que realizaremos de forma repetida en un SIG consistirán fundamentalmente en selecciones, inserciones y uniones de tablas. Estas operaciones básicas hay que conocerlas, así como las diferencias existentes entre cada una de ellas, los que nos permitirá potenciar la operatividad del SIG. En general todos los gestores SIG contienen un gestor para el tratamiento de las tablas de dato, si bien se encuentran muy limitados en el acceso a la construcción de ordenes. En otros casos esta herramientas son tan versátiles como los gestores de bases de datos. Se relatan seguidamente las ordenes básicas de un gestor de bases de datos y que de forma opaca al usuario de un SIG usan la mayoría de los Gestores de información geográfica. CREATE DATABASE nombre_base_datos -> crea una base de datos Se crea automáticamente al iniciar una cobertura nueva) USE nombre_base_datos -> usa una base de datos (orden automática al cargar una cobertura en el gestor de información geográfica) CREATE TABLE nombre_tabla{ definición_de_los_campos} -> crea una tabla de almacenamiento de información (orden interna que dependiendo del tipo de objeto gráfico establece los campos que son necesarios, estos campos pueden ser aumentados, los establecidos por el gestos de información geográfica deben permanecer ya que están relacionados con los atributos topológicos de las entidades representadas) En la mayoría de los gestores de bases de datos se pueden unir tablas durante la selección para la obtención de búsquedas de información más completas. Esta operación en los gestores de información geográfica suele tener un comando específico. En muchos programas se diferencian dos formas de unión entre tablas; en cualquier caso es necesario: Que exista un campo común entre ambas tablas Este campo no tiene que llamarse de igual forma, pero si contener datos de iguales características. Generalmente estos métodos son usados para ahorrar espacio de almacenamiento de datos y que las tablas no contengan datos redundantes. Cuanto más simple sea una tabla más rápido será realizar búsquedas en ella. JOIN: Une dos tablas de forma permanente, se encuentran dinámicamente unidas. El tipo de unión que se suele realizar con este operador es de uno_a_ uno o muchos_a_uno. A una tabla se le pueden unir tantas tablas como se desee. Relates: Une dos tablas de forma no permanente, sin unión física de los campos de ambas tablas, pero las actuaciones sobre una tabla son refenciadas en la relacionada. El tipo de unión que se suele realizar con este operador es de uno_a_muchos o muchos_a_muchos. A una tabla se le pueden unir tantas tablas como se desee.