resumen unidad 1 y 2.pdf
Document Details
Uploaded by GorgeousCombinatorics
Universidad Autónoma España de Durango
Tags
Full Transcript
Unidad 1: ficheros: Es la organización lógica utilizada para el almacenamiento y acceso a la información en la memoria secundaria. Los ficheros son estructuras de información que crean los sistemas operativos de los ordenadores para poder almacenar los datos. Tienen un nombre y una extensión que det...
Unidad 1: ficheros: Es la organización lógica utilizada para el almacenamiento y acceso a la información en la memoria secundaria. Los ficheros son estructuras de información que crean los sistemas operativos de los ordenadores para poder almacenar los datos. Tienen un nombre y una extensión que determina el formato de la información que contiene. Pueden tener una extensión fija o variable y lonico que almacena es una secuencia de bits de forma que es necesaria su interpretación para dar sentido a la información que almacena. Se pueden clasificar en varios tipos: Según su contenido. Puede ser tratado como texto o como datos binarios. Ficheros de texto: Se les conoce también con el nombre de planos o ASCII Es un estándar que asigna un valor numérico a cada carácter. La signación de valores numéricos a caracteres viene dada por la famosa tabla de códigos scii, que es la más extendida, aunque existen otras. Estos a su vez pueden clasificarse entre: 1. Ficheros de configuración: se utilizan para configurar los sistemas operativos o algunas aplicaciones. Pueden tener extensión. 2. Ficheros de código fuente: su contenido es texto con programas informáticos. Ejemplos:.sql,.c,.java. 3. Ficheros de páginas web: que no dejan de ser ficheros de texto con hipertexto que interpreta el navegador. Ejemplos:.html, 4. Formatos enriquecidos: son textos que contienen códigos de control para ofrecer una visión del texto más elegante. Ejemplos:.rtf Ficheros binarios: Son todos aquellos que no son de texto, y requieren una aplicación para ser interpretados, como son: 1. De imagen:.jpg 2. De video:.mpg 3. Comprimidos o empaquetados:.zip 4. Ejecutables o compilados:.exe Según su organización: Organización física: El SO implementa su almacenamiento a nivel físico. dependerá del dispositivo en sí y de sus características de cómo el SO tendrá implementado esa gestión para determinar cómo se almacena físicamente en el dispositivo físico la información. Que a su vez pueden ser clasificados dependiendo su acceso: acceso directo: El tiempo de acceso es independiente de la posición física de la isma en el soporte. acceso indirecto: ara acceder a la información se ha de acceder a la información revia. Organización lógica: cómo se organizan y representa la información que contienen los ficheros a nivel del SW que lo utiliza. Secuencial: los registros están dispuestos siguiendo una secuencia ordenada. Directa: permiten el acceso a los datos directamente sin necesidad de pasar por los anteriores, se accede directamente a cualquier posición del registro. Directa por posición: utiliza la posición física del registro en el fichero para su acceso Directa por clave o indexada: normalmente querremos acceder a los registros por algún campo que actué de índice. La implementación de esta organización se realiza mediante una función hash. con una lista secuencial de registros: ◦ En un primer paso se obtiene la clave que apuntará al inicio de las olisiones de esa clase. ◦ En un segundo paso, se accede de forma secuencial a los elementos de as colisiones (son listas de bloques físicos en los que se almacenan un onjunto de registros). Secuencial indexada: acceden a la información a través de un índice, combinan las características de los dos anteriores Según su utilidad, indica el uso que se va a hacer de él en las aplicaciones que los tilizan. Operaciones generales básicas a nivel SO reación de un fichero, Borrado de un fichero, Renombrar un fichero, Tamaño del fichero, Apertura del fichero, Lectura de registro, Escritura de registro, Desplazar puntero, Obtener posición, Cierre del fichero. Operaciones generales según su organización lógica. Se entiende por organización lógica a la estructura interna de la secuencia de bytes de un fichero, para almacenar la información utilizada por los programas. A partir de ellas se necesitan un nivel de abstracción superior al proporcionado por el SO, de forma que, mediante los lenguajes de programación, se pueden manejar las diferentes organizaciones lógicas de los ficheros de una forma cómoda por los programadores. Desventajas de los ficheros: 1. En los sistemas de ficheros, cada programa dispone del conjunto de archivos específicos para sus necesidades de almacenamiento de datos. 2. Redundancias e inconsistencias de los datos. 3. Dificultad de acceso a ciertos datos. 4. Aislamiento de datos 5. Interacciones concurrentes 6. Seguridad: De acceso a los datos, restablecimiento de errores y copias de seguridad. 7. Integridad: determinadas condiciones de integridad se tienen que implementar en la lógica de negocio de los sistemas 8. Atomicidad: Cuando hay un fallo informático (corte de corriente, error de disco BASES DE DATOS Y SISTEMAS DE GESTIÓN DE BASES DE DATOS. Los sistemas informáticos, en especial los Sistemas de Información, necesitan procesar y gestionar una gran cantidad de datos. Datos: un conjunto de símbolos o caracteres (las palabras de un libro) Información: agregación de varios datos junto con sus relaciones o dependencias para acceder a un nivel de comprensión y entendimiento más alto de un fenómeno determinado Información: agregación de varios datos junto con sus relaciones o dependencias para acceder a un nivel de comprensión y entendimiento más alto de un fenómeno determinado (texo del libro) Base de Datos Es una colección de datos relacionados lógicamente entre sí, con una definición y descripción comunes y que están estructurados de una determinada manera. modelos de datos: Conjunto de herramientas conceptuales que permiten describir la BD (es la abstracción de los datos y sus relaciones): el modelado es la herramienta para representar la realidad. Modelo en red: organiza la información en registros (también llamados nodos) y enlaces. En los registros se almacenan los datos, mientras que los enlaces permiten relacionar estos datos. Las bases de datos en red son parecidas a las jerárquicas sólo que en ellas puede haber más de un padre. En este modelo se pueden representar perfectamente cualquier tipo de relación entre los datos, pero hace muy complicado su manejo. Modelo relacional: Hoy en día las bases de datos relacionales son las más utilizadas. en el modelo relacional la base de datos es percibida por el usuario como un conjunto de tablas. Esta percepción es sólo a nivel lógico, ya que a nivel físico puede estar implementada mediante distintas estructuras de almacenamiento. El modelo relacional utiliza tablas bidimensionales (relaciones) para la representación lógica de los datos y las relaciones entre ellas. Cada relación (tabla) posee un nombre que es único y contiene un conjunto de columnas. Se llamará registro, entidad o tupla a cada fila de la tabla y campo o atributo a cada columna de la tabla. un objeto es un conjunto de cosas comunes con un código para acceder a ellos. Modelo orientado a objetos: El modelo orientado a objetos define una base de datos en términos de objetos, sus propiedades y sus operaciones. Los objetos con la misma estructura y comportamiento pertenecen a una clase, y las clases se organizan en jerarquías. Las operaciones de cada clase se especifican en términos de procedimientos predefinidos denominados métodos. El objetivo del modelo orientado a objetos es cubrir las limitaciones del modelo relacional. Gracias a este modelo se incorporan mejoras como la herencia entre tablas, los tipos definidos por el usuario, disparadores almacenables en la base de datos. Este modelo es considerado como el fundamento de las bases de datos de tercera generación. Modelo Objeto-Relacional: son un híbrido entre las bases del modelo relacional y el orientado a objetos. se busca obtener lo mejor del modelo relacional, incorporando las mejoras ofrecidas por la orientación a objetos. En este modelo se siguen almacenando tuplas, aunque la estructura de las tuplas no está restringida, sino que las relaciones pueden ser definidas en función de otras, que es lo que denominamos herencia directa. Modelo de bases de datos deductivas: En este modelo las bases de datos almacenan la información y permiten realizar deducciones a través de inferencias. Las bases de datos deductivas son llamadas también bases de datos lógicas, al basarse en lógica matemática. Sistemas gestores de BD : conjunto de programas necesarios para llevar a la practica (que funcione) del modelo (la base de datos) Sistema Gestor de Base de Datos: Conjunto coordinado de programas, procedimientos, lenguajes, etc., que suministra, tanto a los usuarios no informáticos, como a los analistas programadores, o al administrador, los medios necesarios para describir y manipular los datos contenidos en la base de datos, manteniendo su integridad, confidencialidad y seguridad. Un SGBD se compone de: 1. Base de Datos: Conjunto de programas que permiten la gestión de estos datos: permiten realizar la definición, manipulación y control de los datos. Proporciona un nivel de abstracción de los datos, ocultando los detalles de almacenamiento que para el usuario final. 2. Nivel visión: vistas parciales de los datos por los usuarios / aplicaciones 3. Nivel conceptual (lógico): los datos y sus relaciones 4. Nivel físico: cómo se almacenan. Permiten que la información de la BD se guarde y se recupere de manera conveniente y eficiente, dentro del sistema informático. Ventajas: 1. va a resolver los problemas que tenian los ficheros 2. visión abstracta de los datos, ocultando parte de la complejidad relacionada con cómo se almacenan y mantienen los datos. 3. Ofrecen independencia física. 4. independencia lógica. 5. Disminuyen la redundancia y la inconsistencia de datos (problema de los ficheros). 6. integridad de los datos (lo pueden utilizar varias aplicaicones al mismo tiempo). 7. Aumentan la seguridad y privacidad 8. Mejoran la eficiencia 9. Facilitan el intercambio de datos 10. mecanismos de copias de seguridad PREGUNTA DE EXAMEN: Funciones: Lenguajes de definición de datos, manejo de datos y control. un SGBD desarrolla tres funciones fundamentales Función de descripción o definición: Permite al diseñador de la base de datos crear las estructuras apropiadas para integrar adecuadamente los datos. Esta función se realiza mediante el lenguaje de definición de datos o DDL. Mediante ese lenguaje: se definen las estructuras de datos, se definen las relaciones entre los datos y se definen las reglas (restricciones) que han de cumplir los datos. Función de manipulación: permite a los usuarios de la base buscar, añadir, suprimir o modificar los datos de la misma, Se llevará a cabo por medio de un lenguaje de manipulación de datos (DML) que facilita los instrumentos necesarios para la realización de estas tareas. Función de control: permite al administrador de la base de datos establecer mecanismos de protección de las diferentes visiones de los datos asociadas a cada usuario, proporcionando elementos de creación y modificación de dichos usuarios. Adicionalmente, incorpora sistemas para la creación de copias de seguridad, carga de ficheros, auditoría, protección de ataques, configuración del sistema, etc. El lenguaje que implementa esta función es el lenguaje de control de datos o DCL. Herramientas de la base de datos. Son un conjunto de aplicaciones que permiten a los administradores la gestión de la base de datos, de los usuarios y permisos, generadores de formularios, informes, interfaces gráficas, generadores de aplicaciones, etc. SGBD Comerciales A continuación, podemos ver algunos ejemplos más representativos de SGBD: PREGUNTA DE EXAMEN 2, su diferencia BD centralizadas Aquella estructura en la que el SGBD está implantado en una sola plataforma u ordenador desde donde se gestiona directamente, de modo centralizado, la totalidad de los recursos. Características: Se almacena completamente en una ubicación central. No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las bases de datos distribuidas. Componentes: los datos, el software de gestión de bases de datos y los dispositivos de almacenamiento secundario asociados. BD distribuidas Conjunto de múltiples bases de datos lógicamente relacionadas, las cuales se encuentran distribuidas entre diferentes nodos interconectados por una red de comunicaciones. Cada BBDD será gestionada por el SGBD correspondiente. En estas la comunicación es fundamental para que puedan funcionar como 1 sola base de datos. UNIDAD 2: ARQUITECTURAS Entendemos arquitectura como la forma de abstraer y entender las características fundamentales de un sistema. Se pueden ver desde diferentes criterios: Operacional: como se realiza su procesamiento o ejecución del SGBD. Niveles de abstracción de los datos: la arquitectura de referencia ANSI/SPARC. Arquitecturas de referencia Realiza una abstracción de los datos en niveles, que permiten su análisis, diseño e implementación para su uso por los sistemas informáticos. Independencia de los datos: separación entre los programas y los datos. Disponibilidad de múltiples vistas de usuario /aplicaciones Utilización de un catálogo para almacenar la descripción de la base de datos. Codasy es la base de los siguientes pero ya esta en desuso: Utiliza dos niveles de abstracción: El nivel lógico: Oculta los detalles físicos de almacenamiento y acceso a los datos. Incluye entidades, atributos, interrelaciones y reglas de integridad. El nivel físico: Elementos de almacenamiento físico Como índices, espacio físico en el que se agrupan los registros, magnitud de las páginas o bloques, etc. El inconveniente es que en el diseño lógico se tiene que tener en cuenta el SGBD a utilizar, por lo que no hay independencia del lógico con el físico. Arquitectura ANSI/SPARC Es una evolución del Codasyl. Se descompone el nivel lógico en dos: ◦ El nivel externo ◦ El nivel conceptual El nivel físico: se denominará nivel interno El objetivo principal: Establecer una división de la base de datos en tres niveles de esquemas según la perspectiva desde la que ésta es vista. Tres niveles de abstracción que se corresponden con los tres principales grupos de usuarios de la base de datos: usuarios finales (externo), programadores (conceptual) y administradores (físico). Los niveles se representan por esquemas: Esquemas externos (o visión): describen los datos y sus relaciones que interesan para una aplicación dada (una vista en concreto) y/o usuarios. Esquema conceptual: describe el conjunto de datos y sus relaciones del sistema. Oculta detalles de las estructuras físicas de almacenamiento y se centra en las entidades, tipos de datos, relaciones y restricciones. Sirve de marco de referencia común para los E. Externos. Esquema interno: representación en los dispositivos de almacenamiento externos de los datos del E. Conceptual. Es el almacenamiento físico de los datos. El interno describe la estructura física de almacenamiento de la base de datos. En el Esquema Conceptual: se describen los elementos de información que intervienen en el sistema (las entidades, sus propiedades, atributos y las relaciones entre ellas). Se realiza de forma independiente del físico y al externo, es la forma de representarlo. En el Esquema Canónico: en vez de ver la representación del problema de forma aislada, sí que se tiene en cuenta la forma en la que va a ser procesada la información (Por ejem. Relacional, Red, etc.) Se obtiene del EC aplicando reglas y condiciones de cómo la información va a ser procesada. El Canónico es el esquema global de los datos y sus relaciones, teniendo en cuenta el SGBD El proceso de diseño: 1. Se diseña el Esquema Conceptual sin tener en cuenta a ningún SGBD (o modo en el que será procesada): Modelo Entidad Relación. 2. Se pasa de este EC al canónico: en el que ya se considera el SGDB a utilizar, Modelo Lógico. 3. Se pasa del canónico al EI: Modelo Físico. Arquitectura externa Son las aplicaciones que se apoyan en el SGBD y el usuario ve como un conjunto de partes más o menos estructuradas.. TIPOS DE SISTEMAS Según el modelo canónico: Son los modelos de datos vistos en la Unidad 1. Según su modelo operacional: Especifica cómo se organiza la distribución del procesamiento del SGBD en el sistema informático centralizada: Aquella estructura en la que el SGBD está implantado en una sola plataforma u ordenador desde donde se gestiona directamente, de modo centralizado, la totalidad de los recursos: Se almacena completamente en una ubicación central. No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las bases de datos distribuidas. Distribuida: Conjunto de múltiples bases de datos lógicamente relacionadas, las cuales se encuentran distribuidas entre diferentes nodos interconectados por una red de comunicaciones. Arquitectura Cliente-servidor El procesamiento del SGBD se reparte entre dos tipos de módulos: Clientes (la interfaz con el usuario, que se suele ejecutar sobre un ordenador personal). Servidor o los servidores: en el que se ejecuta el corazón del SGBD, llamado motor de BD. La funcionalidad del sistema se suele distribuir de la manera siguiente: Cliente maneja la interacción con el usuario, proporciona los programas de aplicación y las interfaces de usuario (GUI basadas en formularios y menús) que acceden a la base de datos. Servidor se encarga de realizar las tareas propias de la base de datos ( maneja el almacenamiento, el acceso y la búsqueda de datos). Los dos módulos se pueden ejecutar en el mismo ordenador o en ordenadores diferentes si éstos se interconectan a través de un sistema de comunicaciones.