Bases de datos y usuarios de bases de datos PDF
Document Details
Uploaded by PhenomenalYttrium8968
E.P.E.T. N° 16
Tags
Summary
Este documento proporciona una introducción general a los conceptos de bases de datos y sistemas de bases de datos. Explica la importancia de las bases de datos en la sociedad actual y proporciona ejemplos de su uso en diversas actividades cotidianas y en diferentes campos como negocios, comercio electrónico, ingeniería y más. Se presentan ejemplos del uso de bases de datos y la organización de datos.
Full Transcript
CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 3 CAPÍTULO 1 Bases de datos y...
CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 3 CAPÍTULO 1 Bases de datos y usuarios de bases de datos as bases de datos y los sistemas de bases de datos son un componente esencial de la vida cotidiana en la L sociedad moderna. Actualmente, la mayoría de nosotros nos enfrentamos a diversas actividades que implican cierta interacción con una base de datos. Por ejemplo, ir al banco a depositar o retirar fondos, realizar una reserva en un hotel o una compañía aérea, acceder al catálogo computerizado de una biblioteca para buscar un libro, o comprar algo online (un juguete o un computador, por ejemplo), son actividades que implican que alguien o algún programa de computador acceda a una base de datos. Incluso la compra de pro- ductos en un supermercado, en muchos casos, provoca la actualización automática de la base de datos que mantiene el stock de la tienda. Estas interacciones son ejemplos de lo que podemos llamar aplicaciones de bases de datos tradicionales, en las que la mayor parte de la información que hay almacenada y a la que se accede es textual o numérica. En los últimos años, los avances en la tecnología han conducido a excitantes aplicaciones y sistemas de bases de datos nuevos. La tecnología de los medios de comunicación nuevos hace posible almacenar digitalmente imá- genes, clips de audio y flujos (streams) de vídeo. Estos tipos de archivos se están convirtiendo en un compo- nente importante de las bases de datos multimedia. Los sistemas de información geográfica (GIS, Geographic information systems) pueden almacenar y analizar mapas, datos meteorológicos e imágenes de satélite. Los almacenes de datos y los sistemas de procesamiento analítico en línea (OLAP, online analy- tical processing) se utilizan en muchas compañías para extraer y analizar información útil de bases de datos mucho más grandes para permitir la toma de decisiones. Las tecnologías de tiempo real y bases de datos activas se utilizan para controlar procesos industriales y de fabricación. Y las técnicas de búsqueda en las bases de datos se están aplicando a la WWW para mejorar la búsqueda de la información que los usuarios necesitan para navegar por Internet. No obstante, para entender los fundamentos de la tecnología de bases de datos debemos empezar por los prin- cipios básicos de las aplicaciones de bases de datos tradicionales. En la Sección 1.1 definiremos una base de datos y, a continuación, explicaremos otros términos básicos. En la Sección 1.2 ofrecemos un ejemplo de bases de datos sencillo, UNIVERSIDAD, a fin de ilustrar nuestra explicación. La Sección 1.3 describe algunas de las características principales de los sistemas de bases de datos, y las Secciones 1.4 y 1.5 clasifican los tipos de personal cuyos trabajos implican el uso e interacción con sistemas de bases de datos. Las Secciones 1.6 a 1.8 ofrecen una explicación más completa de las diferentes capacidades que los sistemas de bases de datos ofrecen y explican algunas aplicaciones de bases de datos típicas. La Sección 1.9 es un resumen del capítulo. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 4 4 Capítulo 1 Bases de datos y usuarios de bases de datos El lector que desee una introducción rápida a los sistemas de bases de datos sólo tiene que estudiar las Secciones 1.1 a 1.5, después omitir u ojear rápidamente las Secciones 1.6 a 1.8, y pasar al Capítulo 2. 1.1 Introducción Las bases de datos y la tecnología de bases de datos tienen mucha culpa del uso creciente de los computado- res. Es justo decir que las bases de datos juegan un papel fundamental en la mayoría de las áreas en las que se utilizan computadores, como en el ámbito empresarial, en el comercio electrónico, ingeniería, medicina, justicia, educación y bibliotecas. La expresión base de datos se utiliza tan a menudo que empezaremos por definir su significado. Nuestra primera definición es muy general. Una base de datos es una colección de datos relacionados. Con la palabra datos nos referimos a los hechos (datos) conocidos que se pueden grabar y que tienen un significado implícito. Por ejemplo, piense en los nom- bres, números de teléfono y direcciones de las personas que conoce. Puede tener todos estos datos grabados en un libro de direcciones indexado o los puede tener almacenados en el disco duro de un computador median- te una aplicación como Microsoft Access o Excel. Esta colección de datos relacionados con un significado implícito es una base de datos. La definición anterior de base de datos es muy genérica; por ejemplo, podemos pensar que la colección de palabras que compone esta página de texto es una colección de datos relacionados y que, por tanto, constitu- ye una base de datos. No obstante, el uso común del término base de datos es normalmente más restringido. Una base de datos tiene las siguientes propiedades implícitas: Una base de datos representa algún aspecto del mundo real, lo que en ocasiones se denomina mini- mundo o universo de discurso (UoD, Universe of discourse). Los cambios introducidos en el mini- mundo se reflejan en la base de datos. Una base de datos es una colección de datos lógicamente coherente con algún tipo de significado inhe- rente. No es correcto denominar base de datos a un surtido aleatorio de datos. Una base de datos se diseña, construye y rellena con datos para un propósito específico. Dispone de un grupo pretendido de usuarios y algunas aplicaciones preconcebidas en las que esos usuarios están inte- resados. En otras palabras, una base de datos tiene algún origen del que se derivan los datos, algún grado de interac- ción con eventos del mundo real y un público que está activamente interesado en su contenido. Los usuarios finales de una base de datos pueden efectuar transacciones comerciales (por ejemplo, un cliente que compra una cámara) o se pueden producir unos eventos (por ejemplo, un empleado tiene un hijo) que provoquen un cambio en la información almacenada en la base de datos. Al objeto de que una base de datos sea en todo momento precisa y fiable, debe ser un reflejo exacto del minimundo que representa; por consiguiente, en la base de datos deben reflejarse los cambios tan pronto como sea posible. Una base de datos puede ser de cualquier tamaño y complejidad. Por ejemplo, la lista de nombres y direccio- nes a la que nos referíamos anteriormente puede constar de únicamente unos cuantos cientos de registros, cada uno de ellos con una estructura sencilla. Por el contrario, el catálogo computerizado de una gran biblioteca puede contener medio millón de entradas organizadas en diferentes categorías (por los apellidos del autor principal, por el tema, por el título del libro), y cada categoría ordenada alfabéticamente. El Departamento de tesorería de Estados Unidos (IRS, Internal Revenue Service) mantiene una base de datos de un tamaño y com- plejidad aún mayores para supervisar los formularios de impuestos presentados por los contribuyentes ameri- canos. Si asumimos que hay 100 millones de contribuyentes y que cada uno presenta una media de cinco for- mularios con aproximadamente 400 caracteres de información por cada uno, tenemos una base de datos de 100 ⫻ 106 ⫻ 400 x 5 caracteres (bytes) de información. Si el IRS conserva las tres últimas declaraciones de cada contribuyente, además de la actual, tenemos una base de datos de 8 x 1011 bytes (800 gigabytes). Esta CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 5 1.1 Introducción 5 inmensa cantidad de información debe organizarse y administrarse para que los usuarios puedan buscar, recu- perar y actualizar los datos que necesiten. Amazon.com es un buen ejemplo de una gran base de datos comer- cial. Contiene datos de más de 20 millones de libros, CDs, vídeos, DVDs, juegos, ropa y otros productos. La base de datos ocupa más de 2 terabytes (un terabyte es 1012 bytes de almacenamiento) y se almacena en 200 computadores diferentes (denominados servidores). Cada día acceden a Amazon.com aproximadamente 15 millones de visitantes que utilizan la base de datos para hacer compras. La base de datos se actualiza conti- nuamente a medida que se añaden libros y otros productos nuevos al inventario, mientras que el stock se actualiza al tiempo que se tramitan las compras. Alrededor de 100 personas son las responsables de mantener actualizada la base de datos de Amazon. Una base de datos se puede generar y mantener manualmente o estar computerizada. Por ejemplo, el catálo- go de cartas de una biblioteca es una base de datos que se puede crear y mantener de forma manual. Una base de datos computerizada se puede crear y mantener con un grupo de aplicaciones escritas específicamente para esa tarea o mediante un sistema de administración de bases de datos. En este libro sólo nos ocuparemos de las bases de datos computerizadas. Un sistema de administración de datos (DBMS, database management system) es una colección de pro- gramas que permite a los usuarios crear y mantener una base de datos. El DBMS es un sistema de software de propósito general que facilita los procesos de definición, construcción, manipulación y compartición de bases de datos entre varios usuarios y aplicaciones. Definir una base de datos implica especificar los tipos de datos, estructuras y restricciones de los datos que se almacenarán en la base de datos. La definición o infor- mación descriptiva de una base de datos también se almacena en esta última en forma de catálogo o diccio- nario de la base de datos; es lo que se conoce como metadatos. La construcción de la base de datos es el pro- ceso consistente en almacenar los datos en algún medio de almacenamiento controlado por el DBMS. La manipulación de una base de datos incluye funciones como la consulta de la base de datos para recuperar datos específicos, actualizar la base de datos para reflejar los cambios introducidos en el minimundo y gene- rar informes a partir de los datos. Compartir una base de datos permite que varios usuarios y programas acce- dan a la base de datos de forma simultánea. Una aplicación accede a la base de datos enviando consultas o solicitudes de datos al DBMS. Una consulta1 normalmente provoca la recuperación de algunos datos; una transacción puede provocar la lectura o la escri- tura de algunos datos en la base de datos. Otras funciones importantes ofrecidas por el DBMS son la protección de la base de datos y su mantenimien- to durante un largo periodo de tiempo. La protección incluye la protección del sistema contra el funciona- miento defectuoso del hardware o el software (caídas) y la protección de la seguridad contra el acceso no autorizado o malintencionado. Una gran base de datos típica puede tener un ciclo de vida de muchos años, por lo que el DBMS debe ser capaz de mantener el sistema de bases de datos permitiendo que el sistema evolu- cione según cambian los requisitos con el tiempo. No es necesario utilizar software DBMS de propósito general para implementar una base de datos compute- rizada. Podríamos escribir nuestro propio conjunto de programas para crear y mantener la base de datos; en realidad, podríamos crear nuestro propio software DBMS de propósito especial. En cualquier caso (utilice- mos o no un DBMS de propósito general), normalmente tenemos que implantar una cantidad considerable de software complejo. De hecho, la mayoría de los DBMS son sistemas de software muy complejos. Como colofón de nuestras definiciones iniciales, denominaremos sistema de bases de datos a la combina- ción de base de datos y software DBMS. La Figura 1.1 ilustra algunos de los conceptos que hemos explicado hasta ahora. 1 Eltérmino consulta, que inicialmente hacía referencia a una pregunta o cuestión, se utiliza ampliamente para todos los tipos de intera- cciones con bases de datos, incluyendo la modificación de datos. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 6 6 Capítulo 1 Bases de datos y usuarios de bases de datos Figura 1.1. Entorno de un sistema de bases de datos simplificado. Usuarios/Programadores Sistema de bases de datos Programas de aplicación /Consultas Software DBMS Software para procesar consultas / Programas Software para acceder a los datos almacenados Definición de la base de datos Base de datos almacenada almacenada (metadatos) 1.2 Un ejemplo Vamos a ver un ejemplo con el que la mayoría de los lectores estarán familiarizados: una base de datos UNIVERSIDAD para el mantenimiento de la información relativa a los estudiantes, cursos y calificaciones en un entorno universitario. La Figura 1.2 muestra la estructura de la base de datos y algunos datos a modo de ejemplo. La base de datos está organizada en cinco archivos, cada uno de los cuales almacena registros de datos del mismo tipo.2 El archivo ESTUDIANTE almacena los datos de todos los estudiantes, el archivo CURSO almacena los datos de todos los curso, el archivo SECCIÓN almacena los datos de las secciones de un curso, el archivo INFORME_CALIF almacena las calificaciones que los estudiantes han obtenido en las distintas sec- ciones que han completado, y el archivo PRERREQUISITO almacena los prerrequisitos de cada curso. Para definir esta base de datos debemos especificar la estructura de los registros de cada archivo detallando los diferentes tipos de elementos de datos que se almacenarán en cada registro. En la Figura 1.2, cada regis- tro ESTUDIANTE incluye los datos que representan el nombre, el número, la clase (como principiante o ‘1’, estudiante de segundo año o ‘2’, etcétera) y la especialidad (como, por ejemplo, matemáticas o ‘MAT’, cien- cias de la computación o ‘CC’); cada registro de CURSO incluye los datos que representan el nombre, el número y las horas de crédito del curso, así como el departamento que ofrece el curso; etcétera. También hay que especificar un tipo de datos para cada elemento de datos de un registro. Por ejemplo, podemos especifi- car que el Nombre de un ESTUDIANTE es una cadena de caracteres alfabéticos, que NumEstudiante es 2El término archivo lo utilizamos aquí formalmente. A un nivel conceptual, un archivo es una colección de registros que pueden o no estar ordenados. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 7 1.2 Un ejemplo 7 Figura 1.2. Base de datos que almacena la información de estudiantes y cursos. ESTUDIANTE Nombre NumEstudiante Clase Especialidad Luis 17 1 CS Carlos 8 2 CS CURSO NombreCurso NumCurso Horas Departamento Introducción a la computación CC1310 4 CC Estructuras de datos CC3320 4 CC Matemáticas discretas MAT2410 3 MAT Bases de datos CC3380 3 CC SECCIÓN IDSeccion NumCurso Semestre Año Profesor 85 MAT2410 Otoño 04 Pedro 92 CC1310 Otoño 04 Ana 102 CC3320 Primavera 05 Elisa 112 MAT2410 Otoño 05 Antonio 119 CC1310 Otoño 05 Juan 135 CC3380 Otoño 05 Enrique INFORME_CALIF NumEstudiante IDSeccion Nota 17 112 B 17 119 C 8 85 A 8 92 A 8 102 B 8 135 A PRERREQUISITO NumCurso NumPrerrequisito CC3380 CC3320 CC3380 MAT2410 CC3320 CC1310 CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 8 8 Capítulo 1 Bases de datos y usuarios de bases de datos un entero o que la Nota de INFORME_CALIF es un solo carácter del conjunto {‘A’, ‘B’, ‘C’, ‘D’, ‘F’, ‘I’}. También podemos utilizar un esquema de codificación para representar los valores de un elemento de datos. Por ejemplo, en la Figura 1.2 representamos la Clase de un ESTUDIANTE como 1 para los principiantes, 2 para los estudiantes de segundo año, 3 para los junior, 4 para los sénior y 5 para los estudiantes graduados. La construcción de la base de datos UNIVERSIDAD se realiza almacenando los datos que representan a todos los estudiantes, cursos, secciones, informes de calificaciones y prerrequisitos a modo de registro en el archi- vo adecuado. Los registros de los distintos archivos se pueden relacionar. Por ejemplo, el registro correspon- diente a Luis en el archivo ESTUDIANTE está relacionado con dos registros del archivo INFORME_CALIF que especifican las calificaciones de Luis en dos secciones. De forma parecida, cada registro del archivo PRERRE- QUISITO relaciona dos registros de curso: uno representa el curso y el otro representa el requisito previo. La mayoría de las bases de datos de medio y gran tamaño cuentan con muchos tipos de registros y tienen muchas relaciones entre los registros. La manipulación de bases de datos implica la consulta y la actualización. A continuación tiene algunos ejem- plos de consultas: Recuperar el certificado de estudios (listado de todos los cursos y calificaciones) de ‘Luis’. Listado con los nombres de los estudiantes que tomaron la sección del curso ‘Bases de datos’ ofrecida en otoño de 2005, así como sus calificaciones en esa sección. Listado de los prerrequisitos del curso ‘Bases de datos’. Y estos son algunos ejemplos de actualizaciones: Cambiar la clase de ‘Luis’ a estudiante de segundo año. Crear una sección nueva para el curso ‘Bases de datos’ para este semestre. Introducir una nota ‘A’ para ‘Luis’ en la sección ‘Bases de datos’ del último semestre. Estas consultas y modificaciones informales deben especificarse con exactitud en el lenguaje de consulta del DBMS antes de poder ser procesadas. A estas alturas, es útil describir la base de datos como una parte de una tarea más amplia conocida como sis- tema de información dentro de cualquier organización. El departamento de Tecnología de la información (TI, Information Technology) de una empresa diseña y mantiene un sistema de información compuesto por varios computadores, sistemas de almacenamiento, aplicaciones y bases de datos. El diseño de una aplicación nueva para una base de datos existente o el diseño de una base de datos nueva empieza con una fase denominada definición de requisitos y análisis. Estos requisitos son documentados en detalle y transformados en un dise- ño conceptual que se puede representar y manipular mediante algunas herramientas computerizadas, de modo que en una implementación de base de datos puedan mantenerse, modificarse y transformarse fácilmente. En el Capítulo 3 introduciremos un modelo denominado Entidad-Relación que se utiliza con este propósito. El diseño después se convierte en un diseño lógico que se puede expresar en un modelo de datos implementado en un DBMS comercial. Del Capítulo 5 en adelante destacaremos un modelo de datos conocido como mode- lo de Datos relacionales. Actualmente es la metodología más popular para diseñar e implementar bases de datos utilizando DBMSs (relacionales). La etapa final es el diseño físico, durante la que se proporcionan espe- cificaciones suplementarias para el almacenamiento y acceso a la base de datos. El diseño de base de datos se implementa y rellena con datos reales y se realiza un mantenimiento continuado a fin de reflejar el estado del minimundo. 1.3 Características de la metodología de bases de datos Unas cuantas características distinguen la metodología de bases de datos de la metodología tradicional de pro- gramación con archivos. En el procesamiento tradicional de archivos, cada usuario define e implementa los CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 9 1.3 Características de la metodología de bases de datos 9 archivos necesarios para una aplicación concreta como parte de la programación de esa aplicación. Por ejem- plo, un usuario, la oficina de notificación de calificaciones, puede encargarse del mantenimiento de un archi- vo con los estudiantes y sus calificaciones. Los programas encargados de imprimir el certificado de estudios de un estudiante e introducir nuevas calificaciones en el archivo se implementan como parte de la aplicación. Un segundo usuario, la oficina de contabilidad, puede encargarse del seguimiento de las cuotas de los estu- diantes y sus pagos. Aunque ambos usuarios están interesados en datos relacionados con los estudiantes, cada uno mantiene archivos separados (y programas para la manipulación de esos archivos), porque cada uno requiere algunos datos que no están disponibles en los archivos del otro. Esta redundancia en la definición y el almacenamiento de datos da como resultado un derroche de espacio de almacenamiento y unos esfuerzos redundantes por mantener al día datos comunes. En la metodología de bases de datos se mantiene un único almacén de datos, que se define una sola vez, y al que acceden varios usuarios. En los sistemas de archivos cada aplicación tiene libertad para asignar un nom- bre independientemente a los elementos de datos. Por el contrario, en una base de datos, los nombres o eti- quetas de los datos se definen una vez, y son utilizados por consultas, transacciones y aplicaciones. Las prin- cipales características de la metodología de bases de datos frente a la metodología de procesamiento de archi- vos son las siguientes: Naturaleza autodescriptiva de un sistema de bases de datos. Aislamiento entre programas y datos, y abstracción de datos. Soporte de varias vistas de los datos. Compartición de datos y procesamiento de transacciones multiusuario. Explicaremos cada una de estas características en una sección separada. En las Secciones 1.6 a 1.8 hablare- mos de otras características adicionales de los sistemas de bases de datos. 1.3.1 Naturaleza autodescriptiva de un sistema de bases de datos Una característica fundamental de la metodología de bases de datos es que el sistema de bases de datos no sólo contiene la propia base de datos, sino también una completa definición o descripción de la estructura de la base de datos y sus restricciones. Esta definición se almacena en el catálogo DBMS, que contiene informa- ción como la estructura de cada archivo, el tipo y el formato de almacenamiento de cada elemento de datos, y distintas restricciones de los datos. La información almacenada en el catálogo se denomina metadatos y describe la estructura de la base de datos principal (véase la Figura 1.1). El software DBMS y los usuarios de la base de datos utilizan el catálogo cuando necesitan información sobre la estructura de la base de datos. Un paquete de software DBMS de propósito general no se escribe para una aplicación de base de datos específica. Por consiguiente, debe referirse al catálogo para conocer la estructura de los archivos de una base de datos específica, como el tipo y el formato de los datos a los que accederá. El software DBMS debe funcionar igual de bien con cualquier cantidad de aplicaciones de bases de datos (por ejemplo, la base de datos de una universidad, la base de datos de un banco o la base de datos de una empre- sa), siempre y cuando la definición de la base de datos esté almacenada en el catálogo. En el procesamiento de archivos tradicional, normalmente la definición de datos forma parte de los progra- mas de aplicación. Así pues, esas aplicaciones están restringidas a trabajar sólo con una base de datos espe- cífica, cuya estructura está declarada en dichas aplicaciones. Por ejemplo, una aplicación escrita en C++ puede tener declaraciones struct o class, y un programa COBOL puede tener sentencias de “data division” para defi- nir sus archivos. Mientras el software de procesamiento de archivos sólo puede acceder a bases de datos espe- cíficas, el software DBMS puede acceder a distintas bases de datos extrayendo del catálogo las definiciones de las mismas y utilizando después esas definiciones. Para el ejemplo de la Figura 1.2, el catálogo DBMS almacenará las definiciones de todos los archivos mos- trados. La Figura 1.3 muestra algunas entradas de ejemplo en un catálogo de base de datos. El diseñador de CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 10 10 Capítulo 1 Bases de datos y usuarios de bases de datos Figura 1.3. Ejemplo de catálogo de base de datos para la base de datos de la Figura 1.2. RELACIONES NombreRelacion NumDeColumnas ESTUDIANTE 4 CURSO 4 SECCIÓN 5 INFORME_CALIF 3 PRERREQUISITO 2 COLUMNAS NombreColumna TipoDatos PerteneceARelacion Nombre Carácter (30) ESTUDIANTE NumEstudiante Carácter (4) ESTUDIANTE Clase Entero (1) ESTUDIANTE Especialidad TipoEspecialidad ESTUDIANTE NombreCurso Carácter (10) CURSO NumCurso XXXXNNNN CURSO....................................... NumPrerrequisito XXXXNNNN PRERREQUISITO Nota: TipoEspecialidad se define como un tipo enumerado con todas las especialidades conoci- das. XXXXNNNN se utiliza para definir un tipo con cuatro caracteres alfanuméricos seguidos por cuatro dígitos. la base de datos especifica estas definiciones antes de crear la base de datos y se almacenan en el catálogo. Siempre que se crea una solicitud para acceder, por ejemplo, al Nombre de un registro de ESTUDIANTE, el software DBMS recurre al catálogo para determinar la estructura del archivo ESTUDIANTE y la posición y el tamaño del elemento de datos Nombre dentro de un registro ESTUDIANTE. Por el contrario, en una aplica- ción de procesamiento de archivos típica, la estructura del archivo y, en caso extremo, la ubicación exacta de Nombre dentro de un registro ESTUDIANTE también están codificadas dentro de cada programa que accede a dicho elemento de datos. 1.3.2 Aislamiento entre programas y datos, y abstracción de datos En el procesamiento de archivos tradicional, la estructura de los archivos de datos está incrustada en las apli- caciones, por lo que los cambios que se introducen en la estructura de un archivo pueden obligar a realizar cambios en todos los programas que acceden a ese archivo. Por el contrario, los programas que acceden a un DBMS no necesitan esos cambios en la mayoría de los casos. La estructura de los archivos de datos se alma- cena en el catálogo DBMS, independientemente de los programas de acceso. Llamaremos a esta propiedad independencia programa-datos. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 11 1.3 Características de la metodología de bases de datos 11 Por ejemplo, un programa de acceso a archivos puede escribirse de modo que sólo pueda acceder a los regis- tros ESTUDIANTE de la estructura mostrada en la Figura 1.4. Si queremos añadir otra porción de datos a cada registro ESTUDIANTE, por ejemplo FechaNac, un programa semejante ya no funcionará y deberá modificar- se. Por el contrario, en un entorno DBMS, sólo tendremos que cambiar la descripción de los registros ESTU- DIANTE en el catálogo (véase la Figura 1.3) para reflejar la inclusión del nuevo elemento de datos FechaNac; ningún programa cambia. La siguiente vez que un programa DBMS haga referencia al catálogo, se podrá uti- lizar y acceder a la estructura nueva de los registros ESTUDIANTE. En algunos tipos de sistemas de bases de datos, como los sistemas orientados a objetos y los de objetos rela- cionales (consulte los Capítulos 20 a 22), los usuarios pueden definir operaciones sobre los datos como parte de las definiciones de la base de datos. Una operación (también denominada función o método) se puede especificar de dos formas. La interfaz (o firma) de una operación incluye el nombre de la operación y los tipos de datos de sus argumentos (o parámetros). La implementación (o método) de la operación se especifica sepa- radamente y puede modificarse sin que la interfaz se vea afectada. Las aplicaciones de usuario pueden operar sobre los datos invocando estas operaciones por sus nombres y argumentos, independientemente de cómo estén implementadas las operaciones. Esto puede recibir el nombre de independencia programa-operación. La característica que permite la independencia programa-datos y la independencia programa-operación se denomina abstracción de datos. Un DBMS proporciona a los usuarios una representación conceptual de los datos que no incluye muchos de los detalles de cómo están almacenados los datos o de cómo están imple- mentadas las operaciones. Informalmente, un modelo de datos es un tipo de abstracción de datos que se uti- liza para proporcionar esa representación conceptual. El modelo de datos utiliza conceptos lógicos, como objetos, sus propiedades y sus relaciones, lo que para la mayoría de los usuarios es más fácil de entender que los conceptos de almacenamiento en el computador. Por ello, el modelo de datos oculta los detalles del alma- cenamiento y de la implementación que no resultan interesantes a la mayoría de los usuarios de bases de datos. A modo de ejemplo, considere las Figuras 1.2 y 1.3. La implementación interna de un archivo puede definir- se por la longitud de su registro (el número de caracteres o bytes de cada registro) y cada elemento de datos puede especificarse mediante su byte inicial dentro de un registro y su longitud en bytes. El registro ESTU- DIANTE se representaría entonces como se muestra en la Figura 1.4. Pero un usuario típico de una base de datos no se preocupa por la ubicación de cada elemento de datos dentro de un registro, ni por su longitud; más bien, la preocupación del usuario está en que cuando haga una referencia al Nombre de un ESTUDIANTE quie- re obtener el valor correcto. En la Figura 1.2 se ofrece una representación conceptual de los registros ESTU- DIANTE. El DBMS puede ocultar a los usuarios de la base de datos muchos otros detalles de la organización del almacenamiento de los datos (como las rutas de acceso especificadas en un archivo); los detalles sobre el almacenamiento se explican en los Capítulos 13 y 14. En la metodología de bases de datos, la estructura detallada y la organización de cada archivo se almacenan en el catálogo. Los usuarios de bases de datos y los programas de aplicación hacen referencia a la represen- tación conceptual de los archivos y, cuando los módulos de acceso al archivo DBMS necesita detalles sobre el almacenamiento del archivo, el DBMS los extrae del catálogo. Se pueden utilizar muchos modelos de datos para proporcionar esta abstracción de datos a los usuarios de bases de datos. Una buena parte de este libro está Figura 1.4. Formato de almacenamiento interno de un registro ESTUDIANTE, basándose en el catálogo de la base de datos de la Figura 1.3. Nombre del elemento de datos Posición inicial en el registro Longitud en caracteres (bytes) Nombre 1 30 NumEstudiante 31 4 Clase 35 1 Especialidad 36 4 CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 12 12 Capítulo 1 Bases de datos y usuarios de bases de datos dedicada a presentar distintos modelos de datos y los conceptos que utilizan para abstraer la representación de los datos. En las bases de datos orientadas a objetos y de objetos relacionales, el proceso de abstracción no sólo inclu- ye la estructura de datos, sino también las operaciones sobre los datos. Estas operaciones proporcionan una abstracción de las actividades del minimundo normalmente entendidas por los usuarios. Por ejemplo, se puede aplicar una operación CALCULAR_CM a un objeto ESTUDIANTE para calcular la calificación media. Dichas operaciones pueden ser invocadas por las consultas del usuario o por las aplicaciones, sin necesidad de cono- cer los detalles de cómo están implementadas esas operaciones. En este sentido, una abstracción de la activi- dad del minimundo queda a disposición de los usuarios como una operación abstracta. 1.3.3 Soporte de varias vistas de los datos Normalmente una base de datos tiene muchos usuarios, cada uno de los cuales puede necesitar una pers- pectiva o vista diferente de la base de datos. Una vista puede ser un subconjunto de la base de datos o puede contener datos virtuales derivados de los archivos de la base de datos pero que no están explícitamente alma- cenados. Algunos usuarios no tienen la necesidad de preocuparse por si los datos a los que se refieren están almacenados o son derivados. Un DBMS multiusuario cuyos usuarios tienen variedad de diferentes aplicacio- nes debe ofrecer facilidades para definir varias vistas. Por ejemplo, un usuario de la base de datos de la Figura 1.2 puede estar interesado únicamente en acceder e imprimir el certificado de estudios de cada estudiante; la Figura 1.5(a) muestra la vista para este usuario. Un segundo usuario, que sólo está interesado en comprobar que los estudiantes cumplen con todos los prerrequisitos de cada curso para poder registrarse, puede requerir la vista representada en la Figura 1.5(b). Figura 1.5. Dos vistas derivadas de la base de datos de la Figura 1.2. (a) Vista del certificado de estudios. (b) Vista de los prerrequisitos del curso. CERTIFICADO CertificadoEstudiante NombreEstudiante NumCurso Nota Semestre Año IDSeccion CC1310 C Otoño 05 119 Luis MAT2410 B Otoño 05 112 MAT2410 A Otoño 04 85 CC1310 A Otoño 04 92 Carlos CC3320 B Primavera 05 102 CC3380 A Otoño 05 135 (a) PRERREQUISITO_CURSO NombreCurso NumCurso Prerrequisitos CC3320 Bases de datos CC3380 MAT2410 Estructuras de datos CC3320 CC1310 (b) CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 13 1.4 Actores de la escena 13 1.3.4 Compartición de datos y procesamiento de transacciones multiusuario Un DBMS multiusuario, como su nombre indica, debe permitir que varios usuarios puedan acceder a la base de datos al mismo tiempo. Esto es esencial si los datos destinados a varias aplicaciones serán integrados y mantenidos en una sola base de datos. El DBMS debe incluir software de control de la concurrencia para que esos varios usuarios que intentan actualizar los mismos datos, lo hagan de un modo controlado para que el resultado de la actualización sea correcto. Por ejemplo, si varios agentes de viajes intentan reservar un asiento en un vuelo, el DBMS debe garantizar que en cada momento sólo un agente tiene acceso a la asig- nación de ese asiento para un pasajero. Estos tipos de aplicaciones se denominan, por lo general, aplicacio- nes de procesamiento de transacciones en línea (OLTP, online transaction processing). Un papel funda- mental del software DBMS multiusuario es garantizar que las transacciones concurrentes operan correcta y eficazmente. El concepto de transacción es cada vez más importante para las aplicaciones de bases de datos. Una transac- ción es un programa en ejecución o proceso que incluye uno o más accesos a la base de datos, como la lec- tura o la actualización de los registros de la misma. Se supone que una transacción ejecuta un acceso lógica- mente correcto a la base de datos si lo ejecutó íntegramente sin interferencia de otras transacciones. El DBMS debe implementar varias propiedades de transacción. La propiedad aislamiento garantiza que parezca que cada transacción se ejecuta de forma aislada de otras transacciones, aunque puedan estar ejecutándose cien- tos de transacciones al mismo tiempo. La propiedad de atomicidad garantiza que se ejecuten o todas o nin- guna de las operaciones de bases de datos de una transacción. En la Parte 5 se explican las transacciones más en profundidad. Las características anteriores son muy importantes para distinguir un DBMS del software de procesamiento de archivos tradicional. En la Sección 1.6 explicamos las características adicionales que caracterizan un DBMS. No obstante, en primer lugar clasificaremos los diferentes tipos de personas que trabajan en el entor- no de un sistema de bases de datos. 1.4 Actores de la escena En el caso de una base de datos personal pequeña, como la lista de direcciones mencionada en la Sección 1.1, un usuario normalmente define, construye y manipula la base de datos, de modo que no se comparten datos. Sin embargo, en empresas grandes, muchas personas están implicadas en el diseño, uso y mantenimiento de una base de datos grande con cientos de usuarios. En esta sección identificamos las personas cuyos trabajos implican el uso diario de una base de datos grande; las denominaremos actores de la escena. En la Sección 1.5 hablaremos de las personas que podríamos llamar trabajadores entre bambalinas (los que trabajan en el mantenimiento del entorno del sistema de bases de datos pero que no están activamente interesados en la pro- pia base de datos). 1.4.1 Administradores de las bases de datos En cualquier empresa donde muchas personas utilizan los mismo recursos, se necesita un administrador jefe que supervise y administre esos recursos. En un entorno de bases de datos, el recurso principal es la base de datos en sí misma, mientras que el recurso secundario es el DBMS y el software relacionado. La administra- ción de estos recursos es responsabilidad del administrador de la base de datos (DBA, database adminis- trator). El DBA es responsable del acceso autorizado a la base de datos, de la coordinación y monitorización de su uso, y de adquirir los recursos software y hardware necesarios. El DBA también es responsable de pro- blemas como las brechas de seguridad o de unos tiempos de respuesta pobres. En las empresas grandes, el DBA está asistido por un equipo de personas que llevan a cabo estas funciones. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 14 14 Capítulo 1 Bases de datos y usuarios de bases de datos 1.4.2 Diseñadores de las bases de datos Los diseñadores de las bases de datos son los responsables de identificar los datos que se almacenarán en la base de datos y de elegir las estructuras apropiadas para representar y almacenar esos datos. Estas tareas se acometen principalmente antes de implementar y rellenar la base de datos. Es responsabilidad de los diseña- dores comunicarse con todos los presuntos usuarios de la base de datos para conocer sus requisitos, a fin de crear un diseño que satisfaga sus necesidades. En muchos casos, los diseñadores forman parte de la plantilla del DBA y se les pueden asignar otras responsabilidades una vez completado el diseño de la base de datos. Estos diseñadores normalmente interactúan con los grupos de usuarios potenciales y desarrollan vistas de la base de datos que satisfacen los requisitos de datos y procesamiento de esos grupos. Cada vista se analiza des- pués y se integra con las vistas de los otros grupos de usuarios. El diseño final de la base de datos debe ser capaz de soportar los requisitos de todos los grupos de usuarios. 1.4.3 Usuarios finales Los usuarios finales son las personas cuyos trabajos requieren acceso a la base de datos para realizar consul- tas, actualizaciones e informes; la base de datos existe principalmente para ser utilizada. Los usuarios finales se pueden clasificar en varias categorías: Los usuarios finales casuales acceden ocasionalmente a la base de datos, pero pueden necesitar una información diferente en cada momento. Utilizan un sofisticado lenguaje de consulta de bases de datos para especificar sus peticiones y normalmente son administradores de nivel medio o alto u otros usua- rios interesados. Los usuarios finales principiantes o paramétricos constituyen una parte considerable de los usua- rios finales de las bases de datos. Su labor principal gira entorno a la consulta y actualización constan- tes de la base de datos, utilizando tipos de consultas y actualizaciones estándar (denominadas transacciones enlatadas) que se han programado y probado cuidadosamente. Las tareas que estos usuarios llevan a cabo son variadas: Los cajeros bancarios comprueban los balances de cuentas, así como las retiradas y los depósitos de fondos. Los agentes de viajes que reservan en aerolíneas, hoteles y compañías de alquiler de automóviles comprueban la disponibilidad de una solicitud dada y hacen la reserva. Los empleados de las estaciones receptoras de las compañías navieras introducen las identificacio- nes de los paquetes mediante códigos de barras y demás información descriptiva a través de boto- nes para actualizar una base de datos central de paquetes recibidos y en tránsito. Entre los usuarios finales sofisticados se encuentran los ingenieros, los científicos, los analistas comerciales y otros muchos que están completamente familiarizados con el DBMS a fin de implemen- tar sus aplicaciones y satisfacer sus complejos requisitos. Los usuarios finales independientes mantienen bases de datos personales utilizando paquetes de pro- gramas confeccionados que proporcionan unas interfaces fáciles de usar y basadas en menús o gráfi- cos. Un ejemplo es el usuario de un paquete de impuestos que almacena sus datos financieros perso- nales de cara a la declaración de la renta. Un DBMS típico proporciona muchas formas de acceder a una base de datos. Los usuarios finales principian- tes tienen que aprender muy poco sobre los servicios del DBMS; simplemente tienen que familiarizarse con las interfaces de usuario de las transacciones estándar diseñadas e implementadas para su uso. Los usuarios casuales sólo se aprenden unos cuantos servicios que pueden utilizar repetidamente. Los usuarios sofisticados intentan aprender la mayoría de los servicios del DBMS para satisfacer sus complejos requisitos. Los usua- rios independientes normalmente llegan a ser expertos en un paquete de software específico. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 15 1.6 Ventajas de utilizar una metodología DBMS 15 1.4.4 Analistas de sistemas y programadores de aplicaciones (ingenieros de software) Los analistas de sistemas determinan los requisitos de los usuarios finales, especialmente de los usuarios fina- les principiantes y paramétricos, así como las especificaciones de desarrollo para las transacciones enlatadas que satisfacen esos requisitos. Los programadores de aplicaciones implementan esas especificaciones como programas; después, verifican, depuran, documentan y mantienen esas transacciones enlatadas. Dichos ana- listas y programadores (normalmente conocidos como desarrolladores de software o ingenieros de softwa- re) deben familiarizarse con todas las posibilidades proporcionadas por el DBMS al objeto de desempeñar sus tareas. 1.5 Trabajadores entre bambalinas Además de los que diseñan, utilizan y administran una base de datos, hay otros usuarios que están asociados con el diseño, el desarrollo y el funcionamiento de un entorno de software y sistema DBMS. Estas personas normalmente no están interesadas en la base de datos propiamente dicha. Los denominaremos trabajadores entre bambalinas y los dividiremos en las siguientes categorías: Diseñadores e implementadores de sistemas DBMS. Diseñan e implementan los módulos y las inter- faces DBMS como un paquete software. Un DBMS es un sistema software muy complejo compuesto por muchos componentes, o módulos, incluyendo los destinados a implementar el catálogo, procesar el lenguaje de consulta, procesar la interfaz, acceder y almacenar los datos en un búfer, controlar la concurrencia, y manipular la recuperación y la seguridad de los datos. El DBMS debe interactuar con otro software de sistema, como el sistema operativo y los compiladores de diversos lenguajes de pro- gramación. Desarrolladores de herramientas. Diseñan e implementan herramientas (paquetes de software que facilitan el modelado y el diseño de la base de datos, el diseño del sistema de bases de datos y la mejo- ra del rendimiento). Las herramientas son paquetes opcionales que a menudo se compran por separa- do. Entre ellas podemos citar los paquetes para el diseño de bases de datos, la monitorización del ren- dimiento, las interfaces gráficas o en otros idiomas, el prototipado, la simulación y la generación de datos de prueba. En muchos casos, los fabricantes de software independiente desarrollan y comercia- lizan estas herramientas. Operadores y personal de mantenimiento (personal de administración del sistema). Son los respon- sables de la ejecución y el mantenimiento real del entorno hardware y software para el sistema de bases de datos. Aunque estas categorías de trabajadores entre bambalinas se encargan de que el sistema de bases de datos esté disponible para los usuarios finales, normalmente no utilizan la base de datos para sus propios fines. 1.6 Ventajas de utilizar una metodología DBMS En esta sección explicaremos algunas de las ventajas de utilizar un DBMS y las capacidades que un buen DBMS debe poseer. Estas capacidades se añaden a las cuatro características principales explicadas en la Sección 1.3. El DBA debe utilizar estas capacidades para acometer una variedad de objetivos relacionados con el diseño, la administración y el uso de una base de datos multiusuario grande. 1.6.1 Control de la redundancia En el desarrollo tradicional de software que hace uso del procesamiento de archivos, cada grupo de usuarios mantiene sus propios archivos para manipular sus aplicaciones de procesamiento de datos. Por ejemplo, CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 16 16 Capítulo 1 Bases de datos y usuarios de bases de datos vamos a retomar la base de datos UNIVERSIDAD de la Sección 1.2; aquí, el personal que registra los cursos y la oficina de contabilidad podrían ser los dos grupos de usuarios. En la metodología tradicional, cada grupo mantiene sus propios archivos de estudiantes. La oficina de contabilidad guarda datos sobre el registro y la información de facturación relacionada, mientras que la oficina de registro hace un seguimiento de los cursos y las calificaciones de los estudiantes. Aparte de estos dos grupos, puede haber otros que dupliquen parte o todos estos mismos datos en sus archivos propios. La redundancia resultante de almacenar los mismos datos varias veces conduce a serios problemas. En pri- mer lugar, las actualizaciones lógicas sencillas (como la introducción de los datos de un estudiante nuevo) hay que hacerlas varias veces: una por cada archivo donde se almacenen los datos de los estudiantes. Esto lleva a una duplicación del esfuerzo. En segundo lugar, se derrocha espacio de almacenamiento al guardar repetida- mente los mismos datos, y este problema puede llegar a ser muy serio en las bases de datos más grandes. En tercer lugar, los archivos que representan los mismos datos pueden acabar siendo incoherentes, lo que puede ocurrir cuando una determinada actualización se aplica a unos archivos y a otros no. Incluso si una actualiza- ción (por ejemplo, la adición de un estudiante nuevo) se aplica a todos los archivos adecuados, los datos rela- cionados con ese estudiante pueden ser incoherentes porque las actualizaciones han sido aplicadas por los distintos grupos de usuarios. Por ejemplo, un grupo de usuarios puede introducir erróneamente la fecha de nacimiento del estudiante (‘19-ENE-1988’), mientras que otro grupo la introduce correctamente (‘29-ENE- 1988’). En la metodología de bases de datos, las vistas de los diferentes grupos de usuarios se integran durante el dise- ño de la base de datos. Idealmente, debemos tener un diseño que almacene cada elemento de datos lógico (como el nombre o la fecha de nacimiento del estudiante) sólo en un lugar de la base de datos. Este hecho garantiza la coherencia y ahorra espacio de almacenamiento. Sin embargo, en la práctica, a veces es necesa- rio recurrir a una redundancia controlada para mejorar el rendimiento de las consultas. Por ejemplo, pode- mos almacenar NombreEstudiante y NumCurso de forma redundante en un archivo INFORME_CALIF (véase la Figura 1.6[a]) porque siempre que recuperemos un registro de este último, queremos recuperar el nombre del estudiante y el número del curso, junto con la calificación, el número de estudiante y el identificador de la sección. Al colocar todos los datos juntos, no tenemos que buscar en varios archivos para recopilarlos. En estos casos, el DBMS debe tener la capacidad de controlar esta redundancia para evitar las incoherencias entre Figura 1.6. Almacenamiento redundante de NombreEstudiante y NumCurso en INFORME_CALIF. (a) Datos coherentes. (b) Registro incoherente. (a) INFORME_CALIF NumEstudiante NombreEstudiante IDSeccion NumCurso Nota 17 Luis 112 MAT2410 B 17 Luis 119 CC1310 C 8 Carlos 85 MAT2410 A 8 Carlos 92 CC1310 A 8 Carlos 102 CC3320 B 8 Carlos 135 CC3380 A (b) INFORME_CALIF NumEstudiante NombreEstudiante IDSeccion NumCurso Nota 17 Carlos 112 MAT2410 B CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 17 1.6 Ventajas de utilizar una metodología DBMS 17 archivos. Esto se puede hacer automáticamente comprobando que los valores NombreEstudiante- NumEstudiante de cualquier registro de INFORME_CALIF de la Figura 1.6(a) coincide con alguno de los valo- res Nombre-NumEstudiante del registro ESTUDIANTE (véase la Figura 1.2). De forma parecida, los valores IDSeccion-NumCurso de INFORME_CALIF pueden compararse con los registros de SECCIÓN. Estas compro- baciones pueden especificarse en el DBMS durante el diseño de la base de datos y que el DBMS las ejecute automáticamente siempre que se actualice el archivo INFORME_CALIF. La Figura 1.6(b) muestra un registro de INFORME_CALIF que es incoherente con el archivo ESTUDIANTE de la Figura 1.2, que puede introducir- se incorrectamente de no controlarse la redundancia. 1.6.2 Restricción del acceso no autorizado Cuando varios usuarios comparten una base de datos grande, es probable que la mayoría de los mismos no tengan autorización para acceder a toda la información de la base de datos. Por ejemplo, los datos financieros se consideran a menudo confidenciales, y sólo las personas autorizadas pueden acceder a ellos. Además, algu- nos usuarios sólo pueden recuperar datos, mientras que otros pueden recuperarlos y actualizarlos. Así pues, también hay que controlar el tipo de operación de acceso (recuperación o actualización). Normalmente, los usuarios o grupos de usuarios tienen números de cuenta protegidos mediante contraseñas, que pueden utilizar para tener acceso a la base de datos. Un DBMS debe proporcionar seguridad y un subsistema de autoriza- ción, que el DBA utiliza para crear cuentas y especificar las restricciones de las mismas. Después, el DBMS debe implementar automáticamente esas restricciones. Podemos aplicar controles parecidos al software DBMS. Por ejemplo, sólo el personal del DBA puede utilizar cierto software privilegiado, como el que per- mite crear cuentas nuevas. De forma parecida, los usuarios paramétricos pueden acceder a la base de datos sólo a través de transacciones enlatadas desarrolladas para su uso. 1.6.3 Almacenamiento persistente para los objetos del programa Las bases de datos se pueden utilizar para proporcionar almacenamiento persistente a los objetos de progra- ma y las estructuras de datos. Es una de las principales razones de los sistemas de bases de datos orienta- dos a objetos. Normalmente, los lenguajes de programación tienen estructuras de datos complejas, como tipos de registro en Pascal o definiciones de clase en C++ o Java. Los valores de las variables de un programa se descartan una vez que termina ese programa, a menos que el programador los almacene explícitamente en archivos permanentes, lo que a menudo implica convertir esas estructuras complejas en un formato adecuado para el almacenamiento del archivo. Cuando surge la necesidad de leer estos datos una vez más, el programa- dor debe convertir el formato del archivo a la estructura variable del programa. Los sistemas de bases de datos orientados a objetos son compatibles con lenguajes de programación como C++ y Java, y el software DBMS realiza automáticamente las conversiones necesarias. Por tanto, un objeto complejo de C++ se puede almace- nar de forma permanente en un DBMS orientado a objetos. Se dice que dicho objeto es persistente, porque sobrevive a la terminación de la ejecución del programa y otro programa C++ lo puede recuperar más tarde. El almacenamiento persistente de objetos de programas y estructuras de datos es una función importante de los sistemas de bases de datos. Los sistemas de bases de datos tradicionales a menudo adolecían de lo que se denominó problema de incompatibilidad de impedancia, puesto que las estructuras de datos proporciona- das por el DBMS eran incompatibles con las estructuras de datos del lenguaje de programación. Los sistemas de bases de datos orientados a objetos normalmente ofrecen la compatibilidad de la estructura de datos con uno o más lenguajes de programación orientados a objetos. 1.6.4 Suministro de estructuras de almacenamiento para un procesamiento eficaz de las consultas Los sistemas de bases de datos deben proporcionar capacidades para ejecutar eficazmente consultas y actua- lizaciones. Como la base de datos normalmente se almacena en el disco, el DBMS debe proporcionar estruc- CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 18 18 Capítulo 1 Bases de datos y usuarios de bases de datos turas de datos especializadas para acelerar la búsqueda en el disco de los registros deseados. Con este fin se utilizan unos archivos auxiliares denominados índices, que están basados casi siempre en el árbol de estruc- turas de datos o en las estructuras de datos dispersas, convenientemente modificados para la búsqueda en disco. A fin de procesar los registros necesarios de la base de datos para una consulta en particular, estos regis- tros deben copiarse del disco a la memoria. Por consiguiente, el DBMS a menudo tiene un módulo de búfer que mantiene partes de la base de datos en los búferes de la memoria principal. En otros casos, el DBMS puede utilizar el sistema operativo para realizar el volcado de los datos del disco en el búfer. El módulo de procesamiento y optimización de consultas del DBMS es el responsable de elegir un plan eficaz de ejecución de consultas para cada consulta basándose en las estructuras de almacenamiento existen- tes. La elección de qué índices crear y mantener es parte del diseño y refinamiento de la base de datos física, que es una de las responsabilidades del personal del DBA. En los Capítulos 15 y 16 explicaremos en profun- didad el procesamiento, la optimización y el refinamiento de las consultas. 1.6.5 Copia de seguridad y recuperación Un DBMS debe ofrecer la posibilidad de recuperarse ante fallos del hardware o del software. El subsistema de copia de seguridad y recuperación del DBMS es el responsable de la recuperación. Por ejemplo, si el computador falla en medio de una transacción compleja de actualización, el subsistema de recuperación es responsable de garantizar la restauración de la base de datos al estado anterior a que comenzase la ejecución de la transacción. Como alternativa, el subsistema de recuperación podría asegurarse de retomar la transac- ción en el punto en que se interrumpió para que todo su efecto se grabe en la base de datos. 1.6.6 Suministro de varias interfaces de usuario Como una base de datos la utilizan muchos tipos de usuarios con distintos niveles de conocimiento técnico, un DBMS debe proporcionar distintas interfaces de usuario, entre las que podemos citar los lenguajes de con- sulta para los usuarios casuales, las interfaces de lenguaje de programación para los programadores de apli- caciones, formularios y códigos de comando para los usuarios paramétricos, e interfaces por menús y en el idioma nativo para los usuarios independientes. Tanto las interfaces al estilo de los formularios como las basa- das en menús se conocen normalmente como interfaces gráficas de usuario (GUI, graphical user interfa- ces). Existen muchos entornos y lenguajes especializados para especificar las GUIs. También son muy comu- nes las capacidades de proporcionar interfaces GUI web a una base de datos. 1.6.7 Representación de relaciones complejas entre los datos Una base de datos puede incluir numerosas variedades de datos que se interrelacionan entre sí de muchas for- mas. Considerando el ejemplo de la Figura 1.2, el registro de ‘Carlos’ del archivo ESTUDIANTE está relacio- nado con cuatro registros del archivo INFORME_CALIF. Del mismo modo, cada registro de sección está rela- cionado con un registro de curso y con varios registros de INFORME_CALIF (uno por cada estudiante que haya completado esa sección). Un DBMS debe tener la capacidad de representar las relaciones complejas entre los datos, definir las nuevas relaciones que surgen, y recuperar y actualizar fácil y eficazmente los datos relacionados. 1.6.8 Implementación de las restricciones de integridad La mayoría de las aplicaciones de bases de datos tienen ciertas restricciones de integridad que deben man- tenerse para los datos. Un DBMS debe proporcionar servicios para definir e implementar esas restricciones. El tipo de restricción de integridad más simple consiste en especificar un tipo de datos por cada elemento de datos. Por ejemplo, en la Figura 1.3 especificamos que el valor del elemento de datos Clase dentro de cada CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 19 1.6 Ventajas de utilizar una metodología DBMS 19 registro ESTUDIANTE debe ser un dígito entero, y que el valor de Nombre debe ser una cadena de no más de 30 caracteres alfanuméricos. Para restringir el valor de Clase entre 1 y 5 debe haber una restricción adicional que no se muestra en el catálogo actual. Un tipo de restricción más compleja que se da a menudo implica especificar que un registro de un archivo debe estar relacionado con registros de otros archivos. Por ejemplo, en la Figura 1.2 podemos especificar que cada registro de sección debe estar relacionado con un registro de curso. Otro tipo de restricción especifica la unicidad en los valores del elemento de datos, como que cada registro de curso debe tener un único valor para NumCurso. Estas restricciones se derivan del sig- nificado o la semántica de los datos y del minimundo que representan. Los diseñadores tienen la responsabi- lidad de identificar las restricciones de integridad durante el diseño de la base de datos. Algunas restricciones pueden especificarse en el DBMS e implementarse automáticamente. Otras restricciones pueden tener que ser comprobadas por los programas de actualización o en el momento de introducir los datos. En las aplicaciones grandes es costumbre denominar estas restricciones como reglas de negocio. Aun cuando se introduce erróneamente un elemento de datos, éste puede satisfacer las restricciones de inte- gridad especificadas. Por ejemplo, si un estudiante recibe una calificación de ‘A’ pero se introduce una califi- cación de ‘C’ en la base de datos, el DBMS no puede descubrir automáticamente este error porque ‘C’ es un valor correcto para el tipo de datos Nota. Estos errores en la introducción de los datos sólo se pueden descu- brir manualmente (cuando el estudiante recibe la calificación y reclama) y corregirse más tarde mediante la actualización de la base de datos. No obstante, una calificación de ‘Z’ debería rechazarla automáticamente el DBMS, porque no se trata de un valor correcto para el tipo de datos Nota. Cuando expliquemos cada mode- lo de datos en los siguientes capítulos, introduciremos reglas que pertenecen implícitamente a ese modelo. Por ejemplo, en el modelo Entidad-Relación del Capítulo 3, una relación debe implicar como mínimo a dos enti- dades. Estas reglas son reglas inherentes del modelo de datos y se asumen automáticamente para garantizar la validez del modelo. 1.6.9 Inferencia y acciones usando reglas Algunos sistemas de bases de datos ofrecen la posibilidad de definir reglas de deducción para inferir infor- mación nueva a partir de los hechos guardados en la base de datos. Estos sistemas se denominan sistemas de bases de datos deductivos. Por ejemplo, puede haber reglas complejas en la aplicación del minimundo para determinar si un estudiante está a prueba. Éstas se pueden especificar declarativamente como reglas, de modo que cuando el DBMS las compila y mantiene pueden determinar todos los estudiantes que están en periodo de prueba. En un DBMS tradicional habría que escribir un código de programa procedimental explícito para soportar dichas aplicaciones. Pero si cambian las reglas del minimundo, generalmente es mejor cambiar las reglas de deducción declaradas que volver a codificar los programas procedurales. En los sistemas de bases de datos relacionales actuales es posible asociar triggers a las tablas. Un trigger es una forma de regla que se activa con las actualizaciones de la tabla, lo que conlleva la ejecución de algunas operaciones adicionales sobre otras tablas, el envío de mensajes, etcétera. Los procedimientos más implicados en la implementación de reglas se conocen popularmente como procedimientos almacenados; se convierten en parte de la defini- ción global de la base de datos y se les invoca correctamente cuando se dan ciertas condiciones. Los sistemas de bases de datos activos ofrecen la funcionalidad más potente; estos sistemas proporcionan reglas activas que pueden iniciar automáticamente acciones cuando ocurren ciertos eventos y condiciones. 1.6.10 Implicaciones adicionales de utilizar la metodología de bases de datos Esta sección explica algunas implicaciones adicionales de usar la metodología de bases de datos que pueden beneficiar a la mayoría de las empresas. Potencial para implementar estándares. La metodología de bases de datos permite al DBA definir e implementar estándares entre los usuarios de la base de datos en una empresa grande. Esto facilita la comu- CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 20 20 Capítulo 1 Bases de datos y usuarios de bases de datos nicación y la cooperación entre varios departamentos, proyectos y usuarios dentro de la empresa. Los están- dares se pueden definir para los nombres y los formatos de los elementos de datos, los formatos de visualiza- ción, las estructuras de los informes, la terminología, etcétera. El DBA puede implementar los estándares en un entorno de base de datos centralizado más fácilmente que en un entorno donde cada grupo de usuarios tiene el control de sus propios archivos y software. Tiempo de desarrollo de aplicación reducido. Uno de los principales reclamos de venta de la meto- dología de bases de datos es que se necesita muy poco tiempo para desarrollar una aplicación nueva (como la recuperación de ciertos datos de la base de datos para imprimir un informe nuevo). El diseño y la implemen- tación de una base de datos nueva desde el principio puede llevar más tiempo que escribir una aplicación de archivos especializada. No obstante, una vez que la base de datos está operativa y en ejecución, por lo gene- ral se necesita mucho menos tiempo para crear aplicaciones nuevas utilizando los servicios del DBMS. Se estima que el tiempo de desarrollo utilizando un DBMS es de una sexta a una cuarta parte del necesario para un sistema de archivos tradicional. Flexibilidad. Puede ser necesario cambiar la estructura de una base de datos a medida que cambian los requi- sitos. Por ejemplo, puede surgir un nuevo grupo de usuarios que necesita información que actualmente no hay en la base de datos. En respuesta, puede que sea necesario añadir un archivo a la base de datos o extender los elementos de datos de un archivo existente. Los DBMS modernos permiten ciertos tipos de cambios evoluti- vos en la estructura de la base de datos sin que ello afecte a los datos almacenados y a los programas de apli- cación existentes. Disponibilidad de la información actualizada. Un DBMS hace que la base de datos esté disponible para todos los usuarios. Tan pronto como se aplica la actualización de un usuario a la base de datos, todos los demás usuarios pueden ver esa actualización inmediatamente. Esta disponibilidad de información actualizada es esencial para muchas de las aplicaciones de procesamiento de transacciones, como las bases de datos de los sistemas de reservas o bancarios, y esto es posible a los subsistemas de control de la concurrencia y de recuperación de un DBMS. Economías de escala. La metodología DBMS permite la consolidación de los datos y las aplicaciones, lo que reduce el derroche de superposición entre las actividades del personal de procesamiento de datos en dife- rentes proyectos o departamentos, así como las redundancias entre las aplicaciones. Esto permite que toda la organización invierta en procesadores más potentes, dispositivos de almacenamiento o aparatos de comunica- ción, en lugar de que cada departamento compre sus propios equipos (menos potentes). De este modo se redu- cen los costes globales de funcionamiento y administración. 1.7 Breve historia de las aplicaciones de bases de datos Esta sección ofrece una breve historia de las aplicaciones que utilizan DBMSs y cómo estas aplicaciones supusieron el impulso de nuevos tipos de sistemas de bases de datos. 1.7.1 Las primeras aplicaciones de bases de datos que utilizaron sistemas jerárquicos y de red Muchas de las primeras aplicaciones de bases de datos almacenaban registros en grandes organizaciones, como corporaciones, universidades, hospitales y bancos. En muchas de esas aplicaciones había muchos regis- tros de estructura parecida. Por ejemplo, en una aplicación para universidades, era preciso mantener informa- ción parecida por cada estudiante, cada curso y cada especialidad, etcétera. También había muchos tipos de registros y muchas interrelaciones entre ellos. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 21 1.7 Breve historia de las aplicaciones de bases de datos 21 Uno de los principales problemas con los primeros sistemas de bases de datos era la mezcla de relaciones con- ceptuales con el almacenamiento físico y la ubicación de los registros en el disco. Por ejemplo, los registros de especialidad de un estudiante en particular podían guardarse físicamente a continuación del registro del estudiante. Aunque esto ofrecía un acceso muy eficaz para las consultas y las transacciones originales para las que fue diseñada la base de datos, no proporcionaba suficiente flexibilidad para acceder eficazmente a los registros cuando se identificaban consultas y transacciones nuevas. En particular, era muy difícil implemen- tar con eficacia las consultas nuevas que requerían una organización diferente del almacenamiento para un procesamiento eficaz. También era muy laborioso reorganizar la base de datos cuando había cambios en los requisitos de la aplicación. Otro defecto de los primeros sistemas era que sólo proporcionaban interfaces de lenguaje de programación. La implementación de consultas y transacciones nuevas llevaba mucho tiempo y era costosa, pues había que escribir, probar y depurar programas nuevos. La mayoría de esos sistemas de bases de datos se implantaron en grandes y costosos computadores mainframe a mediados de la década de 1960, y a lo largo de las décadas de 1970 y 1980. Los principales tipos de esos sistemas estaban basados en tres paradigmas principales: siste- mas jerárquicos, sistemas basados en un modelo de red y sistemas de archivos inversos. 1.7.2 Flexibilidad de aplicación con las bases de datos relacionales Las bases de datos relacionales se propusieron originalmente para separar el almacenamiento físico de los datos de su representación conceptual, así como para proporcionar una base matemática para el almacena- miento de contenidos. El modelo de datos relacional también introdujo lenguajes de consulta de alto nivel que proporcionaban una alternativa a las interfaces de lenguaje de programación; por tanto, era mucho más rápi- do escribir consultas nuevas. La representación relacional de los datos se parece al ejemplo presentado en la Figura 1.2. Los sistemas relacionales estaban destinados inicialmente a las mismas aplicaciones que los pri- mitivos sistemas, pero estaban pensados para ofrecer flexibilidad en el desarrollo de nuevas consultas y para reorganizar la base de datos cuando cambiaran los requisitos. Los sistemas relacionales experimentales desarrollados a finales de la década de 1970 y los sistemas de admi- nistración de bases de datos relacionales (RDBMS) comerciales que aparecieron a principios de la década de 1980 eran muy lentos, pues no utilizaban punteros de almacenamiento físico o la ubicación del registro para acceder a los registros de datos relacionados. Su rendimiento mejoró con el desarrollo de nuevas técnicas de almacenamiento e indexación y unas técnicas mejores de procesamiento y optimización. Eventualmente, las bases de datos relacionales se convirtieron en el tipo de sistema de bases de datos predominante para las apli- caciones de bases de datos tradicionales. En casi todos los tipos de computadores, desde los pequeños com- putadores personales hasta los grandes servidores, existen bases de datos relacionales. 1.7.3 Aplicaciones orientadas a objetos y la necesidad de bases de datos más complejas El surgimiento de los lenguajes de programación orientados a objetos en la década de 1980 y la necesidad de almacenar y compartir objetos estructurados complejos induce al desarrollo de las bases de datos orientadas a objetos (OODB). Inicialmente, las OODB estaban consideradas como competidoras de las bases de datos relacionales, porque proporcionaban más estructuras de datos generales. También incorporaban muchos de los útiles paradigmas de la orientación a objetos, como los tipos de datos abstractos, la encapsulación de opera- ciones, la herencia y la identidad de objeto. No obstante, la complejidad del modelo y la carencia de un están- dar contribuyó a su limitado uso. Ahora se utilizan principalmente en las aplicaciones especializadas (por ejemplo, en ingeniería, publicación multimedia y sistemas de fabricación). A pesar de las expectativas de que iban a provocar un gran impacto, lo cierto es que su penetración global en el mercado de productos de bases de datos permanece aún hoy por debajo del 50%. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 22 22 Capítulo 1 Bases de datos y usuarios de bases de datos 1.7.4 Intercambio de datos en la Web para el comercio electrónico La World Wide Web proporciona una gran red de computadores interconectados. Los usuarios pueden crear documentos utilizando un lenguaje de publicación web, como HTML (Lenguaje de marcado de hipertexto, HyperText Markup Language), y almacenar esos documentos en servidores web desde los que otros usuarios (clientes) pueden acceder a ellos. Los documentos se pueden enlazar mediante hipervínculos, que son pun- teros a otros documentos. En la década de 1990 apareció el comercio electrónico (e-commerce) como una apli- cación trascendental en la Web. Cada vez iba siendo más evidente que parte de la información que aparecía en las páginas web de e-commerce a menudo eran datos que se extraían dinámicamente de unos DBMSs. Se desarrollaron varias técnicas que permitían el intercambio de datos en la Web. Actualmente, XML (Lenguaje de marcado extendido, eXtended Markup Language) está considerado como el principal estándar para el inter- cambio de datos entre varios tipos de bases de datos y páginas web. XML combina conceptos de los modelos utilizados en los sistemas de documentación con conceptos de modelado de bases de datos. El Capítulo 27 está dedicado a la explicación de XML. 1.7.5 Capacidades extendidas de las bases de datos para las nuevas aplicaciones El éxito de los sistemas de bases de datos en las aplicaciones tradicionales animó a los desarrolladores de otros tipos de aplicaciones a intentar utilizarlos. Dichas aplicaciones, de las que se ofrecen unos ejemplos a conti- nuación, utilizaban tradicionalmente sus propias estructuras de archivos y datos especializadas: Aplicaciones científicas. Almacenan grandes cantidades de datos resultado de los experimentos cien- tíficos en áreas como la física o el mapa del genoma humano. Almacenamiento y recuperación de imágenes, desde noticias escaneadas y fotografías personales, hasta imágenes de satélite o las procedentes de procedimientos médicos, como los rayos X o el MRI (procesamiento de imágenes de resonancia magnética). Almacenamiento y recuperación de vídeos, como películas, o videoclips, procedentes de noticias o cámaras digitales personales. Aplicaciones de minado de datos, que analizan grandes cantidades de datos buscando ocurrencias de patrones específicos o relaciones. Aplicaciones espaciales, que almacenan las ubicaciones espaciales de datos como la información meteorológica o los mapas que se utilizan en los sistemas de información geográfica. Aplicaciones de series cronológicas que almacenan información como datos económicos a intervalos regulares de tiempo (por ejemplo, gráficos de las ventas diarias o del producto nacional bruto men- sual). Es evidente que los sistemas relacionales básicos no eran muy adecuados para muchas de estas aplicaciones, normalmente por una o más de las siguientes razones: Se necesitaban estructuras de datos más complejas para modelar la aplicación que la simple represen- tación relacional. Se necesitaron nuevos tipos de datos, además de los tipos numérico y de cadena de caracteres básicos. Para manipular los nuevos tipos de datos eran necesarias operaciones y construcciones de lenguaje de consulta nuevas. Se necesitaban nuevas estructuras de almacenamiento e indexación. Esto llevó a que los desarrolladores de DBMS añadieran funcionalidad a sus sistemas. Parte de esa funciona- lidad era de propósito general, como la incorporación de conceptos de las bases de datos orientadas a objetos CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 23 1.8 Cuándo no usar un DBMS 23 en los sistemas relacionales. Otra parte de esa funcionalidad era de propósito especial, en forma de módulos opcionales que se podían utilizar para aplicaciones específicas. Por ejemplo, los usuarios podrían comprar un módulo de series cronológicas para utilizarlo con su DBMS relacional para su aplicación de series cronológi- cas. Actualmente, la mayoría de las organizaciones grandes utilizan distintos paquetes que funcionan en estrecha colaboración con bases de datos back-ends. Una base de datos back-end representa una o más bases de datos, seguramente de distintos fabricantes y diferentes modelos de datos, encaminado todo ello a almacenar los datos que esos paquetes manipulan para las transacciones, la generación de informes y dar respuesta a las con- sultas específicas. Uno de los sistemas que más se utiliza es ERP (Planificación de recursos empresariales, Enterprise Resource Planning), que se utiliza para consolidar diferentes áreas funcionales dentro de una organización, como, por ejemplo, la producción, las ventas, la distribución, el marketing, las finanzas, los recursos humanos, etcétera. Otro tipo muy conocido de sistema es el software CRM (Administración de las relaciones con el cliente, Customer Relationship Management), que abarca el procesamiento de pedidos y las funciones de marketing y soporte de clientes. Estas aplicaciones son compatibles con la Web para aque- llos usuarios internos y externos a los que se dota de diferentes interfaces de portal web para interactuar con la base de datos back-end. 1.7.6 Bases de datos frente a recuperación de información Tradicionalmente, la tecnología de bases de datos se aplica a los datos estructurados y formateados que se ori- ginan en las aplicaciones rutinarias gubernamentales, comerciales e industriales. Esta tecnología se utiliza mucho en la fabricación, las ventas, la banca, los seguros, las finanzas y la salud, donde los datos estructura- dos originan formularios como las facturas o los documentos de registro de pacientes. Ha habido un desarro- llo concurrente de un campo denominado recuperación de información (IR, information retrieval) que tiene que ver con los libros, los manuscritos y distintos formularios de artículos basados en bibliotecas. Los datos se indexan, catalogan y anotan utilizando palabras clave. IR tiene que ver con la búsqueda de material basa- da en esas palabras clave, y con muchos de los problemas relacionados con el procesamiento de documentos y el procesamiento de texto de forma libre. Se ha realizado una cantidad considerable de trabajo en buscar texto basándose en palabras clave, buscar documentos y clasificarlos por su relevancia, clasificar el texto auto- máticamente, clasificar el texto por temas, etcétera. Con la llegada de la Web y la proliferación de las páginas HTML ejecutándose por miles de millones, es necesario aplicar muchas de las técnicas de IR para procesar los datos en la Web. Los datos de las páginas web son normalmente imágenes, texto y objetos que se activan y modifican dinámicamente. La recuperación de información en la Web es un problema nuevo que requiere la aplicación de técnicas de bases de datos e IR en variedad de nuevas combinaciones. 1.8 Cuándo no usar un DBMS A pesar de las ventajas de usar un DBMS, hay algunas situaciones en las que su uso puede suponer unos sobre- costes innecesarios en los que no se incurriría con el procesamiento tradicional de archivos. Los sobrecostes de utilizar un DBMS se deben a lo siguiente: Inversión inicial muy alta en hardware, software y formación. La generalidad de que un DBMS ofrece definición y procesamiento de datos. Costes derivados de las funciones de seguridad, control de la concurrencia, recuperación e integridad. Es posible que surjan otros problemas si los diseñadores y el DBA no diseñan correctamente la base de datos o si las aplicaciones de sistemas de bases de datos no se implantan correctamente. Por tanto, puede ser más deseable utilizar archivos normales en las siguientes circunstancias: Aplicaciones de bases de datos sencillas y bien definidas que no es previsible que cambien. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 24 24 Capítulo 1 Bases de datos y usuarios de bases de datos Requisitos estrictos y en tiempo real para algunos programas que no podrían satisfacerse debido al sobrecoste de un DBMS. Inexistencia del acceso multiusuario a los datos. Algunas industrias y aplicaciones prefieren no utilizar DBMSs de propósito general. Por ejemplo, muchas de las herramientas de diseño asistido por computador (CAD) que los ingenieros mecánicos y civiles utilizan, tienen archivos propietarios y software de administración de datos destinados a las manipulaciones internas de dibujos y objetos 3D. De forma parecida, los sistemas de comunicación y conmutación diseñados por empresas como AT&T eran manifestaciones precoces de software de bases de datos que se desarrolló para eje- cutarse muy rápidamente con datos organizados jerárquicamente, al objeto de obtener un acceso rápido y el enrutamiento de llamadas. Asimismo, las implementaciones GIS a menudo implantaban sus propios esque- mas de organización de datos para implementar eficazmente funciones relacionadas con el procesamiento de mapas, los contornos físicos, las líneas, los polígonos, etcétera. Los DBMSs de propósito general no son ade- cuados para su propósito. 1.9 Resumen En este capítulo hemos definido una base de datos como una colección de datos relacionados, donde los datos son hechos grabados. Una base de datos típica representa algún aspecto del mundo real y es utilizada por uno o más grupos de usuarios con fines específicos. Un DBMS es un paquete de software generalizado destinado a implementar y mantener una base de datos computerizada. La base de datos y el software juntos forman un sistema de bases de datos. Hemos identificado algunas características que distinguen la metodología de bases de datos de las aplicaciones tradicionales de procesamiento de archivos, y hemos explicado las principales categorías de usuarios de las bases de datos, o actores de la escena. Además de los usuarios de las bases de datos, el personal de soporte, o trabajadores entre bambalinas, se pueden clasificar en varias categorías. El capítulo también ofrece una lista de las capacidades que un software de DBMS debe ofrecer al DBA, los diseñadores y los usuarios para que les ayude en el diseño, la administración y el uso de una base de datos. Después, se ha ofrecido una perspectiva histórica de la evolución de las aplicaciones de bases de datos. Hemos apuntado al matrimonio de la tecnología de bases de datos con la tecnología de recuperación de información, que jugará un papel muy importante debido a la popularidad de la Web. Por último, hemos hablado de los sobrecostes de utilizar un DBMS y de algunas situaciones en las que no es ventajoso utilizar uno. Preguntas de repaso 1.1. Defina los siguientes términos: datos, base de datos, DBMS, sistema de bases de datos, catálogo de la base de datos, independencia programa-datos, vista de usuario, DBA, usuario final, transacción enlatada, sistema de bases de datos deductivo, objeto persistente, metadatos y aplicación de proce- samiento de transacciones. 1.2. ¿Qué cuatro tipos de acciones implican bases de datos? Explique brevemente cada uno de ellos. 1.3. Explique las principales características de la metodología de bases de datos y cómo difiere de los sistemas de archivos tradicionales. 1.4. ¿Cuáles son las responsabilidades del DBA y de los diseñadores de bases de datos? 1.5. ¿Cuáles son los diferentes tipos de bases de datos y usuarios? Explique las actividades principales de cada uno. 1.6. Explique las capacidades que un DBMS debe proporcionar. 1.7. Explique las diferencias entre los sistemas de bases de datos y los sistemas de recuperación de información. CAP01_ELMASRI.qxd 09/04/2007 16:51 PÆgina 25 Bibliografía seleccionada 25 Ejercicios 1.8. Identifique algunas operaciones de actualización y consultas informales que esperaría aplicar a la base de datos de la Figura 1.2. 1.9. ¿Cuál es la diferencia entre la redundancia controlada y la descontrolada? Ilustre su explicación con ejemplos. 1.10. Denomine todas las relaciones entre los registros de la base de datos de la Figura