Base de Datos  Profesor: MSC. Luis Serna Jherry
Contenido del Curso de  Base de Datos Conceptos Básicos Definiciones Análisis de Datos  Técnicas de Modelamiento Implementación  Bases de Datos Relacionales Explotación Lenguaje SQL Otros Temas: DBMS BD Distribuidas BD orientadas a Objetos
Base de Datos … Es un conjunto de datos “persistentes” utilizado por los sistemas de aplicaciones de empresas y organizaciones. … Es una colección de datos interrelacionados creados con un DBMS. … Es un conjunto autodescriptivo de datos integrados. Tiene un diccionario de datos. ...Sirve para poder almacenar datos que luego pueden ser recuperados al hacer una consulta y convertirse en “información”. Definiciones Previas
Ejemplos Base de Datos de Ciudadanos Peruanos Base de Datos de estudiantes de la Universidad Base de Datos de una Biblioteca Diccionario Base de Datos de un supermercado
Por qué utilizar una Base de Datos ??? Para no tener datos duplicados Para tener facilidad de acceso y eficiencia en las operaciones. Para tener datos relacionados de una forma que pueden ser buscados y obtener cualquier tipo de información sobre ellos. Para poder tener compatibilidad en el uso de diferentes programas.
Jerarquía de los elementos de datos - En el procesamiento de archivos: En el procesamiento de BD: Bits Bytes o caracteres Campos Registros Archivos + Metadatos + Indices + Metadatos de aplicación Bits Bytes o caracteres Campos Registros Archivos
Definiciones Previas Metadatos Descripción de la estructura de la BD Se almacena en tablas ( tablas del sistema ) Indices Mejoran el acceso a los datos almacenados Empleado para clasificación y recuperación de datos
Tabla del Sistema de Tablas Tabla de las Columnas del Sistema Nombre de la tabla Número de columnas Llave Primaria Alumno 4 #Alumno Profesor 3 #Profesor Curso 3 Cod_Curso Registro 3 {#Alumno, Cod_Curso} Nombre de Columna Nombre de Tabla Tipo de dato Longitud #Alumno Alumno Entero 4 Al_Apellido Alumno Texto 20 -------- ----------- ------- -- #Profesor Profesor Entero 4 Pr_Apellido Profesor Texto 20 -------- ----------- ------- -- -------- ----------- ------- --
Tabla Alumnos #Alumno Al_Apellido Al_Nombre Especialidad 100 Pérez Juan Sistemas de Información 200 López María Sistemas de Información 300 Sánchez Elena Ing. De Software 400 Pérez Andrés Ing. De Software 500 Valdivia Carlos Sistemas de Información 600 Zumaeta José Ing. De Software 700 Montes Fernando Sistemas de Información
Indice por Apellido Indice por Especialidad Al_Apellido #Alumno López 200 Montes 700 Pérez 100, 400 Sánchez 300 Valdivia 500 Zumaeta 600 Especialidad #Alumno Sistemas de Información 100, 200, 500, 700 Ing. De Software 300, 400, 600
Definiciones Previas Metadatos de Aplicación Estructura y formato de los formularios, informes, consultas y demás componentes de la aplicación.
Definiciones Previas REGISTRO LOGICO Representa la percepción del usuario o programador de lo que es un registro de datos. NRO O/C PROVEEDOR FECHA COMPRADOR TOTAL 01-002560 01-002561 LAU CHUN S.A. TAI LOY  S.A. 16-08-99 16-08-99 99-999999 XXXXXXXXXXXXXXX dd-mm-aa Federico López Alejandra Ruiz XXXXXXXXXXXX S/. 450.50 S/. 840.50 S/.  0.00
Definiciones Previas REG.2 REG.1 REG.3 REGISTRO FISICO Puede consistir de varios registros lógicos ,  además de un control del sistema donde guarda información sobre el almacenamiento para facilitar la búsqueda.  Es una unidad de transferencia de datos entre el dispositivo de almacenamiento y la memoria principal.
Definiciones Previas Esquema Es la descripción lógica de la Base de datos.  Es un diagrama general de todos los campos de datos y de los registros almacenados.  Proporciona los nombres de los archivos (entidades y sus atributos) y especifica las relaciones entre ellos.
Definiciones Previas Subesquema Es la visión que tienen el usuario y el programador de aplicaciones de los datos que utilizan.  Es sinónimo de área o vista. Del mismo  esquema  se pueden derivar muchos  subesquemas.
Modelo de Datos Es una colección de herramientas conceptuales para describir los datos, las relaciones entre ellos, la semántica y las ligaduras de consistencia o restricciones . Proporciona capacidades estructurales muy flexibles y permite que las ligaduras de datos sean especificadas explícitamente.
Modelo de Datos Modelo Entidad-Relación (E-R),  basado en una percepción del mundo real que consta de una colección de objetos llamados  entidades,  y de relaciones entre éstas. Modelo orientado a objetos,  que incluye muchos conceptos del modelo E-R, pero representa tanto datos como lógica inherente a ellos (operaciones).
Modelos de Datos  Entidad Algo que puede ser de interés para una organización acerca de lo cual recopila y almacena información. Cada ocurrencia de la entidad se denomina  Instancia Atributo Cada uno de los datos que describen una entidad. Se almacenan físicamente en campos o elementos de datos
Modelos de Datos  Relación (asociación, interrelación o vínculo) Es una conexión o asociación entre instancias de entidades Las instancias asociadas pueden pertenecer a la misma entidad o a otra. Las relaciones en un modelo tienen una multiplicidad (cardinalidad) y se les asigna un nombre que las describe.
Comparación de terminologías Mainframes AS/400 Librería Archivo Físico Registro Campo Valor de campo Modelo de Datos Modelo  de BD Entidad Tupla Atributo Dominio o Valores de atributo Archivos DBF Directorio Archivo  .DBF Registro Campo Valor de campo. Base de Datos (DBMS) Base de Datos Tabla Fila Columna Valores, Reglas, Defaults
Ventajas del enfoque de BD. Disminuye la redundancia de datos Pr eserva la independencia de los datos respecto de las aplicaciones. Permite compartir datos , controlando los accesos concurrentes. Facilita el establecimiento de  estándares. Permite definir restricciones de seguridad. Posibilita la integridad de los datos.
Independencia de Datos Independencia Lógica Es la capacidad de modificar  la estructura lógica  sin que por ello tengan que reescribirse los programas. Independencia Física Es la capacidad de modificar la distribución y la organización física de los datos sin afectar la estructura lógica general ni los programas de aplicación.
Es básicamente un a colección de archivos interrelacionados y un conjunto de programas para crear,  almacenar  y modificar estos archivos . Su  propósito es resguardar la información de dichos archivos y hacer que esté disponible cuando se la solicite. Proporcionan un entorno práctico y eficiente para la recuperación y el almacenamiento de los datos. El Sistema de Administración de BD (DBMS ó SGBD)
El Sistema de Administración de BD  (DBMS ó SGBD) Funciones: Crear, organizar y manipular la Base de Datos (DML y DDL) Mantener Sub Sistemas de Seguridad, Integridad, Control de concurrencia y Recuperación. Registrar las estadísticas de uso. Administrar el diccionario de datos. Optimizar el desempeño.
Seguridad, Integridad y Recuperación Seguridad   implica asegurar que los usuarios están autorizados para llevar a cabo las tareas que tratan de ejecutar Integridad   implica asegurar que lo que tratan de hacer los usuarios es correcto. Recuperación   implica asegurar la base de datos contra daños en el sistema o en el hardware.
El Sistema de Administración de BD (DBMS) Peticiones de  usuario DBMS Sistema Operativo BD Física El DBMS sirve de interfase entre las peticiones de usuario y los datos almacenados
Arquitectura de una aplicación con  DBMS Nivel Externo (vistas individuales de los usuarios) Nivel Lógico (qué datos se almacenan y cómo se relacionan) Nivel Físico (vista del almacenamiento)
Componentes Funcionales de un DBMS ALMACENAMIENTO  EN DISCO Gestor de  Almace-namiento Procesador  de  Consultas Interfases de  Aplicaciones Programas de  Aplicación Consultas D B M S Esquema de  Base de Datos Usuarios Usuarios  finales Programadores Usuarios  sofisticados Administrador  de Base de Datos Archivos de datos diccionario de datos Código objeto  de los  programas  de aplicación Motor de  evaluación de consultas precompilador  del DML incorporado compilador  del DML incorporado intérprete  del DDL Gestor de  transacciones Gestor de  memoria intermedia Gestor de  archivos Indices Datos estadísticos Fuente: “Fundamentos de Bases de Datos” – A. Silberschatz
El Administrador de la BD (DBA) Funciones Definir el modelo de datos o esquema conceptual. Comunicación con los usuarios. Definir el esquema interno. Definir las verificaciones de seguridad e integridad. Definir procedimientos de respaldo y recuperación. Supervisar el desempeño y responder a cambios en los requerimientos.
Esquemas Físicos de Bases de Datos Son las arquitecturas lógico-físicas con las que se implementan las Bases de Datos. Jerárquicas Redes Relacional
Bases de Datos Jerárquicas Los Archivos que componen la base de datos están organizados en niveles ordenados por jerarquías. Las relaciones entre los datos se representan mediante  enlaces , que se pueden ver como punteros físicos Un archivo padre puede tener muchos hijos o ramificaciones. Un archivo hijo no puede tener mas que un padre.
Base de Datos de Redes Los Archivos que componen la base de datos están organizados en base a una estructura de red. Las relaciones entre los datos se representan mediante  enlaces , que se pueden ver como punteros Se habla de archivos propietarios y archivos miembros. Un archivo miembro puede tener  mas de un archivo propietario
Base de Datos Relacional Los archivos se denominan tablas o Relaciones La representación de las tablas es la de una matriz bidimensional. Las filas se denominan tuplas y representan los registros de información. Las columnas representan a los atributos.  El rango de valores posibles del atributo se denomina dominio. Las relaciones entre las tablas se establecen mediante los valores de atributos comunes (en lugar de hacerlo mediante punteros)
Breve Historia de las Bases de Datos Hasta 1970 aprox. Uso de tarjetas perforadas y de cintas perforadas. /\/\/\/\/| | . | | . | | o o .ooo| W  | oo o. o| i  | oo o. oo|k  | oo o. o| i  | ooo . | p  | oo .o o| e  | oo .o | d  | oo o. o| i  | oo . o| a  | o.o o| Retorno de carro (CR)  | o. o | Avance de línea (LF) | . |  ||/\/\/\/\/  [Fuente http://es.wikipedia.org/wiki/Cinta_perforada]
Breve Historia de las Bases de Datos 2.  Finales del 1960. El modelo Jerárquico tiene acogida  y también CODASYL " Conference on Data Systems Languages " genera COBOL y modelo de redes.  3. Codd propone en 1970 su modelo Relacional para hacer independiente el modelo de datos de los programas. Define su teoría en términos de lógica predicativa y de teoría de conjuntos. Oracle y DB2 recién aparecen en 1980. 4. Por 1980 se comienza a investigar las bases de datos distribuidas. 5. Por los 1990 se enfocan en bases de datos orientadas a objetos.  6. Hacia finales de los 90 se crean modelos orientados a dimensiones para datawarehouses (OLAP). [Fuente http://en.wikipedia.org/wiki/Databases
Evolución Histórica Archivos secuenciales BD jerárquicas BD de redes Archivos con acceso directo 1960 Publicaciones del modelo relacional de Codd 1970 BD relacionales.   1980 Plataforma C/S 1990 Sistemas de BDOO 2000

Clase 1 conceptos basicos ac

  • 1.
    Base de Datos Profesor: MSC. Luis Serna Jherry
  • 2.
    Contenido del Cursode Base de Datos Conceptos Básicos Definiciones Análisis de Datos Técnicas de Modelamiento Implementación Bases de Datos Relacionales Explotación Lenguaje SQL Otros Temas: DBMS BD Distribuidas BD orientadas a Objetos
  • 3.
    Base de Datos… Es un conjunto de datos “persistentes” utilizado por los sistemas de aplicaciones de empresas y organizaciones. … Es una colección de datos interrelacionados creados con un DBMS. … Es un conjunto autodescriptivo de datos integrados. Tiene un diccionario de datos. ...Sirve para poder almacenar datos que luego pueden ser recuperados al hacer una consulta y convertirse en “información”. Definiciones Previas
  • 4.
    Ejemplos Base deDatos de Ciudadanos Peruanos Base de Datos de estudiantes de la Universidad Base de Datos de una Biblioteca Diccionario Base de Datos de un supermercado
  • 5.
    Por qué utilizaruna Base de Datos ??? Para no tener datos duplicados Para tener facilidad de acceso y eficiencia en las operaciones. Para tener datos relacionados de una forma que pueden ser buscados y obtener cualquier tipo de información sobre ellos. Para poder tener compatibilidad en el uso de diferentes programas.
  • 6.
    Jerarquía de loselementos de datos - En el procesamiento de archivos: En el procesamiento de BD: Bits Bytes o caracteres Campos Registros Archivos + Metadatos + Indices + Metadatos de aplicación Bits Bytes o caracteres Campos Registros Archivos
  • 7.
    Definiciones Previas MetadatosDescripción de la estructura de la BD Se almacena en tablas ( tablas del sistema ) Indices Mejoran el acceso a los datos almacenados Empleado para clasificación y recuperación de datos
  • 8.
    Tabla del Sistemade Tablas Tabla de las Columnas del Sistema Nombre de la tabla Número de columnas Llave Primaria Alumno 4 #Alumno Profesor 3 #Profesor Curso 3 Cod_Curso Registro 3 {#Alumno, Cod_Curso} Nombre de Columna Nombre de Tabla Tipo de dato Longitud #Alumno Alumno Entero 4 Al_Apellido Alumno Texto 20 -------- ----------- ------- -- #Profesor Profesor Entero 4 Pr_Apellido Profesor Texto 20 -------- ----------- ------- -- -------- ----------- ------- --
  • 9.
    Tabla Alumnos #AlumnoAl_Apellido Al_Nombre Especialidad 100 Pérez Juan Sistemas de Información 200 López María Sistemas de Información 300 Sánchez Elena Ing. De Software 400 Pérez Andrés Ing. De Software 500 Valdivia Carlos Sistemas de Información 600 Zumaeta José Ing. De Software 700 Montes Fernando Sistemas de Información
  • 10.
    Indice por ApellidoIndice por Especialidad Al_Apellido #Alumno López 200 Montes 700 Pérez 100, 400 Sánchez 300 Valdivia 500 Zumaeta 600 Especialidad #Alumno Sistemas de Información 100, 200, 500, 700 Ing. De Software 300, 400, 600
  • 11.
    Definiciones Previas Metadatosde Aplicación Estructura y formato de los formularios, informes, consultas y demás componentes de la aplicación.
  • 12.
    Definiciones Previas REGISTROLOGICO Representa la percepción del usuario o programador de lo que es un registro de datos. NRO O/C PROVEEDOR FECHA COMPRADOR TOTAL 01-002560 01-002561 LAU CHUN S.A. TAI LOY S.A. 16-08-99 16-08-99 99-999999 XXXXXXXXXXXXXXX dd-mm-aa Federico López Alejandra Ruiz XXXXXXXXXXXX S/. 450.50 S/. 840.50 S/. 0.00
  • 13.
    Definiciones Previas REG.2REG.1 REG.3 REGISTRO FISICO Puede consistir de varios registros lógicos , además de un control del sistema donde guarda información sobre el almacenamiento para facilitar la búsqueda. Es una unidad de transferencia de datos entre el dispositivo de almacenamiento y la memoria principal.
  • 14.
    Definiciones Previas EsquemaEs la descripción lógica de la Base de datos. Es un diagrama general de todos los campos de datos y de los registros almacenados. Proporciona los nombres de los archivos (entidades y sus atributos) y especifica las relaciones entre ellos.
  • 15.
    Definiciones Previas SubesquemaEs la visión que tienen el usuario y el programador de aplicaciones de los datos que utilizan. Es sinónimo de área o vista. Del mismo esquema se pueden derivar muchos subesquemas.
  • 16.
    Modelo de DatosEs una colección de herramientas conceptuales para describir los datos, las relaciones entre ellos, la semántica y las ligaduras de consistencia o restricciones . Proporciona capacidades estructurales muy flexibles y permite que las ligaduras de datos sean especificadas explícitamente.
  • 17.
    Modelo de DatosModelo Entidad-Relación (E-R), basado en una percepción del mundo real que consta de una colección de objetos llamados entidades, y de relaciones entre éstas. Modelo orientado a objetos, que incluye muchos conceptos del modelo E-R, pero representa tanto datos como lógica inherente a ellos (operaciones).
  • 18.
    Modelos de Datos Entidad Algo que puede ser de interés para una organización acerca de lo cual recopila y almacena información. Cada ocurrencia de la entidad se denomina Instancia Atributo Cada uno de los datos que describen una entidad. Se almacenan físicamente en campos o elementos de datos
  • 19.
    Modelos de Datos Relación (asociación, interrelación o vínculo) Es una conexión o asociación entre instancias de entidades Las instancias asociadas pueden pertenecer a la misma entidad o a otra. Las relaciones en un modelo tienen una multiplicidad (cardinalidad) y se les asigna un nombre que las describe.
  • 20.
    Comparación de terminologíasMainframes AS/400 Librería Archivo Físico Registro Campo Valor de campo Modelo de Datos Modelo de BD Entidad Tupla Atributo Dominio o Valores de atributo Archivos DBF Directorio Archivo .DBF Registro Campo Valor de campo. Base de Datos (DBMS) Base de Datos Tabla Fila Columna Valores, Reglas, Defaults
  • 21.
    Ventajas del enfoquede BD. Disminuye la redundancia de datos Pr eserva la independencia de los datos respecto de las aplicaciones. Permite compartir datos , controlando los accesos concurrentes. Facilita el establecimiento de estándares. Permite definir restricciones de seguridad. Posibilita la integridad de los datos.
  • 22.
    Independencia de DatosIndependencia Lógica Es la capacidad de modificar la estructura lógica sin que por ello tengan que reescribirse los programas. Independencia Física Es la capacidad de modificar la distribución y la organización física de los datos sin afectar la estructura lógica general ni los programas de aplicación.
  • 23.
    Es básicamente una colección de archivos interrelacionados y un conjunto de programas para crear, almacenar y modificar estos archivos . Su propósito es resguardar la información de dichos archivos y hacer que esté disponible cuando se la solicite. Proporcionan un entorno práctico y eficiente para la recuperación y el almacenamiento de los datos. El Sistema de Administración de BD (DBMS ó SGBD)
  • 24.
    El Sistema deAdministración de BD (DBMS ó SGBD) Funciones: Crear, organizar y manipular la Base de Datos (DML y DDL) Mantener Sub Sistemas de Seguridad, Integridad, Control de concurrencia y Recuperación. Registrar las estadísticas de uso. Administrar el diccionario de datos. Optimizar el desempeño.
  • 25.
    Seguridad, Integridad yRecuperación Seguridad implica asegurar que los usuarios están autorizados para llevar a cabo las tareas que tratan de ejecutar Integridad implica asegurar que lo que tratan de hacer los usuarios es correcto. Recuperación implica asegurar la base de datos contra daños en el sistema o en el hardware.
  • 26.
    El Sistema deAdministración de BD (DBMS) Peticiones de usuario DBMS Sistema Operativo BD Física El DBMS sirve de interfase entre las peticiones de usuario y los datos almacenados
  • 27.
    Arquitectura de unaaplicación con DBMS Nivel Externo (vistas individuales de los usuarios) Nivel Lógico (qué datos se almacenan y cómo se relacionan) Nivel Físico (vista del almacenamiento)
  • 28.
    Componentes Funcionales deun DBMS ALMACENAMIENTO EN DISCO Gestor de Almace-namiento Procesador de Consultas Interfases de Aplicaciones Programas de Aplicación Consultas D B M S Esquema de Base de Datos Usuarios Usuarios finales Programadores Usuarios sofisticados Administrador de Base de Datos Archivos de datos diccionario de datos Código objeto de los programas de aplicación Motor de evaluación de consultas precompilador del DML incorporado compilador del DML incorporado intérprete del DDL Gestor de transacciones Gestor de memoria intermedia Gestor de archivos Indices Datos estadísticos Fuente: “Fundamentos de Bases de Datos” – A. Silberschatz
  • 29.
    El Administrador dela BD (DBA) Funciones Definir el modelo de datos o esquema conceptual. Comunicación con los usuarios. Definir el esquema interno. Definir las verificaciones de seguridad e integridad. Definir procedimientos de respaldo y recuperación. Supervisar el desempeño y responder a cambios en los requerimientos.
  • 30.
    Esquemas Físicos deBases de Datos Son las arquitecturas lógico-físicas con las que se implementan las Bases de Datos. Jerárquicas Redes Relacional
  • 31.
    Bases de DatosJerárquicas Los Archivos que componen la base de datos están organizados en niveles ordenados por jerarquías. Las relaciones entre los datos se representan mediante enlaces , que se pueden ver como punteros físicos Un archivo padre puede tener muchos hijos o ramificaciones. Un archivo hijo no puede tener mas que un padre.
  • 32.
    Base de Datosde Redes Los Archivos que componen la base de datos están organizados en base a una estructura de red. Las relaciones entre los datos se representan mediante enlaces , que se pueden ver como punteros Se habla de archivos propietarios y archivos miembros. Un archivo miembro puede tener mas de un archivo propietario
  • 33.
    Base de DatosRelacional Los archivos se denominan tablas o Relaciones La representación de las tablas es la de una matriz bidimensional. Las filas se denominan tuplas y representan los registros de información. Las columnas representan a los atributos. El rango de valores posibles del atributo se denomina dominio. Las relaciones entre las tablas se establecen mediante los valores de atributos comunes (en lugar de hacerlo mediante punteros)
  • 34.
    Breve Historia delas Bases de Datos Hasta 1970 aprox. Uso de tarjetas perforadas y de cintas perforadas. /\/\/\/\/| | . | | . | | o o .ooo| W | oo o. o| i | oo o. oo|k | oo o. o| i | ooo . | p | oo .o o| e | oo .o | d | oo o. o| i | oo . o| a | o.o o| Retorno de carro (CR) | o. o | Avance de línea (LF) | . | ||/\/\/\/\/ [Fuente http://es.wikipedia.org/wiki/Cinta_perforada]
  • 35.
    Breve Historia delas Bases de Datos 2. Finales del 1960. El modelo Jerárquico tiene acogida y también CODASYL " Conference on Data Systems Languages " genera COBOL y modelo de redes. 3. Codd propone en 1970 su modelo Relacional para hacer independiente el modelo de datos de los programas. Define su teoría en términos de lógica predicativa y de teoría de conjuntos. Oracle y DB2 recién aparecen en 1980. 4. Por 1980 se comienza a investigar las bases de datos distribuidas. 5. Por los 1990 se enfocan en bases de datos orientadas a objetos. 6. Hacia finales de los 90 se crean modelos orientados a dimensiones para datawarehouses (OLAP). [Fuente http://en.wikipedia.org/wiki/Databases
  • 36.
    Evolución Histórica Archivossecuenciales BD jerárquicas BD de redes Archivos con acceso directo 1960 Publicaciones del modelo relacional de Codd 1970 BD relacionales. 1980 Plataforma C/S 1990 Sistemas de BDOO 2000

Notas del editor

  • #4 Introducción a las Bases de Datos 25 de abril de 2011 UPC - Ingeniería de Sistemas
  • #7 Introducción a las Bases de Datos 25 de abril de 2011 UPC - Ingeniería de Sistemas
  • #19 Introducción a las Bases de Datos 25 de abril de 2011 UPC - Ingeniería de Sistemas
  • #20 Introducción a las Bases de Datos 25 de abril de 2011 UPC - Ingeniería de Sistemas
  • #26 Introducción a las Bases de Datos 25 de abril de 2011 UPC - Ingeniería de Sistemas
  • #29 Introducción a las Bases de Datos 25 de abril de 2011 UPC - Ingeniería de Sistemas Procesador de Consultas: Compilador del DML , traduce las instrucciones DML en instrucciones de bajo nivel, optimizando además la ejecución de las consultas. Precompilador del DML , convierte las instrucciones DML de los programas de aplicación. Intérprete del DDL Motor de evaluación de consultas , que ejecuta las instrucciones generadas por el compilador del DML. Gestor de Almacenamiento: Gestor de autorización e integridad . Gestor de transacciones , garantiza la consistencia de la BD (recuperación y concurrencia) Gestor de archivos , gestiona la reserva de espacio en disco y las estructuras de datos para la información almacenada. Gestor de memoria intermedia , trae los datos del disco a la memoria principal y decide qué datos tratar en caché .