Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
Clase 01 conceptos basicos y archivos
1. Introducción a las
Bases de Datos
Curso 2007
Mg. Rodolfo Bertone
Mg. Pablo Thomas
Facultad de Informática - UNLP
2. UNLP - Facultad de InformáticaIBD - CLASE 1 2
Bibliografia
Files & Databases: An
Introduction (Smith-
Barnes)
Estructuras de
Archivos (Folk-
Zoellick)
Bases de Datos
Relacionales
(Giménez, Casamyor,
Herranz)
Principles in DataBase
Systems (Navathe-
Cieri)
Algoritmos Datos y
Programas (De
Giusti) Cap. 12.
Diseño conceptual de
Bases de Datos (Batini,
Navate, Cieri)
Sistemas de Bases de
Datos (Date)
Fundamento de sistemas
de BD (Elmasri - Navathe)
Modern Database
Management (Hoffer,
Prescott, McFadden)
Fundamentos de Bases de
Datos (Korth Silvershatz)
3. UNLP - Facultad de InformáticaIBD - CLASE 1 3
Cursada 2007
Se utilizará la plataforma WebInfo
Para aprobar
– Primer semestre:
• un parcial (dos recuperatorios)
• Entrega de algunos ejercicios en grupos
– Segundo semestre:
• un parcial (dos recuperatorios)
• Entrega de algunos ejercicios en grupos (plan
90)
4. UNLP - Facultad de InformáticaIBD - CLASE 1 4
Cursada 2007
IBD Plan 2003 diferente de IBD Plan
90
– Distintas entregas
– Distintos contenidos teóricos
– Distintos parciales
NO son intercambiables
5. UNLP - Facultad de InformáticaIBD - CLASE 1 5
Conceptos Básicos
Que es una BD?
– Es una colección de datos relacionados.
– Colección de archivos diseñados para servir
a múltiples aplicaciones
– Un dato representa hechos conocidos que
pueden registrarse y que tienen un resultado
implícito.
6. UNLP - Facultad de InformáticaIBD - CLASE 1 6
Conceptos Básicos
Propiedades implícitas de una BD:
• Una BD representa algunos aspectos
del mundo real, a veces denominado
Universo de Discurso.
• Una BD es una colección coherente de
datos con significados inherentes. Un
conjunto aleatorio de datos no puede
considerarse una BD. O sea los datos
deben tener cierta lógica.
7. UNLP - Facultad de InformáticaIBD - CLASE 1 7
Conceptos Básicos
Propiedades implícitas de una BD:
• Una BD se diseña, construye y
completa de datos para un
propósito específico. Está
destinada a un grupo de usuarios
concretos y tiene algunas
aplicaciones preconcebidas en las
cuales están interesados los
usuarios
8. UNLP - Facultad de InformáticaIBD - CLASE 1 8
Conceptos Básicos
Que es un DBMS o SGBD?
– Las siglas Data Base Management
System o Sistema Gerenciador de
Bases de Datos
– Es una colección de programas que
permiten a los usuarios crear y
mantener la BD
– Es un sistema de software de
propósito general que facilita los
procesos de definición, construcción y
manipulación de BD
9. UNLP - Facultad de InformáticaIBD - CLASE 1 9
Conceptos Básicos
Objetivos de un DBMS:
– Evitar redundancia e inconsistencia de datos
– Permitir acceso a los datos en todo momento
– Evitar anomalías en el acceso concurrente
– Restricción a accesos no autorizados
seguridad.
– Suministro de almacenamiento persistente de
datos (aún ante fallos) seguridad desde otra
perspectiva.
– Integridad en los datos
– Backups.
10. UNLP - Facultad de InformáticaIBD - CLASE 1 10
Conceptos Básicos
Componentes de un DBMS
– DDL (data definition languaje):
especifica el esquema de BD.
Resultado: Diccionario de datos
– DML (data manipulation languaje):
• Recuperación de información
• Agregar información
• Quitar información
• Modificar información
11. UNLP - Facultad de InformáticaIBD - CLASE 1 11
Conceptos Básicos
• DML Características:
– Procedimentales (SQL) requieren que el
usuario especifique qué datos se muestran y
cómo obtener esos datos
– No Procedimentales (QBE) requieren que
el usuario especifique qué datos se muestran y
sin especificar cómo obtener esos datos
12. UNLP - Facultad de InformáticaIBD - CLASE 1 12
Conceptos Básicos
Entonces
– La definición de una BD consiste en
especificar los tipos de datos, las estructuras y
restricciones de los mismos.
– La construcción de la BD es el proceso de
almacenar datos concretos en algún
dispositivo de almacenamiento bajo la gestión
del DBMS.
– La manipulación de BD incluye funciones tales
como consultar la BD para recuperar datos
específicos, actualizar los datos existentes,
reflejar cambios producidos, etc.
13. UNLP - Facultad de InformáticaIBD - CLASE 1 13
Conceptos Básicos
Propósitos mas relevantes de IBD
– Estudio de archivos
• Definición, forma de trabajo, operaciones elementales.
• Archivos de datos y archivos de acceso a datos
• Alternativas de acceso a bajo costo
– Aprender a definir una BD
• Construcción del modelo de datos
• Normalización
– Aprender a manipular una BD
• Lenguaje de trabajo clásico con BD
– Estudio de seguridad e integridad de la
información
14. UNLP - Facultad de InformáticaIBD - CLASE 1 14
Conceptos Básicos
Abstracciones:
– Visión: ve solo los datos de interes (muchas vistas para la
misma BD) a través de programas de aplicación.
– Conceptual: qué datos se almacenan en la BD y qué
relaciones existen entre ellos
– Físico: describe cómo se almacenan realmente los datos
(archivos y hardware)
Vista 1
Nivel fisico
Nivel conceptual
Vista nVista 2
15. UNLP - Facultad de InformáticaIBD - CLASE 1 15
Conceptos Básicos
Modelos de datos
– Colección de herramientas conceptuales
para describir datos, relaciones entre ellos,
semántica asociada a los datos y
restricciones de consistencia
Modelos
– Basado en objetos (visión, conceptual).
Estructura flexible, especifican restricciones
explícitamente
• Modelo de Entidad-Relación
• Modelo Orientado a Objetos
16. UNLP - Facultad de InformáticaIBD - CLASE 1 16
Conceptos Básicos
– Basado en registros (conceptual, físico).
La BD se estructura en reg. de formato fijo.
Se dispone de lenguaje asociado para
expresar consultas
• relacional
• jerárquico
• red
– Físico de datos (físico). Describen los
datos en el nivel mas bajo.
17. UNLP - Facultad de InformáticaIBD - CLASE 1 17
Conceptos Básicos
Independencia de datos
– Capacidad de modificar esquemas sin
alterar otro nivel
• Físico (modificar el esquema físico
sin provocar que los programas de
aplicación tengan que reescribirse
gralm. para mejorar el
funcionamiento)
• Lógico (modificar el esquema
conceptual)
18. UNLP - Facultad de InformáticaIBD - CLASE 1 18
Conceptos Básicos
Categorías de soft de procesamiento de
datos:
– Sin independencia de datos (SO, transferencia a
un sector en particular)
– Independencia física (leer un registro de un
archivo, SO)
– Independencia lógica parcial (leer siguiente
registro de un archivo)
– Independencia lógica y física (leer siguiente
registro de un tipo particular, DBMS)
– Independencia geográfica (BD distribuidas)
19. UNLP - Facultad de InformáticaIBD - CLASE 1 19
Conceptos Básicos
Actores involucrados con una BD
– DBA o ADB
• Administra el recurso, que es la BD. Autoriza accesos,
coordina y vigila la utilización de recursos de
hardware y software, responsable ante problemas de
violación de seguridad o respuesta lenta del sistema.
– Diseñador de BD
• Definen la estructura de la BD de acuerdo al problema
del mundo real que esté representando
– Analistas de Sistemas
• Determinan los requerimientos de los usuarios finales,
generando la información necesaria para el
diseñador.
– Programadores
• Implementan las especificaciones de los analistas
utilizando la BD generada por el diseñador.
– Usuarios (distintos tipos)
20. UNLP - Facultad de InformáticaIBD - CLASE 1 20
Conceptos Básicos
Sistema de
Gestión de
Bases de Datos
Interfaces de
aplicación
Planificación de BDConsultas
Programadores de
aplicación
Código objeto de
programas de aplicación
Compilador de
lenguajes de definición
de datos
Procesador
de
Consultas
Gestor de
Archivos
Precompilador de lenguajes
de manipulación de datos
Gestor de Archivos
Usuarios
Ingenuos
DBAUsuarios
Sofisticados
Programadores
de aplicación
Almacenamientoen
disco
Archivo
de datos
Diccionario
de Datos
21. UNLP - Facultad de InformáticaIBD - CLASE 1 21
Archivos
Nivel Físico
– Archivos
– Hardware
Archivos
– Definiciones
• Colección de registros guardados en almacenamiento
secundario
• Colección de datos almacenados en dispositivos
secundarios de memoria
• Colección de registros que abarcan entidades con un
aspecto común y originadas para algún propósito
particular
22. UNLP - Facultad de InformáticaIBD - CLASE 1 22
Archivos
Hardware
– Almacenamiento primario
– Almacenamiento secundario (DR)
• Platos
• Superficies
• Pistas
• Sectores
• Cilindros
– Acceso a RAM vs. Acceso a DR
• comparaciones.
23. UNLP - Facultad de InformáticaIBD - CLASE 1 23
Archivos
A dos niveles
– Físico (almacenamiento secundario)
– Lógico (dentro del programa)
• Operaciones
– Crear
– Abrir
– Read/Write
– Eof
– Seek(localización)
24. UNLP - Facultad de InformáticaIBD - CLASE 1 24
Archivos
Organización
– Secuencia de bytes (archivos de texto)
– Campos y Registros
Secuencia de bytes
– no se puede determinar fácilmente comienzo y fin de
cada dato.
Campos
– Unidad más pequeña, lógicamente significativa de un
archivo
Registros
– Conjunto de campos agrupados que definen un
elemento del archivo
25. UNLP - Facultad de InformáticaIBD - CLASE 1 25
Archivos
Acceso a los archivos
– Secuencial: acceso a los registros uno tras otro y
en el orden físico en el que están guardados
– Secuencial indizado: acceso a los registros de
acuerdo al orden establecido por otra estructura
• Ej: una guía telefónica, o índice temático del un libro
– Directo: se accede a un registro determinado sin
necesidad de haber accedido a los predecesores.
26. UNLP - Facultad de InformáticaIBD - CLASE 1 26
Archivos
Buffers
– Memoria intermedia
entre un archivo y un
programa, donde los
datos residen proviso-
riamente hasta ser
almacenados definiti-
vamente en memoria
secundaria o donde
los datos residen una
vez recuperados de
dicha memoria
secundaria.
– Los buffers ocupan lugar
en RAM
– SO encargado de
manipular los buffers
– Como trabaja?
Notas del editor
Ej: evitar repetición de datos, sistema bancario Caja de Ahorro y cta corriente, tener datos del cliente en ambos , necesita más espacio y puede tener problemas de actualización. Pueden llevar a inconsistencia de los datos. Deben permitir acceder a los datos en cualquier momento y ante cualquier cruce de consultas. Hablar sobre las características del acceso concurrente Seguridad: distintos niveles de seguridad del cliente. Integridad relacionado con consistencia no debe ocurrir que el saldo sea menor que 0 de una cuenta corriente .
El Obj. Ppal. De un DBMS es dar a los usuarios una VISION ABSTRACTA de los datos (ocultar los detalles de cómo se almacenan y mantienen los datos) en 3 niveles
Relacional: datos y relaciones entre tablas (a través de los datos, NO ptr) cliente dirección ciudad nro cta nro cta saldo Red: datos en registros, relaciones entre ellos con punteros formando grafos dirigidos Jerárquico: idem anterior formando árboles.
Los dibujos de independencia:
Procesador de Consultas : optimiza las consultas y las traduce a un lenguaje de más bajo nivel Precompilador de DML : convierte las instrucciones del programa de aplicación para que puedan ser procesadas por el Procesador de Consultas Compilador de DDL : interpreta las instrucciones de DDL y los registra en un conjunto de tablas que contienen METADATOS Gestor de Archivos : maneja las estructuras usadas para guardar la información Archivo de Datos : datos propiamente dichos Diccionario de Datos : metadatos acerca de la estructura de la BD
La localización depende del tipo de lenguaje utilizado Pascal: distancia desde el comienzo del archivo C: depende del modo de trabajo, puede ser desde el comienzo, desde el final o desde donde se halla el puntero