1. Sistematización De Contenidos
Básicos De La Carrera
Tema: 3 Base de datos
Mg. Luis Fernando Aguas Bucheli
+593 984015184
@Aguaszoft
Laguas@uisrael.edu.ec
2. “El mayor enemigo del conocimiento no es la ignorancia,
sino la ilusión del conocimiento”
— Stephen Hawking
3. Objetivo
• Implementar la representación de un
modelo de proceso de negocios desde el
punto de vista conceptual y lógico;
mediante el diseño de objetos y
transacciones de la base de datos,
además conocer el lenguaje SQL para
aplicar en las bases de datos física
permitiendo resolver las diferentes
situaciones problemáticas.
● 3.1 Fundamentos BDD
(Normalización)
Contenido
4. ODS
● 4.3 De aquí a 2030, asegurar
el acceso igualitario de todos
los hombres y las mujeres a
una formación técnica,
profesional y superior de
calidad, incluida la enseñanza
universitaria
META
6. “Base de Datos es una fuente central de datos con el fin de que varios usuarios la compartan
para su uso en varias aplicaciones”.
Kendall & Kendall
Permite entre otros objetivos:
Asegurar que los datos se puedan compartir entre los usuarios y en varias aplicaciones.
Mantener datos precisos y consistentes.
Asegurar que todos los datos requeridos para las aplicaciones esten disponibles
Permitir que la base de datos evolucione a medida que aumenten las necesidades de los
usuarios.
Permite que los usuarios construyan su propia vista personal de los datos sin preocuparse por la
forma en la que éstos se almacenan.
NO solo se refiere a una colección de archivos.
DISEÑO DE BASE DE DATOS
7. Archivos Tradicionales y Bases de Datos
En un sistema de información se cuenta con dos enfoques principales para definir el
almacenamiento de los datos:
Archivos tradicionales. Consiste en almacenar los datos en archivos individuales,
exclusivos para cada aplicación particular.
Base de datos. Es un almacenamiento de datos formalmente definido, controlado
centralmente para intentar servir a múltiples y diferentes aplicaciones.
La metodología de las bases de datos tiene la ventaja de permitir que los usuarios tengan su propia
vista de datos.
DISEÑO DE BASE DE DATOS
8. Facturas
Num Nombre Dirección Producto Precio
1225 Joaquín García Malecon 1224 Cemento 1,75
1226 Luis Fernando Martínez Samanes 1456 Pintura 3,75
..... ....... ........ ....... ......
Num Nombre Dirección Telefono E-mail
1225 Juan García Malecon 1224 4182569 jgarcia@gmail.com
1226 Fernando Martínez Samanes 1456 9157878 Fmar@gmail.com
.... ....... ......... ......... ........
innecesaramente)
Se pueden producir
contradicciones entre los
datos, si por ejemplo se
ingresan nombres diferentes
para un mismo cliente.
DISEÑO DE BASE DE DATOS
Ejemplo. Se cuenta con dos archivos Clientes y Facturas.
1. Contiene datos básicos de los clients
2. Almacenan las ventas realizadas.
3. Al emitir cada factura se ingresan nuevamente los datos num, nombre, dirección.
Clientes
Desventajas:
Se duplican esfuerzos
Se presentan redundancias
de datos (datos repetidos
9. “Datos son hechos conocidos que pueden registrarse y que tienen un significado
implícito”.
Ejemplo:
Pueden constituir datos los nombres, números telefónicos y direcciones de
personas.
Elena Sánchez
Kli@Hotmail.com
José
ftartínez
18 de Julio 1880
DISEÑO DE BASE DE DATOS
10. Metadatos son datos acerca de los datos presentes en la base de datos. Es la
información que describe a los datos.
Dato Tipo Longitud
Num Numérico 4
Nombre Alfabético 20
..... ...... .......
Ejemplo metadatos
El tipo de datos puede ser numérico,
alfabético, fecha, lógico (Sï /NO).
La longitud indica la cantidad
máxima de caracteres que
puede asumir el dato.
Ejemplo de Restricción de Dominio: Num >0 y <9999
DISEÑO DE BASE DE DATOS
11. Una entidad es todo aquello de lo cual interesa guardar datos, por ejemplo:
clientes, facturas, productos, empleados.
En el Modelo de Entidad-Relación, se observa que las entidades están formadas
por atributos o campos referidos a un mismo tema que interesa almacenar.
CLIENTES cuenta con los atributos: Código de Cliente, Nombre, Apellido,
Domicilio, Teléfono.
DISEÑO DE BASE DE DATOS
12. Claves Primarias y Claves Foráneas
Cada entidad tiene una clave primaria o campo llave que identifica unívocamente al conjunto de
datos.
Cuando en una entidad figura la clave primaria de otra entidad, ésta se denomina clave foránea.
Las entidades se relacionan entre sí a través de las claves foráneas.
CLAVES PRIMARIAS
Código de Cliente
Número de Factura
Código de Producto
CLAVES FORÁNEAS
Código de Cliente y Código de
Producto.
DISEÑO DE BASE DE DATOS
13. Restricciones de integridad referencial
RESTRICCIONES DE INTEGRIDAD REFERENCIAL
-Código de Clientes en Facturas debe cumplir que exista en Clientes y que sea clave primaria
-Código de Producto Facturas debe cumplir que exista en Productos y que sea clave primaria
DISEÑO DE BASE DE DATOS
14. Una Base de Datos “...es un conjunto de datos relacionados entre sí y que tienen un
significado implícito”, se observa en la imagen que los datos de las tablas se relacionan a
través de las claves y que éstos tienen el significado implícito que se les atribuye en dicho
contexto.
DISEÑO DE BASE DE DATOS
15. DISEÑO DE BASE DE DATOS
Ejemplo de Modelo Entidad Relación:
Se desea modelar un Sistema de facturación, en especial con la parte del Sistema
relacionada con la prescripcion. Se tiene en el diseño como entidades
PRESCRIPCION, PACIENTE, MEDICO, TRATAMIENTO y COMPAÑIA DE SEGURO.
Un medico atiende muchos pacientes, cada uno de los cuales esta sucrito a una
Compañia de seguros individual.
El paciente es solo uno de los muchos pacientes que se suscriben a esa
Compañia de Seguros.
El medico necesita mantener informado de los TRATAMIENTOS que ha llevado
los pacientes.
Muchos pacientes experimentan muchos TRATAMIENTOS.
16. DISEÑO DE BASE DE DATOS
datos relacional esta organizada
Una base de
representativas,
en tablas
lo cual minimiza la repeticion de datos,
reduciendo errores y espacio de almacenamiento.
Vista Lógica o Esquema conceptual: corresponde el diseño
logico que realiza el analista.
Vista de Usuario o Esquema de usuario: es la manera como
el usuario imagina y ve los datos.
Vista Física o Esquema Interno: es la forma como se
almacenan, relacionan los datos y acceden a los datos.
Base de Datos Relacionales
17. DISEÑO DE BASE DE DATOS
Base de Datos Relacionales
Una estructura de datos relacional consiste en uno o más tablas bidimensionales, las
cuales se conocen como relaciones. Las filas representan los registros y las columnas
contienen atributos.
Para que sean útiles y manejables
deben primero NORMALIZAR las
tablas relacionales.
18. EJERCICIO 1
Realizar el modelo entidad-relación a partir del siguiente enunciado:
“Una empresa vende productos a varios clientes. Se necesita
conocer los datos personales de los clientes (nombre, apellidos,
cedula, dirección y fecha de nacimiento). Cada producto tiene un
nombre y un código, así como un precio unitario. Un cliente puede
comprar varios productos a la empresa, y un mismo producto puede
ser comprado por varios clientes.
Los productos son suministrados por diferentes proveedores. Se
debe tener en cuenta que un producto sólo puede ser suministrado
por un proveedor, y que un proveedor puede suministrar diferentes
productos. De cada proveedor se desea conocer el RUC, nombre y
dirección”.
22. Modelo E-R a Relacional
● Cliente-Productos
Transformación de relaciones N:N
Transformar la relación en una tabla como
si se tratara de una relación M:M; pero
ahora la clave primaria de la tabla creada
es sólo la clave primaria de la tabla a la que
le corresponde la cardinalidad n.
Cliente (Id-Cliente, nombre, apellido, dirección,
fecha de nacimiento)
Productos (código, nombre, precio unitario)
Compra (Id-cliente, código)
23. Modelo E-R a Relacional
● Productos -proveedores Transformación de relaciones 1:N
Propagar la clave principal del tipo de entidad
que tiene la cardinalidad máxima 1 a la que
tiene N (propagación de clave). Esta es la regla
habitual.
Productos (código, nombre, precio
unitario, RUC)
Proveedor (RUC, nombre, dirección)
24. Modelo Relacional
Transformar a Modelo Relacional al Ejercicio 1
Cliente (Id-Cliente, nombre, apellido, definición, fecha de nacimiento)
Producto (código, nombre, precio unitario, RUC)
Proveedor (RUC, nombre, dirección)
Compra (Id-cliente, código)
25. Modelo Relacional
Id-cliente Nombre Apellido Dirección F de nacimiento
Tabla: cliente
código Nombre Precio unitario RUC
Tabla: producto
RUC Nombre Dirección
Tabla: proveedor
27. EJERCICIO 2
● A partir del siguiente enunciado diseñar el modelo entidad-
relación.
● “Se desea diseñar la base de datos de un Instituto. En la base
de datos se desea guardar los datos de los profesores del
Instituto (DNI, nombre, dirección y teléfono). Los profesores
imparten módulos, y cada módulo tiene un código y un
nombre. Cada alumno está matriculado en uno o varios
módulos. De cada alumno se desea guardar el nº de
expediente, nombre, apellidos y fecha de nacimiento. Los
profesores pueden impartir varios módulos, pero un módulo
sólo puede ser impartido por un profesor. Cada curso tiene un
grupo de alumnos, uno de los cuales es el delegado del
grupo”.
29. DISEÑO DE BASE DE DATOS
Normalización
La Normalización es la transformacion de las vistas de usuarios y almacenes de
datos complejos en un conjunto de estructuras de datos estables y más pequeñas.
Los tres pasos de la normalización:
1. Eliminar todos los grupos repetidos e identificar clave primaria. Se
descompone en dos o más relaciones.
2. Asegurar que todos los atributos que no sean claves dependan por complete
de la clave primaria. Se eliminan todas las dependencias parciales y se colocan
en otra relación.
3. Eliminar las dependencias transitivas. Es decir, eliminar aquellos atributos que
no son claves dependen de otros atributos que tampoco son claves.
30. Normalización Modelo Relacional
La normalización es un concepto de las bases de datos relacionales, pero sus
principios se aplican al modelamiento de datos conceptuales.
Una vez creadas las tablas hay que verificarlas y revisar si aún se puede reducir u
optimizar de alguna manera.
Los problemas tales como la redundancia que ocurren cuando se abarrotan
demasiados datos en un sola relación son llamados anomalías. Los principales tipos
son:
Redundancia: la información se repite innecesariamente en muchas tuplas.
Anomalías de actualización: cuando al cambiar la información en una tupla se
descuida el actualizarla en otra.
Anomalías de eliminación: si un conjunto de valores llegan a estar vacíos y se
llega a perder información relacionada como un efecto de la eliminación.
31. Normalización Modelo Relacional
Primera Forma Normal 1FN
Una relación está en primera forma normal si todo atributo contiene un valor atómico (valor
unitario).
Es decir, cada atributo tiene un solo valor para cada ocurrencia de la entidad. Ningún atributo
tendría valores repetidos o que conforman un grupo.
Ejemplos:
Persona (cedula, nombre, apellido, sexo, teléfono, dirección )
Los primeros cinco atributos son atómicos, lo que implica que esta relación Persona esta en
1FN.
Estudiante ( cedula, nombre, apellido, escuela, materias, notas )
Los primeros cuatro atributos son atómicos, pero también es claro que los dos últimos no
están en 1FN. Para convertirla a 1FN se proyecta en dos relaciones, obteniendo:
Estudiante (cedula, nombre, apellido, escuela)
Cursa (cedula, materia, nota )
32. Normalización Modelo Relacional
Segunda Forma Normal 2FN
Una relación está en segunda forma normal si y solo si:
La relación esta en 1FN
Todo atributo que no pertenece a una clave no puede depender de una parte de esa clave.
Ejemplo:
Proveedor ( codProv, codArt, dirProv, precio )
Está relación esta en 1FN, pero dado lo siguiente: (codProv, codArt ) precio (precio depende
de la clave primaria por completo ), (codProv) dirProv (dirProv solo depende de una parte de la
clave codProv). Por lo tanto está relación no está en 2FN, pues hay un atributo no clave (dirProv)
que depende de una parte de la clave.
33. Normalización Modelo Relacional
Segunda Forma Normal 2FN
Ejemplo:
Proveedor ( codProv, codArt, dirProv, precio )
Para normalizar se proyecta en dos relaciones:
Proveedor (codProv, dirProv)
ProveeArticulos (codProv, codArt, precio)
Carro ( placa, marca, modelo, color)
Está relación está en 2FN.
34. Normalización Modelo Relacional
Tercera Forma Normal 3FN
Una relación está en tercera forma normal si y solo si:
La relación está en 2FN.
Todo atributo que no pertenece a la clave no depende de un atributo que no es clave.
Ejemplo:
Carro (placa, marca, modelo, color)
Está en 2FN, pero no en tercera forma normal, ya que el atributo marca depende del modelo
y este no es parte de la clave primaria. Para normalizar se proyecta en dos relaciones.
Carro (placa, modelo, color)
ModelosDeCarros ( modelo, marca)
35. Normalización Modelo Relacional
Tercera Forma Normal 3FN
Ejemplo:
Orden ( id_orden, fecha, id_cliente, nombre_cliente )
Está en 2FN pero no en 3FN, ya que el nombre del cliente depende del id_cliente que no es una clave
primaria. Para normalizar se propaga de la siguiente forma:
Cliente ( id_cliente, nombre_cliente )
Orden ( id_orden, id_cliente, fecha )
Un esquema normalizado hasta 3FN debe cumplir con el juramento siguiente:
Jura usted que cada columna de cada fila depende:
De la clave (1FN).
De toda la clave (2FN).
Nada mas que de la clave (3FN).
36. DISEÑO DE BASE DE DATOS
Ejemplo de Normalización
La empresa S. Well Hydraulic Equiqment Company maneja la siguiente información, se desea que Usted
normalice los datos.
37. DISEÑO DE BASE DE DATOS
Lineamientos para el diseño de relaciones de archivos maestros/bases de datos
Existen al momento de diseñar relaciones de archivos maestros o bases de datos
ciertas consideraciones o lineamientos:
1. Cada entidad de datos separadas debe crear una table maestra de base de
datos. No debe combinar dos entidades distintas en un archive.
2. Un campo de datos especifico SOLO debe existir en una sola tabla
3. Cada relación de table maestra o base de datos debe tener programas para
crear, leer, modificar y eliminar registros.
38. DISEÑO DE BASE DE DATOS
Lineamientos para el diseño de relaciones de archivos maestros/bases de datos
Restricciones de integridad referencial
Son reglas que gobiernan las acciones de modificar y eliminar registros, ayudando
a mantener la precisión de los datos en la base de datos.
Integridad de entidad: gobiernan la composicion de las claves primarias.
Integridad referencial: gobierna la naturaleza de los registros en una relacion
de muchos a muchos.
Integridad de dominio: se utiliza para validar los datos, como las
comprobaciones de tablas, limites, rango, entre otros.
39. DISEÑO DE BASE DE DATOS
Desnormalización
● Es el proceso de tomar el modelo de datos lógico y transformarlo en un modelo
● físico que sea eficiente para las tareas requeridas con más frecuencia.
● Para ello pretende mejorar tiempo en operaciones
de consulta, reduciendo el numero de tablas involucradas.
Entre las tareas se incluyen:
● Consultas eficientes: Generación de informes
● Consultas complejas: procesamiento analítico en línea OLAP), Minería de datos,
Descubrimiento en Bases de Datos.
Definir registros físicos que no estén en la tercera forma normal o en una superior; incluye la unión
de atributos de varias relaciones entre sí para evitar el costo de acceder a varios archivos. El
particionamiento es una forma intencional de desnormalización.
40. DISEÑO DE BASE DE DATOS
Uso de la Base de Datos
Pasos para recuperar y presentar los datos
Hay ocho pasos en el proceso de recuperación y presentación
de los datos:
1. Seleccionar una relación de la base de datos.
2. Unir las relaciones.
3. Proyectar las columnas de la relación.
4. Seleccionar filas de la relación.
5. Derivar nuevos atributos.
6. Indexar u ordenar filas.
7. Calcular totales y medidas de desempeño.
8. Presentar los datos
41. DISEÑO DE BASE DE DATOS
Almacenes Corporativo de Datos
Almacén de Datos Corporativos
• Una colección de datos de apoyo de los procesos de decisión administrativos
que está orientada al tema, integrada, varía con el tiempo y es no volátil.
• Permite organizar la información para consultas rápidas y efectivas.
• Procesa los datos de distintas fuentes, por lo
general bases de datos que se establecen para
distintos fines.
42. DISEÑO DE BASE DE DATOS
Almacenes Corporativo de Datos
Minería de Datos
Técnicas que aplican algoritmos para extraer patrones de datos guardados en
almacenes de datos corporativos no son aparentes para los humanos que
toman las decisiones.
La minería de datos prepara, sondea y explora los datos para sacar la
información oculta en ellos.
También se le conoce como descubrimiento de conocimiento en bases de
datos.
Involucra el uso de una base de datos para una focalización más selectiva de
los clientes.
43. DISEÑO DE BASE DE DATOS
Almacenes Corporativo de Datos
Minería de Datos
Facilita poder vaticinar las compras futuras, para ello las empresas recopilan
datos sobre una persona a partir de las compras con su tarjeta de crédito,
entre otros.
Es poderosa, pero puede ser costosa y debe estar coordinada.
Además, puede infringir la privacidad del consumidor o incluso los derechos
civiles de una persona.
Técnicas: Redes neuronales, regresión lineal, arboles de decisiones, modelos
estadísticos, agrupamiento o clustering, entre otros.
44. DISEÑO DE BASE DE DATOS
Almacenes Corporativo de Datos
Ejemplo de Minería de Datos
1. American Express ha sido líder en minería de datos para fines de marketing.
Ellos envía cupones de descuento para nuevas tiendas o entretenimiento
cuando le envía la factura de su tarjeta de crédito, habiendo determinado
que usted compró en tiendas similares o asistió a eventos similares.
2. General Motors ofrece una tarjeta MasterCard que permite a los clientes
acumular puntos de bonificación para la compra de un nuevo automóvil, y
después envía información sobre los nuevos vehículos en el momento en
que sería más probable que el consumidor esté interesado en comprar un
auto nuevo.