Este documento presenta un resumen de los conceptos básicos sobre bases de datos, incluyendo la evolución de los modelos de bases de datos, los tipos principales de bases de datos, los métodos de diseño de bases de datos y las ventajas de los sistemas de bases de datos. Explica brevemente los modelos jerárquico, de red y relacional, así como los enfoques emergentes como Hadoop, entidad-atributo-valor y NoSQL.
1. MODELO DE DATOS
M.SC. ALDO VALDEZ ALVARADO
Preparado como parte de los contenidos de la Asignatura
Diseño y Administración de Base de Datos
UNIVERSIDAD MAYOR DE SAN ANDRÉS
CARRERA DE INFORMÁTICA
2. Conceptos sobre Bases de Datos
Evolución del Modelado de Bases de Datos
Tipos de Bases de Datos
Métodos de Diseño de Bases de Datos
Ventajas de un Sistema de Bases de Datos
Índice
1
2
3
4
5
6. La búsqueda del
conocimiento empezaba con
grandes teorías, ahora
empieza con grandes
cantidades de datos.
Bienvenidos a la era del
Petabyte.
Introducción
7. En 2007 solo el 7% de la
información estaba en
medios analógicos (libros,
revistas, fotografías en papel,
etc.)
8. En 2012 la información
digital alcanzó a nivel mundial
2.837 exabytes (miles de
millones de gigabytes).
Puestos en DVDs, la torre
sería de 400.000 Kms, más
que la distancia de la Tierra a
la Luna.
9. Google procesa más de 24
Petabytes/día, información
equivalente a varios miles de
veces la biblioteca del
congreso de USA
10. • Información es conocimiento
– Albert Einstein
• Conocimiento es Poder
– Sir Francis Bacon
• Con un gran poder se tiene una gran
responsabilidad
– Tío Ben
11. Los datos serán el
centro de los
principales
problemas y
eventos de
nuestras vidas.
12.
13.
14.
15.
16.
17.
18.
19. Una Base de Datos es una colección de
información, preferiblemente información
relacionada y preferiblemente información
organizada. (Powell, 2006)
20. Un sistema de base de datos (SBD) es un
sistema de registros computarizado con el
propósito general de mantener la información y
ponerla a disposición cuando sea necesario. La
base de datos normalmente almacena datos
relacionados en un sistema informático. (Foster
& Shripad, 2016)
21. Un sistema gestor de base de datos (DBMS) es
un conjunto de programas que permiten la
administración de una base de datos.(Foster &
Shripad, 2016)
22. Base de Datos
Una base de datos consiste de archivos físicos, que se
configuran en un ordenador, cuando se instala un gestor
de base de datos. Un modelo de base de datos, es más un
concepto que un objeto físico y se usa para crear tablas en
una base de datos. (Powell, 2006)
23. Base de Datos
Una base de datos es un objeto estructurado. Este objeto
consiste de datos y metadatos. Los datos son la
información descriptiva almacenada actualmente en una
base de datos. Los metadatos describen la estructura
aplicada por la base de datos a los datos del cliente, es
decir, la definición de la tabla del cliente, que contiene
campos que tienen una longitud y un tipo de dato, estos
metadatos aplican la estructura y organización a los datos.
(Powell, 2006)
24.
25. Modelo de Base de Datos
Un modelo de base de datos o un modelo de datos puede
ser usado para describir un conjunto de información
ordenada y organizada que se encuentran almacenadas en
un ordenador, usualmente estructurada usando un tipo de
modelo de datos, que además puede ser modificada para
permitir cambios eficientes en los datos. (Powell, 2006)
27. Todos los modelos de datos anteriores al modelo
de datos relacional, fueron soluciones parciales al
eterno problema sobre como almacenar datos y
como hacerlo de manera eficiente. Actualmente el
modelo de datos relacional es la mejor solución
tanto para almacenar como para recuperar datos.
(Powell, 2006)
28.
29. Sistemas de Archivos
Usando un modelo de datos, como un sistema de
archivos implica que no se han aplicado técnicas de
modelado y que los modelos de datos están
almacenados en archivos de texto planos (aquellos
que no tienen ninguna estructura), en un sistema de
archivos, utilizando solamente la estructura del
sistema operativo. (Powell, 2006)
30. Modelo de Datos Jerárquico
Este modelo de datos tiene una estructura tipo árbol
invertido. Las tablas de este modelo tienen una
relación padre – hijo. Cada tabla hijo tiene una sola
tabla padre, y cada tabla padre puede tener muchas
tablas hijo. Las tablas hijo son completamente
dependientes de las tablas padre, por lo que una
tabla hija solo puede existir, si existe una tabla padre.
(Powell, 2006)
31. Modelo de Datos Jerárquico
El resultado de esta
estructura hace que el
modelo de datos jerárquico
soporte relaciones del tipo
uno a muchos. (Powell,
2006)
32. Modelo de Datos de Red
Este modelo de datos es un refinamiento del modelo
de datos jerárquico. El modelo de red permite a las
tablas hijo tener más de un padre, así se crea una
estructura de tablas tipo red. Múltiples tablas padre
para cada hijo permiten relaciones muchos a
muchos, en adición a las relaciones uno a muchos
del modelo jerárquico. (Powell, 2006)
33.
34. Modelo de Datos Relacional
El modelo de datos relacional mejora la restricción
de la estructura jerárquica, de tal manera que
cualquier tabla puede ser accedida directamente sin
tener que acceder a todos los objetos padres. Otro
beneficio, es que cualquier tabla se puede relacionar
con otra, independientemente de su posición en la
jerarquía. (Powell, 2006)
35. Modelo de Datos Relacional
Cualquier tabla se puede
relacionar, tanto con
cualquier número de tablas
padre, como con cualquier
número de tablas hija.
(Powell, 2006)
36. Modelo de Datos Relacional
Un sistema gestor de base de datos relacional
(SGBDR) es un término usado para describir un
conjunto completo de programas que permiten tanto
gestionar la base de datos relacional, como
comunicarse con el motor de la base de datos
relacional. (Powell, 2006)
37. Modelo de Datos Relacional
Las bases de datos relacionales fueron inventadas
por el investigador de IBM llamado Dr. E. F. Codd. El
modelo de datos relacional, comenzó con la idea de
obtener grupos de datos de un conjunto de datos
muy grande, a partir de remover los duplicados,
usando para ello un proceso conocido como
normalización. (Powell, 2006)
38. Modelo de Datos Relacional
La normalización esta compuesta de un número de
pasos denominados formas normales. El resultado
fue un lenguaje de acceso general a los datos,
llamado Lenguaje Estructurado de Consulta (SQL),
que permite consultas sobre estructuras de datos
organizados. (Powell, 2006)
39.
40. Modelo de Datos Orientado
a Objetos
Este modelo provee una estructura tridimensional
de datos, donde cualquier ítem en una base de datos
puede ser recuperada, desde cualquier punto muy
rápidamente. Mientras que el modelo de datos
relacional se presta a recuperar grupos de registros
solo en dos dimensiones, el modelo orientado a
objetos es eficiente encontrando ítems únicos.
(Powell, 2006)
41. Modelo de Datos Orientado
a Objetos
El modelo de datos orientado
a objetos tiene un
rendimiento muy pobre
cuando recupera mas de un
simple ítem, en el que el
modelo de datos relacional es
muy competente. (Powell,
2006)
42. Modelo de Datos Objeto
Relacional
El modelo de datos objeto relacional fue creado como
respuesta a los conflictos entre las capacidades de
los modelos relacionales y orientados a objetos. Las
capacidades de modelado de bases de datos
orientadas a objetos están incluidas en las bases de
datos relacionales, pero no al revés. (Powell, 2006)
43. Modelo de Datos Objeto
Relacional
Muchas bases de datos relacionales ahora permiten
el almacenamiento de objetos binarios y capacidades
limitadas de codificación de métodos de objetos,
con diversos grados de éxito.(Powell, 2006)
44. Modelo de Datos Objeto
Relacional
El mayor problema con el almacenamiento de objetos
binarios en una base de datos relacional es que los
objetos potencialmente grandes se almacenan en
lo que en realidad es un elemento estructural de
pequeña escala como una sola entrada de registro
de campo en una tabla.(Powell, 2006)
45. Modelo de Datos Objeto
Relacional
Este no es siempre el caso, porque algunas bases de
datos relacionales permiten el almacenamiento de
objetos binarios en archivos de disco separados,
fuera de las estructuras de registros bidimensionales
de la tabla.(Powell, 2006)
47. Las bases de datos se dividen funcionalmente en
tres categorías generales:
• Transaccionales
• Sistemas de Soporte a la Toma de Decisiones
• Híbridos
48. Bases de Datos Transaccionales
La función primaria de este tipo de Base de Datos es:
adicionar nuevos datos, cambiar datos existentes,
borrar datos existentes, todo realizado en pequeños
cambios a la base de datos, es decir, pequeñas
transacciones.(Powell, 2006)
Algunos ejemplos de este tipo de base de datos son:
• Bases de datos Cliente – Servidor. Usualmente
atendidos a baja concurrencia y bajo
rendimiento al mismo tiempo.
49. Bases de Datos Transaccionales
• Bases de datos OLTP.
Causan problemas con
la concurrencia debido
al número de usuarios
que se puede alcanzar
por Internet.
50. Bases de Datos que Soportan
Decisiones
Este tipo de base de datos, soportan las decisiones
de un tipo gerencial (Powell, 2006), algunos ejemplos
de este tipo de base de datos son:
• Base de Datos Data warehouse. Contienen datos
históricos, y son mucho mas grandes que una
base de datos OLTP.
51. Bases de Datos que Soportan
Decisiones
• Data marts. Esencialmente
es un pequeño subconjunto
de un data warehouse.
• Base de Datos de Reportes.
Es un tipo de base de datos
de Data Warehouse, pero
que contiene solamente
datos activos.
52. Bases de Datos Hibridas
Una base de datos híbrida, es simplemente una
mezcla que contiene requisitos de concurrencia de
tipo OLTP y requisitos de rendimiento de tipo Data
Warehouse.(Powell, 2006)
53. Además de las bases de datos contemporáneas
dominantes, hay tres enfoques de bases de datos
emergentes que son dignos de mención
• Hadoop
• Modelo Entidad – Atributo – Valor
• NoSQL
54. Hadoop
Describe un marco para
manejar el
procesamiento
distribuido de grandes
conjuntos de
datos.(Foster, 2016)
55. Modelo Entidad – Atributo – Valor
Este enfoque reduce una base de datos a tres
principales entidades de almacenamiento: una
entidad para definir otras entidades; una entidad
para definir propiedades (atributos) de entidades;
una entidad EAV que conecta las otras dos
entidades y valores almacenados para
combinaciones de entidad-atributo.(Foster, 2016)
56. NoSQL
Las bases de datos no relacionales están diseñados
para administrar grandes conjuntos de datos, a la
vez que proporcionan beneficios tales como
flexibilidad, escalabilidad, disponibilidad, costos más
bajos y capacidades especiales.(Foster, 2016)
58. A continuación se presenta la secuencia de pasos
para el diseño de un modelo de base de datos:
• Análisis de Requerimientos. Se recolecta
información sobre la naturaleza de los datos,
características requeridas y cualquier otra
necesidad especial, como las respuestas a
salidas esperadas.
• Diseño Conceptual. En este se usa los
diagramas Entidad – Relación, que incluye el
modelo relacional hasta la normalización.
59. • Diseño Lógico. Se crea comandos del
lenguaje de base de datos para generar
definiciones de tablas. Se generan scripts del
lenguaje de definición de datos (DDL).
• Diseño Físico. Se ajusta los comandos del
lenguaje de la base de datos para alterar el
modelo para los atributos físicos subyacentes
de las tablas.
61. Según Foster (2016) algunas ventajas son:
• La redundancia se puede reducir.
• Se pueden evitar las inconsistencias.
• Los datos pueden ser compartidos.
• Los estándares pueden ser aplicados.
• Se pueden aplicar restricciones de
seguridad.
• Se puede mantener la integridad.
• Los requisitos contradictorios pueden ser
equilibrados.
62. • El rendimiento se mejora debido a la
velocidad de procesamiento, la reducción de
papeleo, etc.
• El mantenimiento y la recuperación de datos
son muy fáciles; no se necesita un programa
complicado.
• No depende únicamente de la programación
de lenguaje de alto nivel para su uso.
63. • Las vistas lógicas de los datos almacenados
se pueden crear fácilmente.
• Las estructuras de registro pueden cambiar
sin ningún efecto adverso en la recuperación
de datos (debido a la independencia de datos
físicos y lógicos).
64. Aldo Ramiro Valdez Alvarado
Licenciado en Informática
Master en Dirección Estrategica en
Tecnologías de la Información
Máster en Business Intelligence y Big Data
Docente Titular de Pregrado en la UMSA
Docente de Postgrado en la UMSA
Ex - Coordinador del Postgrado en
Informática UMSA
Conferencista Nacional e Internacional
http://aldovaldezalvarado.blogspot.com/
https://www.linkedin.com/in/msc-aldo-
valdez-alvarado-17464820
aldo_valdez@hotmail.com
Muchas Gracias!!!