1. Palabras clave: base de datos, sistemas de gestión de archivos, sistema de gestión de bases de datos (SGBD),
sistema de base de datos, metadatos, modelo de datos.
Contenido
1
2
3
4
Conceptos de las bases de datos
Arquitecturas de las bases de datos
Modelos de datos
Bases de datos NoSQL
Bases de datos
Unidad 1 / Escenario 1
Lectura fundamental
2. 1. Conceptos de las bases de datos
En los negocios y en la vida cotidiana, las bases de datos están presentes desde antes de la apropiación
de las tecnologías de la información en la sociedad. Guardar los teléfonos y direcciones de clientes
en una libreta, registrar las transacciones de una empresa o mantener un registro de inventarios,
son actividades que en el pasado se han llevado a cabo con la ayuda de libretas, fichas o algún otro
mecanismo de registro. En general, los mencionados son ejemplos de bases de datos, aun cuando no
estén soportados sobre plataformas computacionales. En general, una base de datos puede utilizarse
manualmente o aprovechando herramientas informáticas.
1.1. Bases de datos
De acuerdo con Date (2001), una base de datos es “un conjunto de datos persistentes que es
utilizado por los sistemas de aplicación de alguna empresa dada” (Date, 2001, p.10). Es importante
aclarar que la palabra empresa se refiere a cualquier sujeto que haga uso de la base de datos como
tal. Para complementar la anterior definición, según Elmasri y Navathe (2007), una base de datos
“es una colección de datos relacionados. Con la palabra datos nos referimos a los hechos (datos)
conocidos que se pueden grabar y que tienen significado implícito” (Elmasri y Navathe, 2007, p.4).
Es de resaltar que, para aclarar estas definiciones, es necesario mencionar las siguientes propiedades
de las bases de datos (Elmasri y Navathe, 2007):
1. Representa algún aspecto del mundo real (UoD, universo del discurso).
2. Es una colección de datos con algún tipo de significado coherente.
3. Se diseña, construye y registra datos para un propósito específico.
Según lo anterior, una base de datos no es una serie de datos aleatorios. Estos provienen de un origen
dado y tiene una aplicación dada. Como se verá a continuación, el uso de sistemas informáticos
permite un mejor registro, acceso y modificación de los datos, para su mejor aprovechamiento.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 2
POLITÉCNICO GRANCOLOMBIANO 2
3. 1.2. Sistemas de gestión de archivos
Aún en nuestros días, es común encontrar oficinas que almacenan y procesan sus datos haciendo uso
de archivos tradicionales. Así, por ejemplo, muchas empresas llevan el registro de sus operaciones
en hojas de cálculo o archivos de texto. Sin embargo, este tratamiento de la información representa
algunos inconvenientes, los cuales se señalan a continuación:
• Redundancia de datos: al registrar información en archivos, estos a veces incluyen campos
que se repiten en distintos registros, lo que implica que al momento de modificar un dato
este se debe cambiar en todos los registros donde esté presente o genera inconsistencias e
información contradictoria.
• Difícil acceso a datos: en especial, cuando se manejan volúmenes crecientes de
información, buscar datos con determinados criterios puede llevar a que no sea
encontrados parcial o totalmente.
• Falta de relaciones entre datos: es común que, de acuerdo con su utilidad, los datos sean
almacenados en archivos diferentes. Esto conlleva a que sea difícil establecer relaciones entre
los datos como tal, que permitan aprovechar los recursos de información.
• Pérdida de integridad referencial: de la misma manera, tener diversos archivos que manejen
información distinta pero relacionada, implica la aparición de problemas de consistencia entre
los datos.
• Falta de atomicidad: cuando existan problemas en el almacenamiento de los datos es necesario
regresar a un estado en el cual el sistema sea consistente; tener la información en archivos no
permite mantener esa consistencia.
• Dificultades para acceso concurrente: si varios usuarios acceden simultáneamente a varios
archivos es difícil mantener la consistencia e integridad en los datos.
• Dificultades en seguridad: el acceso a ciertos recursos de información o a operaciones entre
datos requiere de ciertos privilegios para determinados perfiles de usuario. Los archivos, al
no contar con la estructura necesaria para una adecuada gestión de la información, también
dificultan la restricción adecuada al acceso de los datos.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 3
POLITÉCNICO GRANCOLOMBIANO 3
4. Por otra parte, cuando las bases de datos están soportadas sobre sistemas computacionales, las
aplicaciones adecuadas para administrar las bases de datos se denominan sistemas de gestión de bases
de datos (SGBD).
1.3. Sistemas de gestión de bases de datos (SGBD)
Un sistema de gestión de bases de Datos (o en inglés Database Management System – DBMS), es:
“Una colección de programas que permite a los usuarios crear y mantener una base de datos. Es
un sistema de software de propósito general que facilita los procesos de definición, construcción,
manipulación y compartición de las bases de datos entre varios usuario y aplicaciones” (Elmasri y
Navathe, 2007, p.5).
En otras palabras, son aquellos programas informáticos orientados, de manera específica, a definir,
construir y manipular datos por parte de uno o varios usuarios de manera simultánea y efectiva. En
el mercado encontramos algunos ejemplos de sistemas de gestión de bases de datos como: Oracle
Database, Microsoft SQL Server, MySQL, PostgreSQL, DB2 e incluso Access orientado a uso
personal y de pequeños negocios, el cual viene incluido en la suite de Office de Microsoft.
Es importante indicar que los SGBD, para poder efectuar sus tareas, definen a su vez información
acerca de los datos y de la estructura en que estos son almacenados. Dicho de otro modo, son datos
acerca de los datos que están almacenados; a los que se denominarán metadatos.
1.4. Sistemas de bases de datos
De acuerdo con Elmasri y Navathe (2007), se entiende como sistema de bases de datos a la
integración entre una base de datos (es decir, los datos e información como tal) y un sistema de
gestión de bases de datos. En estos sistemas, por lo general, se generan consultas para recuperar la
información almacenada y transacciones en las cuales se almacena o modifica información. La Figura
1 muestra la relación entre los conceptos mencionados.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 4
POLITÉCNICO GRANCOLOMBIANO 4
5. Figura 1. Entorno de un sistema de bases de datos
Fuente: elaboración propia
2. Modelos de datos
Un modelo de datos es una “colección de conceptos que se pueden utilizar para describir la estructura
de una base de datos” (Elmasri y Navathe, 2007, p.28). Estas incluyen las operaciones necesarias para
recuperar y actualizar los datos. Asimismo, por estructura de una base de datos entenderemos “los tipos de
datos, relaciones y restricciones que deben mantenerse para los datos” (Elmasri y Navathe, 2007, p.28).
2.1. Categorías de los modelos de datos
En general, se reconocen tres categorías de modelos de datos:
1. Modelos de alto nivel o modelos conceptuales, que representan más la forma en que los usuarios
se relacionan con los datos.
2. Modelos de datos representativos o modelos de implementación, que no se distancian
demasiado de la percepción de los datos por parte del usuario y a la vez no están tan lejos de la
manera en que los datos son almacenados.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 5
POLITÉCNICO GRANCOLOMBIANO 5
6. 3. Modelos de bajo nivel o modelos físicos, que son más parecidos a la manera en que se
almacenan los datos en el sistema.
2.1.1. Modelos conceptuales
En este tipo de modelo se emplean los conceptos de entidad, atributo y relación. Se entiende por
entidad un objeto de la realidad; por atributos, a aquellas propiedades o características de la entidad
y que la definen; y por relación entenderemos la asociación que se da entre dos o más entidades.
Así, por ejemplo, una entidad puede ser el “cliente” o el “producto” de una compañía; los atributos
de la entidad “cliente” pueden ser “edad”, “estado”, “teléfono” o “dirección” y una relación puede
estar dada por los productos que ha adquirido un cliente. Un modelo representativo de los modelos
conceptuales es el de entidad-relación (Figura 2), que se desarrollará más adelante.
Figura 2. Ejemplo de modelo entidad-relación
Fuente: elaboración propia
2.1.2. Modelos de datos representativos o de implementación
Estos, también denominados modelos lógicos, están más enfocados en las operaciones, que en la
descripción de la realidad. Entre estos modelos tenemos el modelo de datos jerárquico, el modelo de
datos de red, el modelo de datos relacional y el modelo de datos de objetos, los cuales se describen de
manera breve a continuación:
• Modelo de datos jerárquico
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 6
POLITÉCNICO GRANCOLOMBIANO 6
7. Organiza los registros en una estructura de árbol y emplea segmentos padre e hijo. Cada segmento es
equivalente a un registro de archivo (Figura 3). Entre las ventajas del modelo jerárquico tenemos
que promueve compartir datos, la simplicidad conceptual, la integridad y la eficiencia en las
relaciones 1:M (uno a muchos). Por otro lado, hace de la navegación algo complejo, no está
estandarizado, no posee un lenguaje de manipulación de datos y no permite tener múltiples padres
ni relaciones M:N (muchos a muchos).
Figura 3. Ejemplo de modelo de datos jerárquico
Fuente: elaboración propia
• Modelo de datos de red
A diferencia del modelo anterior, el de datos en red permite la presencia de múltiples padres, pues
posibilita los enlaces que establecen relaciones entre los registros (Figura 4). En este caso, las
relaciones son binarias y es posible tener múltiples relaciones que parten de un mismo registro.
Entre las ventajas de este modelo encontramos que promueve la integridad de las bases de datos
y se ajusta a los estándares y lenguajes de definición y manipulación de los sistemas de gestión de
bases de datos.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 7
POLITÉCNICO GRANCOLOMBIANO 7
8. Figura 4. Ejemplo de modelo de datos de red
Fuente: elaboración propia
• Modelo de datos relacional
El modelo de datos relacional fue propuesto por Edgar Frank “Ted” Codd (Codd, 1990), en los años
70. Utilizó el concepto de relación matemática (tabla), basándose en la teoría de conjuntos y la lógica
de predicados. Hoy es uno de los principales paradigmas en el diseño de bases de datos (Figura 5).
El principal concepto del modelo relacional es el uso de relaciones denominadas tuplas, que en la
práctica se encuentran en tablas compuestas por registros o tuplas organizadas en filas (una fila será
entonces una tupla o registro); cada columna correspondería a un campo (Todd, 1976). Entre las
ventajas de este modelo está su facilidad en el diseño, implementación, utilización y administración;
así como su capacidad de acomodarse a lenguajes como SQL y su poder de mantener la integridad
referencial. Por otro lado, requiere de una sólida capacitación a los usuarios.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 8
POLITÉCNICO GRANCOLOMBIANO 8
9. Figura 5. Ejemplo de modelo relacional
Fuente: elaboración propia
• Modelo de datos orientado a objetos
Debido al desarrollo de los lenguajes orientados a objetos, como C#, Java C++, entre otros,
en ocasiones existían ciertas dificultades de adaptar las estructuras de datos de los sistemas de
administración de bases de datos a las clases y objetos utilizados en los lenguajes de programación.
Por esta razón, surgió el grupo de modelos de datos de objetos: ODMG (por sus siglas en inglés)
(Object Data Management Group, 2017).
Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con lenguajes
de programación orientados a objetos, como Java, C#, Visual Basic.NET y C++. Los ODBMS usan
exactamente el mismo modelo que estos lenguajes de programación. De la misma forma, modelos
como los mencionados en los apartados anteriores tienen deficiencias en cumplir los requerimientos
de los sistemas de información geográfica, sistemas de diseño y manufactura asistidos por
computador o multimedia (Figura 6).
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 9
POLITÉCNICO GRANCOLOMBIANO 9
10. Contar con un modelo orientado a objetos mejora el rendimiento y la consistencia de los datos
cuando se integran con lenguajes de programación.
Figura 6. Ejemplo de modelo de datos de objetos
Fuente: elaboración propia.
• Modelo de lenguaje de marcado extendido (XML eXended Markup Languaje)
Es un modelo ampliamente utilizado para el intercambio electrónico de datos en Internet. Utiliza una
estructura a manera de árbol jerárquico con el apoyo de etiquetas (Figura 7).
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 10
POLITÉCNICO GRANCOLOMBIANO 10
11. <libros>
<libro ISBN= “213123123”>
<titulo>Los días y noches</titulo>
<autor>Luis Díaz</autor>
</libro>
<libro ISBN= “2133424323”>
<titulo>La caza del enemigo</titulo>
<autor>Pepe Suárez</autor>
</libro>
<libro ISBN= “2131234545”>
<titulo>El ultimo amigo</titulo>
<autor>Javier Sánchez</autor>
</libro>
<libro ISBN= “2145345429”>
<titulo>Cuando los cóndores anidan</ti-
tulo>
<autor>Miguel de la Vega</autor>
Figura 7. Ejemplo de modelo de lenguaje de marcado extendido
Fuente: elaboración propia.
3. Arquitecturas de las bases de datos
En este documento se presenta lo que se denomina una arquitectura de tres niveles: nivel interno,
conceptual y externo (Figura 8) (Elmasri y Navathe, 2007, p.31). Esta arquitectura también es
denominada ANSI/SPARC (Tsangaris y Klug, 1978).
3.1. Nivel interno
En este se describe de forma detallada cómo están almacenados físicamente los datos. Incluye
aspectos relacionados con el lugar de almacenamiento de datos, las rutas de acceso, los archivos, los
caracteres separadores, etc.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 11
POLITÉCNICO GRANCOLOMBIANO 11
12. 3.2. Nivel conceptual
Este se centra de manera principal en describir las entidades, atributos, relaciones, operaciones, tipos
de datos y restricciones de la base de datos, sin tener en cuenta los aspectos físicos de esta.
3.3. Nivel externo
Se enfoca en cómo los usuarios tienen acceso a la información suministrada por la base de datos.
Figura 8. Arquitectura de tres niveles
Fuente: elaboración propia.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 12
POLITÉCNICO GRANCOLOMBIANO 12
13. 4. Bases de datos NoSQL
EL término NoSQL proviene de “Not Only SQL”. Corresponde a una nueva generación de sistemas
de gestión de bases de datos, que busca superar las limitaciones de las bases de datos relacionales. En
general, estas últimas están orientadas a administrar datos estructurados, con un formato fijo y unos
campos muy bien definidos. Sin embargo, en el entorno actual de Internet y de grandes volúmenes
de datos, se requiere mayor flexibilidad en el manejo de los datos. Así, NoSQL maneja tanto los datos
estructurados como los no estructurados. NoSQL está enfocado a proporcionar:
• Escalabilidad
• Rendimiento
• Alta disponibilidad
• API “Interfaz de Programación de Aplicaciones” (Aplication Programming Interface) simple
• Esquema libre
• Fácil replicación.
• Finalmente consistente (no ácido)
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 13
POLITÉCNICO GRANCOLOMBIANO 13
14. Referencias
Codd, E. F. (1990). The Relational Model for Database Management. USA: Addison - Wesley
Publishing Company.
Date, C. (2001). Introducción a los sistemas de bases de datos. Naucalpan de Juárez, México:
Pearson Education.
Elmasri, R. y Navathe, S. (2007). Fundamentos de Sistemas de Bases de Datos. Madrid: Pearson,
Addison Wesley.
Object Data Management Group. (2017). ODMG Standard. Recuperado de http://www.odbms.org/
odmg-standard/
Todd, S. J. P. (1976). The Peterlee Relational Test Vehicle #x2014;a system overview. IBM Systems
Journal, 15(4), 285–308. https://doi.org/10.1147/sj.154.0285
Tsangaris, M. y Klug, A. (1978). The ANSI/X3/SPARC DBMS Framework. AFIPS Press.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 14
POLITÉCNICO GRANCOLOMBIANO 14
15. INFORMACIÓN TÉCNICA
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 15
POLITÉCNICO GRANCOLOMBIANO 15
Módulo: Fundamentos de bases de datos
Unidad 1: Generalidades y conceptos de bases de datos
Escenario 1: Generalidades de las bases de datos
Autor: Luis Ernesto Leyva Camargo
Asesor Pedagógico: María del Pilar Rivera Acosta
Diseñador Gráfico: David Alfonso Rivera
Asistente: Jhon Edwar Vargas
Este material pertenece al Politécnico Grancolombiano.
Prohibida su reproducción total o parcial.