SlideShare una empresa de Scribd logo
1 de 15
Descargar para leer sin conexión
Palabras clave: base de datos, sistemas de gestión de archivos, sistema de gestión de bases de datos (SGBD),
sistema de base de datos, metadatos, modelo de datos.
Contenido
1
2
3
4
Conceptos de las bases de datos
Arquitecturas de las bases de datos
Modelos de datos
Bases de datos NoSQL
Bases de datos
Unidad 1 / Escenario 1
Lectura fundamental
1. Conceptos de las bases de datos
En los negocios y en la vida cotidiana, las bases de datos están presentes desde antes de la apropiación
de las tecnologías de la información en la sociedad. Guardar los teléfonos y direcciones de clientes
en una libreta, registrar las transacciones de una empresa o mantener un registro de inventarios,
son actividades que en el pasado se han llevado a cabo con la ayuda de libretas, fichas o algún otro
mecanismo de registro. En general, los mencionados son ejemplos de bases de datos, aun cuando no
estén soportados sobre plataformas computacionales. En general, una base de datos puede utilizarse
manualmente o aprovechando herramientas informáticas.
1.1. Bases de datos
De acuerdo con Date (2001), una base de datos es “un conjunto de datos persistentes que es
utilizado por los sistemas de aplicación de alguna empresa dada” (Date, 2001, p.10). Es importante
aclarar que la palabra empresa se refiere a cualquier sujeto que haga uso de la base de datos como
tal. Para complementar la anterior definición, según Elmasri y Navathe (2007), una base de datos
“es una colección de datos relacionados. Con la palabra datos nos referimos a los hechos (datos)
conocidos que se pueden grabar y que tienen significado implícito” (Elmasri y Navathe, 2007, p.4).
Es de resaltar que, para aclarar estas definiciones, es necesario mencionar las siguientes propiedades
de las bases de datos (Elmasri y Navathe, 2007):
1. Representa algún aspecto del mundo real (UoD, universo del discurso).
2. Es una colección de datos con algún tipo de significado coherente.
3. Se diseña, construye y registra datos para un propósito específico.
Según lo anterior, una base de datos no es una serie de datos aleatorios. Estos provienen de un origen
dado y tiene una aplicación dada. Como se verá a continuación, el uso de sistemas informáticos
permite un mejor registro, acceso y modificación de los datos, para su mejor aprovechamiento.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 2
POLITÉCNICO GRANCOLOMBIANO 2
1.2. Sistemas de gestión de archivos
Aún en nuestros días, es común encontrar oficinas que almacenan y procesan sus datos haciendo uso
de archivos tradicionales. Así, por ejemplo, muchas empresas llevan el registro de sus operaciones
en hojas de cálculo o archivos de texto. Sin embargo, este tratamiento de la información representa
algunos inconvenientes, los cuales se señalan a continuación:
• Redundancia de datos: al registrar información en archivos, estos a veces incluyen campos
que se repiten en distintos registros, lo que implica que al momento de modificar un dato
este se debe cambiar en todos los registros donde esté presente o genera inconsistencias e
información contradictoria.
• Difícil acceso a datos: en especial, cuando se manejan volúmenes crecientes de
información, buscar datos con determinados criterios puede llevar a que no sea
encontrados parcial o totalmente.
• Falta de relaciones entre datos: es común que, de acuerdo con su utilidad, los datos sean
almacenados en archivos diferentes. Esto conlleva a que sea difícil establecer relaciones entre
los datos como tal, que permitan aprovechar los recursos de información.
• Pérdida de integridad referencial: de la misma manera, tener diversos archivos que manejen
información distinta pero relacionada, implica la aparición de problemas de consistencia entre
los datos.
• Falta de atomicidad: cuando existan problemas en el almacenamiento de los datos es necesario
regresar a un estado en el cual el sistema sea consistente; tener la información en archivos no
permite mantener esa consistencia.
• Dificultades para acceso concurrente: si varios usuarios acceden simultáneamente a varios
archivos es difícil mantener la consistencia e integridad en los datos.
• Dificultades en seguridad: el acceso a ciertos recursos de información o a operaciones entre
datos requiere de ciertos privilegios para determinados perfiles de usuario. Los archivos, al
no contar con la estructura necesaria para una adecuada gestión de la información, también
dificultan la restricción adecuada al acceso de los datos.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 3
POLITÉCNICO GRANCOLOMBIANO 3
Por otra parte, cuando las bases de datos están soportadas sobre sistemas computacionales, las
aplicaciones adecuadas para administrar las bases de datos se denominan sistemas de gestión de bases
de datos (SGBD).
1.3. Sistemas de gestión de bases de datos (SGBD)
Un sistema de gestión de bases de Datos (o en inglés Database Management System – DBMS), es:
“Una colección de programas que permite a los usuarios crear y mantener una base de datos. Es
un sistema de software de propósito general que facilita los procesos de definición, construcción,
manipulación y compartición de las bases de datos entre varios usuario y aplicaciones” (Elmasri y
Navathe, 2007, p.5).
En otras palabras, son aquellos programas informáticos orientados, de manera específica, a definir,
construir y manipular datos por parte de uno o varios usuarios de manera simultánea y efectiva. En
el mercado encontramos algunos ejemplos de sistemas de gestión de bases de datos como: Oracle
Database, Microsoft SQL Server, MySQL, PostgreSQL, DB2 e incluso Access orientado a uso
personal y de pequeños negocios, el cual viene incluido en la suite de Office de Microsoft.
Es importante indicar que los SGBD, para poder efectuar sus tareas, definen a su vez información
acerca de los datos y de la estructura en que estos son almacenados. Dicho de otro modo, son datos
acerca de los datos que están almacenados; a los que se denominarán metadatos.
1.4. Sistemas de bases de datos
De acuerdo con Elmasri y Navathe (2007), se entiende como sistema de bases de datos a la
integración entre una base de datos (es decir, los datos e información como tal) y un sistema de
gestión de bases de datos. En estos sistemas, por lo general, se generan consultas para recuperar la
información almacenada y transacciones en las cuales se almacena o modifica información. La Figura
1 muestra la relación entre los conceptos mencionados.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 4
POLITÉCNICO GRANCOLOMBIANO 4
Figura 1. Entorno de un sistema de bases de datos
Fuente: elaboración propia
2. Modelos de datos
Un modelo de datos es una “colección de conceptos que se pueden utilizar para describir la estructura
de una base de datos” (Elmasri y Navathe, 2007, p.28). Estas incluyen las operaciones necesarias para
recuperar y actualizar los datos. Asimismo, por estructura de una base de datos entenderemos “los tipos de
datos, relaciones y restricciones que deben mantenerse para los datos” (Elmasri y Navathe, 2007, p.28).
2.1. Categorías de los modelos de datos
En general, se reconocen tres categorías de modelos de datos:
1. Modelos de alto nivel o modelos conceptuales, que representan más la forma en que los usuarios
se relacionan con los datos.
2. Modelos de datos representativos o modelos de implementación, que no se distancian
demasiado de la percepción de los datos por parte del usuario y a la vez no están tan lejos de la
manera en que los datos son almacenados.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 5
POLITÉCNICO GRANCOLOMBIANO 5
3. Modelos de bajo nivel o modelos físicos, que son más parecidos a la manera en que se
almacenan los datos en el sistema.
2.1.1. Modelos conceptuales
En este tipo de modelo se emplean los conceptos de entidad, atributo y relación. Se entiende por
entidad un objeto de la realidad; por atributos, a aquellas propiedades o características de la entidad
y que la definen; y por relación entenderemos la asociación que se da entre dos o más entidades.
Así, por ejemplo, una entidad puede ser el “cliente” o el “producto” de una compañía; los atributos
de la entidad “cliente” pueden ser “edad”, “estado”, “teléfono” o “dirección” y una relación puede
estar dada por los productos que ha adquirido un cliente. Un modelo representativo de los modelos
conceptuales es el de entidad-relación (Figura 2), que se desarrollará más adelante.
Figura 2. Ejemplo de modelo entidad-relación
Fuente: elaboración propia
2.1.2. Modelos de datos representativos o de implementación
Estos, también denominados modelos lógicos, están más enfocados en las operaciones, que en la
descripción de la realidad. Entre estos modelos tenemos el modelo de datos jerárquico, el modelo de
datos de red, el modelo de datos relacional y el modelo de datos de objetos, los cuales se describen de
manera breve a continuación:
• Modelo de datos jerárquico
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 6
POLITÉCNICO GRANCOLOMBIANO 6
Organiza los registros en una estructura de árbol y emplea segmentos padre e hijo. Cada segmento es
equivalente a un registro de archivo (Figura 3). Entre las ventajas del modelo jerárquico tenemos
que promueve compartir datos, la simplicidad conceptual, la integridad y la eficiencia en las
relaciones 1:M (uno a muchos). Por otro lado, hace de la navegación algo complejo, no está
estandarizado, no posee un lenguaje de manipulación de datos y no permite tener múltiples padres
ni relaciones M:N (muchos a muchos).
Figura 3. Ejemplo de modelo de datos jerárquico
Fuente: elaboración propia
• Modelo de datos de red
A diferencia del modelo anterior, el de datos en red permite la presencia de múltiples padres, pues
posibilita los enlaces que establecen relaciones entre los registros (Figura 4). En este caso, las
relaciones son binarias y es posible tener múltiples relaciones que parten de un mismo registro.
Entre las ventajas de este modelo encontramos que promueve la integridad de las bases de datos
y se ajusta a los estándares y lenguajes de definición y manipulación de los sistemas de gestión de
bases de datos.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 7
POLITÉCNICO GRANCOLOMBIANO 7
Figura 4. Ejemplo de modelo de datos de red
Fuente: elaboración propia
• Modelo de datos relacional
El modelo de datos relacional fue propuesto por Edgar Frank “Ted” Codd (Codd, 1990), en los años
70. Utilizó el concepto de relación matemática (tabla), basándose en la teoría de conjuntos y la lógica
de predicados. Hoy es uno de los principales paradigmas en el diseño de bases de datos (Figura 5).
El principal concepto del modelo relacional es el uso de relaciones denominadas tuplas, que en la
práctica se encuentran en tablas compuestas por registros o tuplas organizadas en filas (una fila será
entonces una tupla o registro); cada columna correspondería a un campo (Todd, 1976). Entre las
ventajas de este modelo está su facilidad en el diseño, implementación, utilización y administración;
así como su capacidad de acomodarse a lenguajes como SQL y su poder de mantener la integridad
referencial. Por otro lado, requiere de una sólida capacitación a los usuarios.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 8
POLITÉCNICO GRANCOLOMBIANO 8
Figura 5. Ejemplo de modelo relacional
Fuente: elaboración propia
• Modelo de datos orientado a objetos
Debido al desarrollo de los lenguajes orientados a objetos, como C#, Java C++, entre otros,
en ocasiones existían ciertas dificultades de adaptar las estructuras de datos de los sistemas de
administración de bases de datos a las clases y objetos utilizados en los lenguajes de programación.
Por esta razón, surgió el grupo de modelos de datos de objetos: ODMG (por sus siglas en inglés)
(Object Data Management Group, 2017).
Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con lenguajes
de programación orientados a objetos, como Java, C#, Visual Basic.NET y C++. Los ODBMS usan
exactamente el mismo modelo que estos lenguajes de programación. De la misma forma, modelos
como los mencionados en los apartados anteriores tienen deficiencias en cumplir los requerimientos
de los sistemas de información geográfica, sistemas de diseño y manufactura asistidos por
computador o multimedia (Figura 6).
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 9
POLITÉCNICO GRANCOLOMBIANO 9
Contar con un modelo orientado a objetos mejora el rendimiento y la consistencia de los datos
cuando se integran con lenguajes de programación.
Figura 6. Ejemplo de modelo de datos de objetos
Fuente: elaboración propia.
• Modelo de lenguaje de marcado extendido (XML eXended Markup Languaje)
Es un modelo ampliamente utilizado para el intercambio electrónico de datos en Internet. Utiliza una
estructura a manera de árbol jerárquico con el apoyo de etiquetas (Figura 7).
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 10
POLITÉCNICO GRANCOLOMBIANO 10
<libros>
<libro ISBN= “213123123”>
<titulo>Los días y noches</titulo>
<autor>Luis Díaz</autor>
</libro>
<libro ISBN= “2133424323”>
<titulo>La caza del enemigo</titulo>
<autor>Pepe Suárez</autor>
</libro>
<libro ISBN= “2131234545”>
<titulo>El ultimo amigo</titulo>
<autor>Javier Sánchez</autor>
</libro>
<libro ISBN= “2145345429”>
<titulo>Cuando los cóndores anidan</ti-
tulo>
<autor>Miguel de la Vega</autor>
Figura 7. Ejemplo de modelo de lenguaje de marcado extendido
Fuente: elaboración propia.
3. Arquitecturas de las bases de datos
En este documento se presenta lo que se denomina una arquitectura de tres niveles: nivel interno,
conceptual y externo (Figura 8) (Elmasri y Navathe, 2007, p.31). Esta arquitectura también es
denominada ANSI/SPARC (Tsangaris y Klug, 1978).
3.1. Nivel interno
En este se describe de forma detallada cómo están almacenados físicamente los datos. Incluye
aspectos relacionados con el lugar de almacenamiento de datos, las rutas de acceso, los archivos, los
caracteres separadores, etc.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 11
POLITÉCNICO GRANCOLOMBIANO 11
3.2. Nivel conceptual
Este se centra de manera principal en describir las entidades, atributos, relaciones, operaciones, tipos
de datos y restricciones de la base de datos, sin tener en cuenta los aspectos físicos de esta.
3.3. Nivel externo
Se enfoca en cómo los usuarios tienen acceso a la información suministrada por la base de datos.
Figura 8. Arquitectura de tres niveles
Fuente: elaboración propia.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 12
POLITÉCNICO GRANCOLOMBIANO 12
4. Bases de datos NoSQL
EL término NoSQL proviene de “Not Only SQL”. Corresponde a una nueva generación de sistemas
de gestión de bases de datos, que busca superar las limitaciones de las bases de datos relacionales. En
general, estas últimas están orientadas a administrar datos estructurados, con un formato fijo y unos
campos muy bien definidos. Sin embargo, en el entorno actual de Internet y de grandes volúmenes
de datos, se requiere mayor flexibilidad en el manejo de los datos. Así, NoSQL maneja tanto los datos
estructurados como los no estructurados. NoSQL está enfocado a proporcionar:
• Escalabilidad
• Rendimiento
• Alta disponibilidad
• API “Interfaz de Programación de Aplicaciones” (Aplication Programming Interface) simple
• Esquema libre
• Fácil replicación.
• Finalmente consistente (no ácido)
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 13
POLITÉCNICO GRANCOLOMBIANO 13
Referencias
Codd, E. F. (1990). The Relational Model for Database Management. USA: Addison - Wesley
Publishing Company.
Date, C. (2001). Introducción a los sistemas de bases de datos. Naucalpan de Juárez, México:
Pearson Education.
Elmasri, R. y Navathe, S. (2007). Fundamentos de Sistemas de Bases de Datos. Madrid: Pearson,
Addison Wesley.
Object Data Management Group. (2017). ODMG Standard. Recuperado de http://www.odbms.org/
odmg-standard/
Todd, S. J. P. (1976). The Peterlee Relational Test Vehicle #x2014;a system overview. IBM Systems
Journal, 15(4), 285–308. https://doi.org/10.1147/sj.154.0285
Tsangaris, M. y Klug, A. (1978). The ANSI/X3/SPARC DBMS Framework. AFIPS Press.
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 14
POLITÉCNICO GRANCOLOMBIANO 14
INFORMACIÓN TÉCNICA
POLITÉCNICO GRANCOLOMBIANO
POLITÉCNICO GRANCOLOMBIANO 15
POLITÉCNICO GRANCOLOMBIANO 15
Módulo: Fundamentos de bases de datos
Unidad 1: Generalidades y conceptos de bases de datos
Escenario 1: Generalidades de las bases de datos
Autor: Luis Ernesto Leyva Camargo
Asesor Pedagógico: María del Pilar Rivera Acosta
Diseñador Gráfico: David Alfonso Rivera
Asistente: Jhon Edwar Vargas
Este material pertenece al Politécnico Grancolombiano.
Prohibida su reproducción total o parcial.

Más contenido relacionado

Similar a lectura-20-fundamental-201.pdf

Similar a lectura-20-fundamental-201.pdf (20)

Resumen de base de datos
Resumen de base de datosResumen de base de datos
Resumen de base de datos
 
¿QUE ES UNA BASE DE DATOS? ¿COMO ES? ¿Y PARA QUE SIRVE?
¿QUE ES UNA BASE DE DATOS? ¿COMO ES? ¿Y PARA QUE SIRVE?¿QUE ES UNA BASE DE DATOS? ¿COMO ES? ¿Y PARA QUE SIRVE?
¿QUE ES UNA BASE DE DATOS? ¿COMO ES? ¿Y PARA QUE SIRVE?
 
Base de datos 1
Base de datos 1Base de datos 1
Base de datos 1
 
Tecnologia Base Datos - Introduccion
Tecnologia Base Datos - IntroduccionTecnologia Base Datos - Introduccion
Tecnologia Base Datos - Introduccion
 
Funciones de un dba y tipos de base de datos
Funciones de un dba y tipos de base de datosFunciones de un dba y tipos de base de datos
Funciones de un dba y tipos de base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Tematica once
Tematica onceTematica once
Tematica once
 
Base de datos (william mata 26550902)
Base de datos (william mata 26550902)Base de datos (william mata 26550902)
Base de datos (william mata 26550902)
 
Basedatos
BasedatosBasedatos
Basedatos
 
Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
 
Presentación
PresentaciónPresentación
Presentación
 
Tutorial de bd
Tutorial de bdTutorial de bd
Tutorial de bd
 
Base de datos
Base de datosBase de datos
Base de datos
 
Clasificación y modelos de bases de datos
Clasificación y modelos de bases de datosClasificación y modelos de bases de datos
Clasificación y modelos de bases de datos
 
BASE DE DATOS.pptx
BASE DE DATOS.pptxBASE DE DATOS.pptx
BASE DE DATOS.pptx
 
Base de datos
Base de datosBase de datos
Base de datos
 
Modelo de una b.d
Modelo de una b.dModelo de una b.d
Modelo de una b.d
 
Modelo de Datos
Modelo de DatosModelo de Datos
Modelo de Datos
 
Clasificacion y modelos de bases de datos
Clasificacion y modelos de bases de datosClasificacion y modelos de bases de datos
Clasificacion y modelos de bases de datos
 
Clasificacion y modelos de bases de datos
Clasificacion y modelos de bases de datosClasificacion y modelos de bases de datos
Clasificacion y modelos de bases de datos
 

Último

Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxRogerPrieto3
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 

Último (15)

Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptx
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 

lectura-20-fundamental-201.pdf

  • 1. Palabras clave: base de datos, sistemas de gestión de archivos, sistema de gestión de bases de datos (SGBD), sistema de base de datos, metadatos, modelo de datos. Contenido 1 2 3 4 Conceptos de las bases de datos Arquitecturas de las bases de datos Modelos de datos Bases de datos NoSQL Bases de datos Unidad 1 / Escenario 1 Lectura fundamental
  • 2. 1. Conceptos de las bases de datos En los negocios y en la vida cotidiana, las bases de datos están presentes desde antes de la apropiación de las tecnologías de la información en la sociedad. Guardar los teléfonos y direcciones de clientes en una libreta, registrar las transacciones de una empresa o mantener un registro de inventarios, son actividades que en el pasado se han llevado a cabo con la ayuda de libretas, fichas o algún otro mecanismo de registro. En general, los mencionados son ejemplos de bases de datos, aun cuando no estén soportados sobre plataformas computacionales. En general, una base de datos puede utilizarse manualmente o aprovechando herramientas informáticas. 1.1. Bases de datos De acuerdo con Date (2001), una base de datos es “un conjunto de datos persistentes que es utilizado por los sistemas de aplicación de alguna empresa dada” (Date, 2001, p.10). Es importante aclarar que la palabra empresa se refiere a cualquier sujeto que haga uso de la base de datos como tal. Para complementar la anterior definición, según Elmasri y Navathe (2007), una base de datos “es una colección de datos relacionados. Con la palabra datos nos referimos a los hechos (datos) conocidos que se pueden grabar y que tienen significado implícito” (Elmasri y Navathe, 2007, p.4). Es de resaltar que, para aclarar estas definiciones, es necesario mencionar las siguientes propiedades de las bases de datos (Elmasri y Navathe, 2007): 1. Representa algún aspecto del mundo real (UoD, universo del discurso). 2. Es una colección de datos con algún tipo de significado coherente. 3. Se diseña, construye y registra datos para un propósito específico. Según lo anterior, una base de datos no es una serie de datos aleatorios. Estos provienen de un origen dado y tiene una aplicación dada. Como se verá a continuación, el uso de sistemas informáticos permite un mejor registro, acceso y modificación de los datos, para su mejor aprovechamiento. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 2 POLITÉCNICO GRANCOLOMBIANO 2
  • 3. 1.2. Sistemas de gestión de archivos Aún en nuestros días, es común encontrar oficinas que almacenan y procesan sus datos haciendo uso de archivos tradicionales. Así, por ejemplo, muchas empresas llevan el registro de sus operaciones en hojas de cálculo o archivos de texto. Sin embargo, este tratamiento de la información representa algunos inconvenientes, los cuales se señalan a continuación: • Redundancia de datos: al registrar información en archivos, estos a veces incluyen campos que se repiten en distintos registros, lo que implica que al momento de modificar un dato este se debe cambiar en todos los registros donde esté presente o genera inconsistencias e información contradictoria. • Difícil acceso a datos: en especial, cuando se manejan volúmenes crecientes de información, buscar datos con determinados criterios puede llevar a que no sea encontrados parcial o totalmente. • Falta de relaciones entre datos: es común que, de acuerdo con su utilidad, los datos sean almacenados en archivos diferentes. Esto conlleva a que sea difícil establecer relaciones entre los datos como tal, que permitan aprovechar los recursos de información. • Pérdida de integridad referencial: de la misma manera, tener diversos archivos que manejen información distinta pero relacionada, implica la aparición de problemas de consistencia entre los datos. • Falta de atomicidad: cuando existan problemas en el almacenamiento de los datos es necesario regresar a un estado en el cual el sistema sea consistente; tener la información en archivos no permite mantener esa consistencia. • Dificultades para acceso concurrente: si varios usuarios acceden simultáneamente a varios archivos es difícil mantener la consistencia e integridad en los datos. • Dificultades en seguridad: el acceso a ciertos recursos de información o a operaciones entre datos requiere de ciertos privilegios para determinados perfiles de usuario. Los archivos, al no contar con la estructura necesaria para una adecuada gestión de la información, también dificultan la restricción adecuada al acceso de los datos. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 3 POLITÉCNICO GRANCOLOMBIANO 3
  • 4. Por otra parte, cuando las bases de datos están soportadas sobre sistemas computacionales, las aplicaciones adecuadas para administrar las bases de datos se denominan sistemas de gestión de bases de datos (SGBD). 1.3. Sistemas de gestión de bases de datos (SGBD) Un sistema de gestión de bases de Datos (o en inglés Database Management System – DBMS), es: “Una colección de programas que permite a los usuarios crear y mantener una base de datos. Es un sistema de software de propósito general que facilita los procesos de definición, construcción, manipulación y compartición de las bases de datos entre varios usuario y aplicaciones” (Elmasri y Navathe, 2007, p.5). En otras palabras, son aquellos programas informáticos orientados, de manera específica, a definir, construir y manipular datos por parte de uno o varios usuarios de manera simultánea y efectiva. En el mercado encontramos algunos ejemplos de sistemas de gestión de bases de datos como: Oracle Database, Microsoft SQL Server, MySQL, PostgreSQL, DB2 e incluso Access orientado a uso personal y de pequeños negocios, el cual viene incluido en la suite de Office de Microsoft. Es importante indicar que los SGBD, para poder efectuar sus tareas, definen a su vez información acerca de los datos y de la estructura en que estos son almacenados. Dicho de otro modo, son datos acerca de los datos que están almacenados; a los que se denominarán metadatos. 1.4. Sistemas de bases de datos De acuerdo con Elmasri y Navathe (2007), se entiende como sistema de bases de datos a la integración entre una base de datos (es decir, los datos e información como tal) y un sistema de gestión de bases de datos. En estos sistemas, por lo general, se generan consultas para recuperar la información almacenada y transacciones en las cuales se almacena o modifica información. La Figura 1 muestra la relación entre los conceptos mencionados. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 4 POLITÉCNICO GRANCOLOMBIANO 4
  • 5. Figura 1. Entorno de un sistema de bases de datos Fuente: elaboración propia 2. Modelos de datos Un modelo de datos es una “colección de conceptos que se pueden utilizar para describir la estructura de una base de datos” (Elmasri y Navathe, 2007, p.28). Estas incluyen las operaciones necesarias para recuperar y actualizar los datos. Asimismo, por estructura de una base de datos entenderemos “los tipos de datos, relaciones y restricciones que deben mantenerse para los datos” (Elmasri y Navathe, 2007, p.28). 2.1. Categorías de los modelos de datos En general, se reconocen tres categorías de modelos de datos: 1. Modelos de alto nivel o modelos conceptuales, que representan más la forma en que los usuarios se relacionan con los datos. 2. Modelos de datos representativos o modelos de implementación, que no se distancian demasiado de la percepción de los datos por parte del usuario y a la vez no están tan lejos de la manera en que los datos son almacenados. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 5 POLITÉCNICO GRANCOLOMBIANO 5
  • 6. 3. Modelos de bajo nivel o modelos físicos, que son más parecidos a la manera en que se almacenan los datos en el sistema. 2.1.1. Modelos conceptuales En este tipo de modelo se emplean los conceptos de entidad, atributo y relación. Se entiende por entidad un objeto de la realidad; por atributos, a aquellas propiedades o características de la entidad y que la definen; y por relación entenderemos la asociación que se da entre dos o más entidades. Así, por ejemplo, una entidad puede ser el “cliente” o el “producto” de una compañía; los atributos de la entidad “cliente” pueden ser “edad”, “estado”, “teléfono” o “dirección” y una relación puede estar dada por los productos que ha adquirido un cliente. Un modelo representativo de los modelos conceptuales es el de entidad-relación (Figura 2), que se desarrollará más adelante. Figura 2. Ejemplo de modelo entidad-relación Fuente: elaboración propia 2.1.2. Modelos de datos representativos o de implementación Estos, también denominados modelos lógicos, están más enfocados en las operaciones, que en la descripción de la realidad. Entre estos modelos tenemos el modelo de datos jerárquico, el modelo de datos de red, el modelo de datos relacional y el modelo de datos de objetos, los cuales se describen de manera breve a continuación: • Modelo de datos jerárquico POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 6 POLITÉCNICO GRANCOLOMBIANO 6
  • 7. Organiza los registros en una estructura de árbol y emplea segmentos padre e hijo. Cada segmento es equivalente a un registro de archivo (Figura 3). Entre las ventajas del modelo jerárquico tenemos que promueve compartir datos, la simplicidad conceptual, la integridad y la eficiencia en las relaciones 1:M (uno a muchos). Por otro lado, hace de la navegación algo complejo, no está estandarizado, no posee un lenguaje de manipulación de datos y no permite tener múltiples padres ni relaciones M:N (muchos a muchos). Figura 3. Ejemplo de modelo de datos jerárquico Fuente: elaboración propia • Modelo de datos de red A diferencia del modelo anterior, el de datos en red permite la presencia de múltiples padres, pues posibilita los enlaces que establecen relaciones entre los registros (Figura 4). En este caso, las relaciones son binarias y es posible tener múltiples relaciones que parten de un mismo registro. Entre las ventajas de este modelo encontramos que promueve la integridad de las bases de datos y se ajusta a los estándares y lenguajes de definición y manipulación de los sistemas de gestión de bases de datos. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 7 POLITÉCNICO GRANCOLOMBIANO 7
  • 8. Figura 4. Ejemplo de modelo de datos de red Fuente: elaboración propia • Modelo de datos relacional El modelo de datos relacional fue propuesto por Edgar Frank “Ted” Codd (Codd, 1990), en los años 70. Utilizó el concepto de relación matemática (tabla), basándose en la teoría de conjuntos y la lógica de predicados. Hoy es uno de los principales paradigmas en el diseño de bases de datos (Figura 5). El principal concepto del modelo relacional es el uso de relaciones denominadas tuplas, que en la práctica se encuentran en tablas compuestas por registros o tuplas organizadas en filas (una fila será entonces una tupla o registro); cada columna correspondería a un campo (Todd, 1976). Entre las ventajas de este modelo está su facilidad en el diseño, implementación, utilización y administración; así como su capacidad de acomodarse a lenguajes como SQL y su poder de mantener la integridad referencial. Por otro lado, requiere de una sólida capacitación a los usuarios. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 8 POLITÉCNICO GRANCOLOMBIANO 8
  • 9. Figura 5. Ejemplo de modelo relacional Fuente: elaboración propia • Modelo de datos orientado a objetos Debido al desarrollo de los lenguajes orientados a objetos, como C#, Java C++, entre otros, en ocasiones existían ciertas dificultades de adaptar las estructuras de datos de los sistemas de administración de bases de datos a las clases y objetos utilizados en los lenguajes de programación. Por esta razón, surgió el grupo de modelos de datos de objetos: ODMG (por sus siglas en inglés) (Object Data Management Group, 2017). Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con lenguajes de programación orientados a objetos, como Java, C#, Visual Basic.NET y C++. Los ODBMS usan exactamente el mismo modelo que estos lenguajes de programación. De la misma forma, modelos como los mencionados en los apartados anteriores tienen deficiencias en cumplir los requerimientos de los sistemas de información geográfica, sistemas de diseño y manufactura asistidos por computador o multimedia (Figura 6). POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 9 POLITÉCNICO GRANCOLOMBIANO 9
  • 10. Contar con un modelo orientado a objetos mejora el rendimiento y la consistencia de los datos cuando se integran con lenguajes de programación. Figura 6. Ejemplo de modelo de datos de objetos Fuente: elaboración propia. • Modelo de lenguaje de marcado extendido (XML eXended Markup Languaje) Es un modelo ampliamente utilizado para el intercambio electrónico de datos en Internet. Utiliza una estructura a manera de árbol jerárquico con el apoyo de etiquetas (Figura 7). POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 10 POLITÉCNICO GRANCOLOMBIANO 10
  • 11. <libros> <libro ISBN= “213123123”> <titulo>Los días y noches</titulo> <autor>Luis Díaz</autor> </libro> <libro ISBN= “2133424323”> <titulo>La caza del enemigo</titulo> <autor>Pepe Suárez</autor> </libro> <libro ISBN= “2131234545”> <titulo>El ultimo amigo</titulo> <autor>Javier Sánchez</autor> </libro> <libro ISBN= “2145345429”> <titulo>Cuando los cóndores anidan</ti- tulo> <autor>Miguel de la Vega</autor> Figura 7. Ejemplo de modelo de lenguaje de marcado extendido Fuente: elaboración propia. 3. Arquitecturas de las bases de datos En este documento se presenta lo que se denomina una arquitectura de tres niveles: nivel interno, conceptual y externo (Figura 8) (Elmasri y Navathe, 2007, p.31). Esta arquitectura también es denominada ANSI/SPARC (Tsangaris y Klug, 1978). 3.1. Nivel interno En este se describe de forma detallada cómo están almacenados físicamente los datos. Incluye aspectos relacionados con el lugar de almacenamiento de datos, las rutas de acceso, los archivos, los caracteres separadores, etc. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 11 POLITÉCNICO GRANCOLOMBIANO 11
  • 12. 3.2. Nivel conceptual Este se centra de manera principal en describir las entidades, atributos, relaciones, operaciones, tipos de datos y restricciones de la base de datos, sin tener en cuenta los aspectos físicos de esta. 3.3. Nivel externo Se enfoca en cómo los usuarios tienen acceso a la información suministrada por la base de datos. Figura 8. Arquitectura de tres niveles Fuente: elaboración propia. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 12 POLITÉCNICO GRANCOLOMBIANO 12
  • 13. 4. Bases de datos NoSQL EL término NoSQL proviene de “Not Only SQL”. Corresponde a una nueva generación de sistemas de gestión de bases de datos, que busca superar las limitaciones de las bases de datos relacionales. En general, estas últimas están orientadas a administrar datos estructurados, con un formato fijo y unos campos muy bien definidos. Sin embargo, en el entorno actual de Internet y de grandes volúmenes de datos, se requiere mayor flexibilidad en el manejo de los datos. Así, NoSQL maneja tanto los datos estructurados como los no estructurados. NoSQL está enfocado a proporcionar: • Escalabilidad • Rendimiento • Alta disponibilidad • API “Interfaz de Programación de Aplicaciones” (Aplication Programming Interface) simple • Esquema libre • Fácil replicación. • Finalmente consistente (no ácido) POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 13 POLITÉCNICO GRANCOLOMBIANO 13
  • 14. Referencias Codd, E. F. (1990). The Relational Model for Database Management. USA: Addison - Wesley Publishing Company. Date, C. (2001). Introducción a los sistemas de bases de datos. Naucalpan de Juárez, México: Pearson Education. Elmasri, R. y Navathe, S. (2007). Fundamentos de Sistemas de Bases de Datos. Madrid: Pearson, Addison Wesley. Object Data Management Group. (2017). ODMG Standard. Recuperado de http://www.odbms.org/ odmg-standard/ Todd, S. J. P. (1976). The Peterlee Relational Test Vehicle #x2014;a system overview. IBM Systems Journal, 15(4), 285–308. https://doi.org/10.1147/sj.154.0285 Tsangaris, M. y Klug, A. (1978). The ANSI/X3/SPARC DBMS Framework. AFIPS Press. POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 14 POLITÉCNICO GRANCOLOMBIANO 14
  • 15. INFORMACIÓN TÉCNICA POLITÉCNICO GRANCOLOMBIANO POLITÉCNICO GRANCOLOMBIANO 15 POLITÉCNICO GRANCOLOMBIANO 15 Módulo: Fundamentos de bases de datos Unidad 1: Generalidades y conceptos de bases de datos Escenario 1: Generalidades de las bases de datos Autor: Luis Ernesto Leyva Camargo Asesor Pedagógico: María del Pilar Rivera Acosta Diseñador Gráfico: David Alfonso Rivera Asistente: Jhon Edwar Vargas Este material pertenece al Politécnico Grancolombiano. Prohibida su reproducción total o parcial.