El documento habla sobre los fundamentos de las bases de datos, incluyendo los sistemas de administración de bases de datos (DBMS), data warehouses, minería de datos y Big Data. También describe la metodología de desarrollo de bases de datos, que incluye análisis de requisitos, modelos conceptuales, lógicos y físicos.
2. www.usat.edu.pe
Los sistemas de administración de base de datos
(DataBase Management System, abreviado DBMS) son un tipo
de software muy específico, dedicado a servir de interfaz entre
la Base de Datos, el usuario y las aplicaciones que la utilizan.
Gracias a esto el usuario y las aplicaciones no acceden a los
datos tal y como se almacenan realmente, es decir a su
representación física, sino que se ve sólo una representación
lógica (esquemas). Esto permite un grado elevado de
independencia entre las aplicaciones y el almacenamiento físico
de los datos.
El DBMS es el software que nos permite crear y administrar una
BD, asegurando su integridad, confindencialidad y
disponibilidad.
Sistema administrador de Base de Datos (DBMS,
SGBD)
3. www.usat.edu.pe
Sistema administrador de Base de Datos (DBMS)
Entre los principales DBMS disponibles en el mercado tenemos:
DBMS libres:
- PostgreSQL
- MySQL
- Firebird
- SQLite
- DB2 Express-C
- Apache Derby
DBMS No libres:
- Microsoft SQL Server
- Oracle
- IBM DB2 Universal Database (DB2 UDB)
- IBM Informix
- Advantage Database
- dBase
- FileMaker
- Interbase de CodeGear, filial de Borland
- MAGIC
- NexusDB
- Paradox
- PervasiveSQL
- etc.
4. www.usat.edu.pe
• Data warehouse es un almacén de datos único y centralizado que consolida
e integra datos de diferentes fuentes que permita el análisis empresarial.
Data warehouse permite a una organización o empresa ejecutar análisis
potentes en grandes volúmenes (terabytes y petabytes) de datos históricos
de formas que una base de datos estándar simplemente no puede [1].
4
Data warehouse
6. www.usat.edu.pe
6
Minería de Datos
La minería de datos es el conjunto de técnicas y tecnologías que permiten
explorar grandes bases de datos con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el comportamiento de los
datos en un determinado contexto [2].
La minería que llevan a cabo los ordenadores es un proceso complejo. Los
especialistas en bases de datos lo definieron como un estándar en 1989 y le
dieron el nombre de Descubrimiento de Conocimiento en Bases de Datos
(Knowledge Discovery in Databases, KDD) [3].
8. www.usat.edu.pe
8
Big Data
Gartner indica que Big data son datos que contienen una mayor variedad y
que se presentan en volúmenes crecientes y a una velocidad superior.
Esto se conoce como "las tres V". Es decir, el big data está formado por
conjuntos de datos de mayor tamaño y más complejos, especialmente
procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan
voluminosos que el software de procesamiento de datos convencional
sencillamente no puede gestionarlos. Sin embargo, estos volúmenes
masivos de datos pueden utilizarse para abordar problemas empresariales
que antes no hubiera sido posible solucionar [4].
11. www.usat.edu.pe
11
Metodología de Desarrollo de Base de Datos
Fuente: Análisis y Diseño de Base de Datos [5]
Análisis de
Requerimientos
El modelo lógico depende
del DBMS, debido a que si
trabajaremos con un DBMS
Relacional, para hacer el
modelo lógico elegimos
El modelo relacional
(Modelo de tablas
relacionales)
Modelo E-R Modelo Relacional DBMS
específico
Implementación
12. www.usat.edu.pe
12
Metodología de Desarrollo de Base de Datos
El diseño lógico depende del DBMS, debido a que si trabajaremos con un DBMS
Relacional, para hacer el diseño lógico, elegimos el modelo relacional (Modelo de tablas
relacionales). En cambio si elegimos un DBMS orientado a obetos tendremos que usar otro modelo
que sea orientado a objetos.
19. www.usat.edu.pe
19
• Existen varios sistemas administradores o gestores de base de datos (DBMS/SGBD).
• Un data warehouse (DW) es un gran almacén de datos que integra datos de diferentes
orígenes (internos y externos) cuyo diseño distinto permite el procesamiento análitico
(OLAP), a diferencia de una Base de Datos (BD) cuyo diseño permite el procesamiento
transaccional (OLTP).
• La minería de datos nos permitirá encontrar conexiones ocultas, anomalías, patrones y
correlaciones en grandes conjuntos de datos para apoyar la toma de decisiones.
• Cuando hablamos de big data no sólo nos referimos a grandes volumenes de datos, sino
tambien a su velocodad y variedad con la que se genera. Hoy en día se habla también de
su Viabilidad, Veracidad, Visualización y Valor de éstos.
Conclusiones
20. www.usat.edu.pe
20
• Debemos seguir una metodología para poder analizar, diseñar y crear una base de datos de
manera eficiente.
• El primer paso y uno de los más importantes es el análisis, donde debemos identificar los
requerimientos.
• Para realizar el esquema conceptual de la BD, podemos usar el Modelo Conceptual como el
Modelo E/R.
• Para realizar el equema lógico de la BD, podemos usar el Modelo Lógico como el Modelo
Relacional (Modelo de Tablas Relacionales).
• Para realizar el esquema físico, podemos usar el Modelo Físico, teniedo en cuenta el DBMS que
utilizaremos.
Conclusiones