Este documento describe diferentes tipos de bases de datos como SQL, NoSQL y las más populares como SQL Server, Oracle, MongoDB, Oracle NoSQL y Cassandra. Explica las características, ventajas y desventajas de cada una para el almacenamiento y recuperación de grandes volúmenes de datos de manera distribuida.
1. CURSO NACIONAL
FORMACIÓN DISICPLINAR
DOCENTES DE EDUCACIÓN MEDIA SUPERIOR
INSTITUCIONES DE EDUCACIÓN PÚBLICA DE EDUCACIÓN MEDIA SUPERIOR
CURSO: INFORMÁTICA
Actividad de aprendizaje 4
Screencast y bases de datos
2. BASES DE DATOS
se puede definir como un conjunto de información relacionada que se encuentra agrupada ó estructurada.
Desde el punto de vista informático, la base de datos es un sistema formado por un conjunto de datos
almacenados en discos que permiten el acceso directo a ellos y un conjunto de programas que manipulen
ese conjunto de datos.
3. BASES DE DATOS TIPO SQL
Es un lenguaje específico del dominio que da acceso a un sistema de gestión de bases de datos
relacionales que permite especificar diversos tipos de operaciones en ellos.
Una de sus características es el manejo del álgebra y el cálculo relacional que permiten efectuar
consultas con el fin de recuperar, de forma sencilla, información de bases de datos, así como hacer
cambios en ellas.
4. Base de datos NoSQL
Son un sistemas de gestión de datos (mecanismos para el almacenamiento y
recuperación de datos) que difieren, en aspectos importantes, del modelo clásico de
relaciones entre entidades (o tablas) existente en los sistemas de gestión bases de
datos relacionales, siendo el más destacado el que no usan SQL como lenguaje
principal de consulta.
Aunque son conocidas desde la década de los 60 del pasado siglo, su auge actual
viene determinado por el uso que, de estos sistemas han hecho las principales
compañías de internet como Amazon, Google, Twitter y Facebook.
6. SQL SERVER
Utiliza mucho la memoria RAM para las instalaciones y utilización de software, no se
puede utilizar como practicas porque se prohíben muchas cosas, tiene restricciones en
lo particular. La relación, calidad y el precio esta muy debajo comparado con oracle. y
tiene muchos bloqueos a nivel de página, un tamaño de página fijo y demasiado
pequeño, una pésima implementación de los tipos de datos variables.
VENTAJAS: Es un sistema de gestión de base de datos, es útil para manejar y obtener
datos de la red de redes, permite olvidarnos de los ficheros que forman la base de
datos, permite administrar permisos a todo. También permite que alguien conecte su
SQLO al nuestro.
7. Oracle
Puede correr en casi cualquier sistema operativo. Se destaca la abundancia de perfiles con
experiencia en esta tecnología y la gran cantidad de herramientas que hay para su
administración y monitorización.
El mayor inconveniente de Oracle es quizás su precio. Incluso las licencias de Personal
Oracle son excesivamente caras. Otro problema es la necesidad de ajustes. Un error
frecuente consiste en pensar que basta instalar el Oracle en un servidor y enchufar
directamente las aplicaciones clientes. Un Oracle mal configurado puede ser muy lento.
8. MONGO DB
Bloquea la base de datos cada vez que se realiza una escritura, lo que reduce la
concurrencia dramáticamente, utiliza un sistemas de archivos, cuenta con la capacidad
para balancear la carga y recopilación de datos utilizando múltiples servidores para
almacenamiento de archivo, cambia el valor por defecto para escribir al menos una
replica, la configuración automática, se puede agregar nuevas maquinas a mongo DB
con el sistema de base corriendo. Tiene problemas de rendimiento cuando el volumen
de datos supera los 100GB.
9. Oracle NoSQL
Es muy conocido en el mundo de las bases de datos relacionales y el desarrollo de
software que el análisis de requerimientos define la bases de datos y la funcionalidad
de la aplicación pero Consistencia, Disponibilidad y Tolerancia a las particiones (CAP)
son requerimientos no funcionales, lo que ilustra la importancia que adquieren para
los problemas el incluir este análisis en su proceso de solución del problema.
El otro Aspecto fundamental de análisis y de diseño es que la naturaleza de su
problema debe ser distribuido y de alto volumen de datos para aplicar bien
soluciones
10. Cassandra
Es una base de datos NoSQL distribuida y basada en un modelo de almacenamiento de
(clave-valor), escrita en Java. Permite grandes volúmenes de datos en forma distribuida. Por
ejemplo, lo usa Twitter para su plataforma.
VENTAJAS: Rápidas respuestas aunque la demanda crezca, Almacenamiento distribuido y
Escalabilidad horizontal (añade nuevo hardware cuando sea preciso).
DESVENTAJAS: No hay joins (a cambio de más velocidad), No permite ordenar resultados en
tiempo de consulta y No tiene SQL.