2. ¿Qué es una base de datos?
son recopilaciones de publicaciones de contenido científico-técnico, como artículos de revistas,
libros, tesis, congresos, etc, de contenido temático, que tienen como objetivo reunir toda la
producción bibliográfica posible sobre un área de conocimiento. Contienen información sobre
documentos, es decir, referencias a documentos, pero también muchas de ellas contienen los textos
completos de esos documentos, general menten en formato pdf.
Las bases de datos contienen información relevante, actualizada, precisa, contrastada y de
calidad.Por ejemplo Medline, es una base de datos que recopila todo lo que se publica a nivel mundial
sobre Medicina.
3. ¿Qué es una base de datos tipo SQL?
Es un lenguaje específico del dominio que da acceso a un sistema de gestión de bases de datos
relacionales que permite especificar diversos tipos de operaciones en ellos. Una de sus
características es el manejo del álgebra y el cálculo relacional que permiten efectuar consultas con
el fin de recuperar, de forma sencilla, información de bases de datos, así como hacer cambios en
ellas. Un lenguaje de acceso a bases de datos que explota la flexibilidad y potencia de los sistemas
relacionales y permite así gran variedad de operaciones.
Gracias a su fuerte base teórica y su orientación al manejo de conjuntos de registros y no a
registros individuales permite una alta productividad en codificación y la orientación a objetos. De
esta forma, una sola sentencia puede equivaler a uno o más programas que se utilizarían en un
lenguaje de bajo nivel orientado a registros.
4. ¿Qué es una base de datos NoSQL?
Las bases de datos NoSQL, también llamadas No Solo SQL, son un enfoque hacia la gestión de datos
y el diseño de base de datos que es útil para grandes conjuntos de datos distribuidos.
NoSQL, que abarca una amplia gama de tecnologías y arquitecturas, busca resolver los problemas de
escalabilidad y rendimiento de big data que las bases de datos relacionales no fueron diseñadas para
abordar. NoSQL es especialmente útil cuando una empresa necesita acceder y analizar grandes
cantidades de datos no estructurados o datos que se almacenan de forma remota en varios
servidores virtuales en la nube.
5. Bases de datos más populares
Oracle
Base de datos que puede correr en casi cualquier sistema operativo. De Oracle destacamos la
abundancia de perfiles con experiencia en esta tecnología y la gran cantidad de herramientas que hay
para su administración y monitorización.
IBM DB2
Suele ser la segunda base de datos más utilizada en entornos Unix/Linux después de Oracle. Es
claramente un indiscutible ganador en Mainframe. Hay perfiles profesionales para DB2 pero no tanto
como para Oracle. Por otro lado, el perfil de DB2 Mainframe no tiene por qué saber moverse en DB2
linux/unix.
Microsoft SQL Server
Base de datos con compatibilidad únicamente para sistemas Windows. Hay muchos perfiles expertos
en SQL Server y no es difícil su adquisición. Su integración con Microsoft Azure ha mejorado mucho
su flexibilidad y rendimiento.
6. SQL server
Microsoft SQL Server 2005 es una plataforma de base de datos que se utiliza en el procesamiento de transacciones
en línea (OLTP) a gran escala, el almacenamiento de datos y las aplicaciones de comercio electrónico; es también una
plataforma de Business Intelligence para soluciones de integración, análisis y creación de informes de datos.
SQL Server 2005 introduce "estudios" que le ayudarán en las tareas de programación y administración: SQL Server
Management Studio y Business Intelligence Development Studio. En Management Studio, se desarrolla y administra
SQL Server Database Engine (Motor de base de datos de SQL Server) y soluciones de notificación, se administran
las soluciones de Analysis Services implementadas, se administran y ejecutan los paquetes de Integration Services, y
se administran los servidores de informes y los informes y modelos de informe de Reporting Services. En BI
Development Studio, se desarrollan soluciones de Business Intelligence mediante proyectos de Analysis Services para
desarrollar cubos, dimensiones y estructuras de minería; se crean proyectos de Reporting Services para crear
informes; se crea el modelo de informes para definir modelos para los informes y se desarrollan proyectos de
Integration Services para crear paquetes.
Los dos estudios están muy estrechamente relacionados con Microsoft Visual Studio y Microsoft Office System.
Para obtener más información, vea introducción a SQL Server Management Studio y Presentación de Business
Intelligence Development Studio.
7. Oracle
Oracle es básicamente una herramienta cliente/servidor para la gestión de Bases de Datos. Es un
producto vendido a nivel mundial, aunque la gran potencia que tiene y su elevado precio hace que sólo
se vea en empresas muy grandes y multinacionales, por norma general. En el desarrollo de páginas
web pasa lo mismo: como es un sistema muy caro no está tan extendido como otras bases de datos,
por ejemplo, Access, MySQL, SQL Server, etc.
Para desarrollar en Oracle utilizamos PL/SQL un lenguaje de 5ª generación, bastante potente para
tratar y gestionar la base de datos, también por norma general se suele utilizar SQL al crear un
formulario.
8. MongoDB
Dentro de las bases de datos NoSQL, probablemente una de las más famosas sea MongoDB. Con un concepto muy
diferente al de las bases de datos relacionales, se está convirtiendo en una interesante alternativa.
Pero cuándo uno se inicia en MongoDB se puede sentir perdido. No tenemos tablas, no tenemos registros y lo que es más
importante, no tenemos SQL. Aun así, MongoDB es una seria candidata para almacenar los datos de nuestras
aplicaciones.
Una de las diferencias más importantes con respecto a las bases de datos relacionales, es que no es necesario seguir un
esquema. Los documentos de una misma colección - concepto similar a una tabla de una base de datos relacional -, pueden
tener esquemas diferentes.Una de las diferencias más importantes con respecto a las bases de datos relacionales, es
que no es necesario seguir un esquema. Los documentos de una misma colección - concepto similar a una tabla de una
base de datos relacional -, pueden tener esquemas diferentes.
MongoDB viene de serie con una consola desde la que podemos ejecutar los distintos comandos. Esta consola está
construida sobre JavaScript, por lo que las consultas se realizan utilizando ese lenguaje. Además de las funciones de
MongoDB, podemos utilizar muchas de las funciones propias de JavaSciprt. En la consola también podemos definir
variables, funciones o utilizar bucles.
9. Oracle NoSQL
Proporciona semántica transaccional para manipulación de datos, escalabilidad horizontal y
administración y supervisión sencillas.
También proporciona un modelo de datos muy simple para el desarrollador de la aplicación. Cada fila
se identifica mediante una clave única, y también tiene un valor, de longitud arbitraria, que es
interpretada por la aplicación. La aplicación puede manipular (insertar, borrar, actualizar, leer) una
sola fila en una transacción. La aplicación también puede realizar un análisis iterativo, no
transaccional de todas las filas en la base de datos.
10. Cassandra
Dentro de los nuevos sistemas de almacenamiento que están surgiendo dentro del universo Big Data,
Cassandra es uno de los más interesantes y reseñables. Cassandra se define como una base de datos
NoSQL distribuida y masivamente escalable, y esta es su mayor virtud desde nuestro punto de vista,
la capacidad de escalar linealmente.
Implementa una arquitectura Peer-to-Peer, lo que elimina los puntos de fallo único y no sigue patrones
maestro-esclavo como otros sistemas de almacenamiento. De esta manera cualquiera de los nodos
puede tomar el rol de coordinador de una query. Será el driver el que decida qué nodo quiere que sea
el coordinador.
Los datos son repartidos a lo largo del cluster en base a un token único calculado para cada fila por
una función hash. Los nodos se reparten equitativamente el rango de tokens que va de -263 a 263,
esto define el nodo primario. Internamente Cassandra replicará los datos entre los nodos con la
política que le definamos, por ejemplo definiendo el factor de replicación. Además soporta el concepto
de data center para agrupar los nodos lógicamente y tener los datos más cerca del usuario.