El documento proporciona información sobre Microsoft Access. Explica que Access es un sistema de gestión de base de datos incluido en Microsoft Office que permite crear y administrar bases de datos. También describe brevemente la historia de Access y cómo ha evolucionado para convertirse en una herramienta útil para crear aplicaciones de base de datos.
1. 0
Access es un sistema de gestion de
base de datos incluido en el paquete
de programas de Microsoft Office.Es
igualmente un gestor de datos que
recopila informacion relativa a un
asunto o propósito particular, como el
seguimiento de pedidos de clientes o
el mantenimiento de una colección de
música.
Microsoft
Access.
Definición y las distintas
herramientas con las que
podemos crear nuestra base
de datos
WilmerMiguel Delgado.
2. 1
Introducción
Este libro trata sobre Microsoft
Access y las distintas herramientas que
Podemos utilizar para crear una base de
datos.
3. 2
¿Que es Microsoft Access?
Es un sistema de gestion de base de datos incluido en el paquete de
programas de Microsoft Office.Es igualmente un gestor de datos que
recopila informacion relativa a un asunto o propósito particular,
como el seguimiento de pedidos de clientes o el mantenimiento de
una colección de música. Access es un programa informático en
4. 3entornos de empresa, que permite la creación y gestión de bases de
datos, así como su modificación, mantenimiento y control.
Microsoft Access es un software que permite gestionar bases de datos.
Access es una herramienta de la computadora que nos ayuda a realizar
trabajos o tareas, se ha convertido en una herramienta vital para
muchas personas en su vida laboral o profesional.
Access es una aplicación que viene con el paquete Office de
Microsoft. Para obtener Access necesitamos instalar una versión de
Office que lo contenga. Es bastante habitual que en una distribución
del paquete office tenga Access, pero hay algunas que no lo tienen.
Por ejemplo Office Profesional incluye Access.
Esa aplicación es un sistema de gestión de base de datos que utiliza
por defecto el motor de base de datos Microsoft Jet. Esto quiere decir
que Access en realidad es una interfaz preparada para gestionar
cualquier base de datos, no sólo una base de datos Access. Los
sistemas Windows disponen de ODBC, que es una pasarela para
poder acceder a cualquier base de datos. A través de ODBC podemos
conectarnos a cualquier base de datos utilizando un lenguaje de
programación o una aplicación como Access. Por ejemplo, podríamos
conectar con una base de datos SQL Server o MySQL desde Access.
Historia de Microsoft Access.
5. 4
La primera versión de Access fue lanzada en el año 1992 a partir de
entonces se sucedieron diversas versiones que incrementaron la
funcionalidad de el software, actualmente Access es un programa
usado para la gestión de datos a través de informes y consultas que
incluso puede importar información creada de otros software.
Access es ahora mucho más que una forma de crear base de datos, es
una herramienta fácil de usar que permite crear rápidamente
aplicaciones de base de datos basada en el explorador que ayudaran a
dirigir algún negocio o empresa. Los datos de Access se almacenan
automáticamente en una base de datos en la nube, por los que están
más protegidos.
Access también fue el nombre de un programa de comunicaciones de
Microsoft, destinado a competir con Procomm y otros programas.
Esto resultó ser un fracaso y se abandonó. Años más tarde, Microsoft
reutilizó el nombre para su software de base de datos.
Antes del lanzamiento de Access, el mercado de base de datos de
escritorio estaba dominado por Borland, con sus programas Paradox y
dBase, y FoxPro. Microsoft Access fue el primer programa en masa
de base de datos para Windows. Con la compra de FoxPro y la
incorporación de sus rutinas de optimización Rushmore dentro de
6. 5Access, Microsoft Access se convirtió rápidamente en la principal
base de datos para Windows de manera efectiva, eliminando la
competencia que no daba transición en el mundo MS-DOS.
En Access 2007, se introdujo un nuevo formato de base de datos:
ACCDB. El ACCDB soporta los tipos de datos más complejos, como
archivos adjuntos y campos con múltiples valores.
¿Que es una Base de Datos ?
Una base de datos es una herramienta para recopilar y organizar
información. Las bases de datos pueden almacenar información sobre
personas, productos o cualquier otro dato que el usuario quiera
insertar a la tabla.
Una base de datos es una colección de datos organizada de tal manera
que se facilite el acceso y la consulta de la información. Por ejemplo,
una biblioteca es una base de datos compuesta de material impreso en
papel y donde podemos encontrar el libro que necesitamos al
consultar el catálogo de la biblioteca.
7. 6Todas las bases de datos, desde las más sencillas hasta las más
complejas, están compuestas por listas de información.
La capacidad de relacionar bases de datos consiste en entender cómo
los elementos registrados en las listas se conectan unos con los otros.
Para comprender mucho mejor este concepto, volvamos al ejemplo de
la pequeña pastelería con la lista de clientes y la de tortas. Por
ejemplo: si decides crear una tercera lista en la que aparezca el tipo de
postre que prefiere cada cliente, de esta forma no te equivocarás con
los pedidos.
Una base de datos computarizada es un contenedor de objetos. Estas
pueden tener más de un tabla, por ejemplo:
Una tabla de alumnos.
Una tabla de padres.
Etc.
Tipos de Bases de Datos:
8. 7
Las Bases de Datos pueden clasificarse en diferentes maneras según
el contexto que se está manejando, estas se clasifican en según el
contenido, modelos de bases de datos y según la variabilidad de los
datos almacenados.
Base de Datos Estatica:
Son base de datos únicamente de lectura utilizadas primordialmente
para guardar datos históricos que posteriormente se pueden utilizar
para el estudio del comportamiento de un conjunto de datos atreves
9. 8del tiempo, realizar proyecciones, tomar decisiones y realizar análisis
de datos para inteligencia empresarial.
Base de Datos Dinamicas :
Son bases de datos donde la información almacenada se modifica con
el tiempo, permitiendo operaciones como actualización, borrado y
edición de datos, además de las operaciones fundamentales de
consultas. Por ejemplo: la base de datos de un supermercado, tienda o
cualquier otro negocio que tenga o necesite una. Como ven en la
imagen esta tabla se utiliza mayormente en los negocios para saber los
datos de los productos.
Base de datos de red:
10. 9
Este es un modelo ligeramente distinto del jerárquico; su diferencia
fundamental es la modificación del concepto de nodo: se permite que
un mismo nodo tenga varios padres (posibilidad no permitida en el
modelo jerárquico).
Fue una gran mejora con respecto al modelo jerárquico, ya que
ofrecía una solución eficiente al problema de redundancia de datos;
pero, aun así, la dificultad que significa administrar la información en
una base de datos de red ha significado que sea un modelo utilizado
en su mayoría por programadores más que por usuarios finales.
Base de Datos Bibliografica :
11. 10Estas solamente contienen un representante de la fuente primaria, que
permite localizarla. Un registro típico de una base de datos
bibliográfica contiene información sobre el autor, fecha de
publicación, editorial, titulo, etc. Puede tener un resumen sobre la
información original, pero nunca el texto completo porque si no
estaríamos en presencia de una base de datos de texto completo.
Como su nombre lo indica son cifras o números.
Base de datos jerárquica:
Las bases de Datos jerárquicas son especialmente útiles en el caso de
aplicaciones que manejan un gran volumen de información y datos
muy compartidos permitiendo crear estructuras estables y de gran
rendimiento. Una de las principales limitaciones de este modelo es su
incapacidad de representar eficientemente la redundancia de datos,
esta relación jerárquica no es estrictamente obligatoria, de manera que
pueden establecerse relaciones nudos hermano.
12. 11
Bases de datos transaccionales
Son bases de datos cuyo único fin es el envío y recepción de datos a
grandes velocidades, estas bases son muy poco comunes y están
dirigidas por lo general al entorno de análisis de calidad, datos de
producción e industrial, es importante entender que su fin único es
recolectar y recuperar los datos a la mayor velocidad posible, por lo
tanto la redundancia y duplicación de
información no es un problema como con las demás bases de datos,
por lo general para poderlas aprovechar al máximo permiten algún
tipo de conectividad a bases de datos relacionales.
Un ejemplo habitual de transacción es el traspaso de una cantidad de
dinero entre cuentas bancarias. Normalmente se realiza mediante dos
operaciones distintas, una en la que se debita el saldo de la cuenta
origen y otra en la que acreditamos el saldo de la cuenta destino.
Bases de datos relacionales
Este es el modelo utilizado en la actualidad para representar
problemas reales y administrar datos dinámicamente. Tras ser
postulados sus fundamentos en 1970 por Edgar Frank Codd, 2 de los
laboratorios IBM en San José (California), no tardó en consolidarse
como un nuevo paradigma en los modelos de base de datos. Su idea
fundamental es el uso de "relaciones". Estas relaciones podrían
considerarse en forma lógica como conjuntos de datos llamados
"tuplas". Pese a que esta es la teoría de las bases de datos relacionales
creadas por Codd, la mayoría de las veces se conceptualiza de una
manera más fácil de imaginar.
13. 12Esto es pensando en cada relación como si fuese una tabla que está
compuesta por registros (las filas de una tabla), que representarían las
tuplas, y campos (las columnas de una tabla).
Bases de Datos multidimensionales
Son bases de datos ideadas para desarrollar aplicaciones muy
concretas, como creación de Cubos OLAP.
Básicamente no se diferencian demasiado de las bases de datos
relacionales (una tabla en una base de datos relacional podría serlo
también en una base de datos multidimensional), la diferencia está
más bien a nivel conceptual; en las bases de datos multidimensionales
los campos o atributos de una tabla pueden ser de dos tipos, o bien
representan dimensiones de la tabla, o bien representan métricas que
se desean aprender.
14. 13
Bases de datos orientadas a objetos
Este modelo, bastante reciente, y propio de los modelos informáticos
orientados a objetos, trata de almacenar en la base de datos los objetos
completos (estado y comportamiento).
En bases de datos orientadas a objetos, los usuarios pueden definir
operaciones sobre los datos como parte de la definición de la base de
datos. Una operación (llamada función) se especifica en dos partes.
La interfaz (o signatura) de una operación incluye el nombre de la
operación y los tipos de datos de sus argumentos (o parámetros).
La implementación (o método) de la operación se especifica
separadamente y puede modificarse sin afectar la interfaz. Los
programas de aplicación de los usuarios pueden operar sobre los datos
invocando a dichas operaciones a través de sus nombres y
argumentos, sea cual sea la forma en la que se han implementado.
Bases de Datos Deductivas
Un sistema de base de datos deductiva, es un sistema de base de datos
pero con la diferencia de que permite hacer deducciones a través de
inferencias. Se basa principalmente en reglas y hechos que son
almacenados en la base de datos. Las bases de datos deductivas son
también llamadas bases de datos lógicas, a raíz de que se basa en
lógica matemática. Este tipo de base de datos surge debido a las
limitaciones de la Base de Datos Relacional de responder a consultas
15. 14recursivas y de deducir relaciones indirectas de los datos
almacenados.
Evolucion de la Base de Datos.
Las bases de datos se han constituido como una de las herramientas
más ampliamente difundidas en la actual sociedad de la información,
utilizadas como fuentes secundarias en cuanto recuperación y
almacenamiento de información en todos los campos a nivel
científico, social, económico, político y cultural.
A partir de este trabajo queremos llegar a presentar una panorámica
histórica de las bases de datos sistematizadas y su evolución a través
de las décadas, las cuales han sido utilizadas especialmente como
fuentes de consulta y de producción de conocimiento por
investigadores, científicos y académicos de todas las áreas, que han
encontrado en estas, una herramienta importante para el desarrollo del
conocimiento. De esta manera la Ciencia de la Información, ha
desarrollado una producción científica importante a nivel mundial, la
16. 15cual ha utilizado las bases de datos, como repositorio de
almacenamiento y difusión de información.
Por lo anterior haremos un énfasis en mostrar una vista histórica de
las bases de datos y los principales distribuidores en nuestra área del
saber, de tal manera que sirva como referente de consulta de
estudiantes, profesores e interesados en el tema, que conozcan en
contexto y el desarrollo de estas fuentes, para concienciar acerca de
las herramientas que se encuentran disponibles para el uso y aportes
que podemos hacer en nuestra área del saber.
El uso de sistemas de bases de datos automatizadas, se desarrolló a
partir de la necesidad de almacenar grandes cantidades de datos, para
su posterior consulta, producidas por las nuevas industrias que
creaban gran cantidad de información.
Herman Hollerith (1860-1929) fue denominado el primer ingeniero
estadístico de la historia, ya que invento una computadora llamada
“Máquina Automática Perforadora de Tarjetas”.
Para hacer el censo de Estados Unidos en 1880 se tardaron 7 años
para obtener resultados, pero Herman Hollerith en 1884 creo la
máquina perforadora, con la cual, en el censo de 1890 dio resultados
en 2 años y medio, donde se podía obtener datos importantes como
número de nacimientos, población infantil y número de familias. La
máquina usó sistemas mecánicos para procesar la información de las
tarjetas y para tabular los resultados.
Década del año 1950
En este lapso de tiempo se da origen a las cintas magnéticas, las
cuales sirvieron para suplir las necesidades de información de las
nuevas industrias. Por medio de este mecanismo se empezó a
automatizar la información de las nóminas, como por ejemplo el
17. 16aumento de salario. Consistía en leer una cinta o más y pasar los datos
a otra, y también se podían pasar desde las tarjetas perforadas.
Simulando un sistema de Backup, que consiste en hacer una copia de
seguridad o copia de respaldo, para guardar en un medio extraíble la
información importante. La nueva cinta a la que se transfiere la
información pasa a ser una cinta maestra.
Década de 1960
El uso de los discos en ese momento fue un adelanto muy efectivo, ya
que por medio de este soporte se podía consultar la información
directamente, esto ayudo a ahorrar tiempo. No era necesario saber
exactamente donde estaban los datos en los discos, ya que en
milisegundos era recuperable la información.
A diferencia de las cintas magnéticas, ya no era necesaria la
secuencialidad, y este tipo de soporte empieza a ser ambiguo.
Los discos dieron inicio a las Bases de Datos, de red y jerárquicas,
pues los programadores con su habilidad de manipulación de
estructuras junto con las ventajas de los discos era posible guardar
estructuras de datos como listas y árboles.
Década de 1970
Edgar Frank Codd (23 de agosto de 1923 – 18 de abril de 2003), en
un artículo "Un modelo relacional de datos para grandes bancos de
datos compartidos" ("A Relational Model of Data for Large Shared
18. 17Data Banks") en 1970, definió el modelo relacional y publicó una
serie de reglas para la evaluación de administradores de sistemas de
datos relacionales y así nacieron las bases de datos relacionales.
A partir de los aportes de Codd el multimillonario Larry Ellison
desarrollo la base de datos Oracle, el cual es un sistema de
administración de base de datos, que se destaca por sus transacciones,
estabilidad, escalabilidad y multiplataforma.
Inicialmente no se usó el modelo relacional debido a que tenía
inconvenientes por el rendimiento, ya que no podían ser competitivas
con las bases de datos jerárquicas y de red. Ésta tendencia cambio por
un proyecto de IBM el cual desarrolló técnicas para la construcción de
un sistema de bases de datos relacionales eficientes, llamado System
R.
Década de 1980
Las bases de datos relacionales con su sistema de tablas, filas y
columnas, pudieron competir con las bases de datos jerárquicas y de
red, ya que su nivel de programación era bajo y su uso muy sencillo.
En esta década el modelo relacional ha conseguido posicionarse del
mercado de las bases de datos. Y también en este tiempo se iniciaron
grandes investigaciones paralelas y distribuidas, como las bases de
datos orientadas a objetos.
Principios década de los 90
Para la toma de decisiones se crea el lenguaje SQL, que es un
lenguaje programado para consultas.
El programa de alto nivel SQL es un lenguaje de consulta
estructurado que analiza grandes cantidades de información el cual
permite especificar diversos tipos de operaciones frente a la misma
19. 18información, a diferencia de las bases de datos de los 80 que eran
diseñadas para las aplicaciones de procesamiento de transacciones.
Los grandes distribuidores de bases de datos incursionaron con la
venta de bases de datos orientada a objetos.
Finales de la década de los 90
El boom de esta década fue la aparición de la WWW “Word Wide
Web” ya que por éste medio se facilitaba la consulta de las bases de
datos. Actualmente tienen una amplia capacidad de almacenamiento
de información, también una de las ventajas es el servicio de siete días
a la semana las veinticuatro horas del día, sin interrupciones a menos
que haya planificaciones de mantenimiento de las plataformas o el
software.
Un formulario de Access es el medio que tenemos los usuarios para
trabajar con los datos de una tabla. Es esa ventana donde
introducimos el usuario y la contraseña para acceder a nuestra
aplicación o esa ventana desde donde damos de alta un cliente y que
tiene tantos botones como le hayamos puesto para interactuar con
20. 19esos datos como un botón de borrar, otro de nuevo cliente, otro para
salir de la aplicación, etc.
Los formularios son como los expositores de una tienda, que hacen
que sea más fácil ver u obtener los artículos que se buscan. El diseño
de los formularios es importante, dado que son objetos con los que los
usuarios agregan, editan o visualizan los datos almacenados en la base
de datos de Access.
El Formulario consiste en crear automáticamente un nuevo formulario
que contiene todos los datos de la tabla, consulta o informe
seleccionado en el Panel de Navegación.
Diseño del formulario: primero se abre un formulario en blanco
en la Vista Diseño y tenemos que ir incorporando los distintos objetos
que queremos que aparezca en él. Este método no se suele utilizar ya
que en la mayoría de los casos es más cómodo y rápido crear un
autoformulario o utilizar el asistente y después sobre el formulario
creado modificar el diseño para ajustar el formulario a nuestras
necesidades. En esta unidad veremos más adelante cómo modificar el
diseño de un formulario.
Formulario en blanco: consiste en crear un nuevo formulario
sin contenido, pero en vez de abrirse en Vista Diseño como la anterior
opción, se abrirá en Vista Presentación. Esta vista ofrece ventajas,
como poder incorporar datos simplemente arrastrando el objeto
(consulta, informe, tabla...) desde el Panel de Navegación.
Sistemas de control de formularios
Es un plan o método usado por la gerencia para guiar y regular las
operaciones de oficina, mediante la normalización del flujo de
papeles, donde se detecta la necesidad de realizar ajustes o para
utilizar los formularios en forma más eficiente y mantener el
seguimiento a cada formulario implantado.
21. 20Consideraciones generales de los sistemas de control
Eliminar los formularios innecesarios y evitar su creación, consolidar
formularios que se complementen, rediseñar formularios para
aumentar la eficiencia y disminuir los errores.
Clasificación de formularios
Determinar para cada caso cuál clasificación es más conveniente a los
fines de control que se persiguen y a la empresa en que se aplica.
Número correlativo: asignar un número de código a todos los
formularios. Éste es poco flexible y se desactualizada constantemente
por lo que es ideal para empresas pequeñas.
Modelos de bases de datos
Además de la clasificación por la función de las bases de datos, estas
también se pueden clasificar de acuerdo a su modelo de
administración de datos.
Un modelo de datos es básicamente una "descripción" de algo
conocido como contenedor de datos (algo en donde se guardan los
datos), así como de los métodos para almacenar y recuperar datos de
esos contenedores. Los modelos de datos no son cosas físicas: son
abstracciones que permiten la implementación de un sistema eficiente
de base de datos; por lo general se refieren a algoritmos, y conceptos
matemáticos.
Sistemas de control de formularios
Es un plan o método usado por la gerencia para guiar y regular las
operaciones de oficina, mediante la normalización del flujo de
22. 21papeles, donde se detecta la necesidad de realizar ajustes o para
utilizar los formularios en forma más eficiente y mantener el
seguimiento a cada formulario implantado.
Consideraciones generales de los sistemas de control
Eliminar los formularios innecesarios y evitar su creación, consolidar
formularios que se complementen, rediseñar formularios para
aumentar la eficiencia y disminuir los errores.
Nivel de organización.
El control de formularios se debe centrar en un lugar suficientemente
alto dentro de la organización como para dar una visión amplia,
necesaria para la revisión, coordinación y mejora de la instalación de
los formularios. Se debe tomar en cuenta la opinión del analista y de
los usuarios, ya que el analista es quien decide cómo deben ir
distribuidos los datos y el usuario decide cuáles son los datos
necesarios.
Control de formularios.
En la etapa del control de formularios se incluye el establecimiento de
un programa de control como política de la empresa y la comprensión
de los factores que componen el problema. Debe existir relación entre
el control y, los sistemas y procedimientos. Los componentes básicos
de este programa deben ser la función que efectúa la forma, el tema
principal de la forma y el tema secundario.
23. 22
El índice funcional
Es la principal herramienta en la unidad de control, contiene los
formularios agrupados de acuerdo con el propósito a que sirven. El
índice funcional es para uso exclusivo de quienes son responsables
del control de formularios. Los formularios destinados a propósitos
similares pueden ser analizados para determinar cuál puede ser
eliminado y cuál puede ser más ampliamente usado. Para las
necesidades de nuestras empresas, es suficiente con los propósitos de
acordar autorizar, facturar, instruir, notificar, registrar, reportar y
requerir.
Pasos para la elaboración de un formulario.
Tomar muestra de todos los formularios, posteriormente agrupar los
formularios por los que se hayan escogido, así como las subdivisiones
de esos temas, y codificar por temas, agrupar por función, codificar
por función, preparar carpetas para archivar las muestras, preparar una
lista tabulada con la información del número y nombre del formulario,
y el número de índice funcional que le corresponde.
Consideraciones generales para la elaboración de un formulario.
Debemos considerar ciertos aspectos para elaborar un formulario
exitosamente, el primer aspecto a considerar es realizar una revisión y
determinar la necesidad del formulario y si existen formularios que
compartan en mismo objetivo. Posteriormente elegir el tamaño
estándar de papel y letra adecuada para el diseño e impresión, y de ahí
elaborar una lista con toda la formación que contendrá el formulario.
Determinar espacios horizontales para cada dato y la mejor
distribución de estos, de acuerdo con los responsables de su llenado,
24. 23que debe ser a mano o a máquina, evitando áreas libres o desperdicios
de papel y exceso de zonas sombreadas.
Una vez realizada esta revisión se procede a poner a prueba el
formulario, por tres meses y constatar si cumple su objetivo.
Hojas Sueltas Son los formularios que se requieren individualmente.
Dependiendo a quién se solicite el trabajo (industria gráfica o
imprenta), el sistema de impresión varía entre máquinas tipográficas
y, rotativas (con corte posterior para formar la hoja suelta). Se utilizan
hojas sueltas cuando la información a consignarse normalmente es
manuscrita o máquina de escribir.
Hojas Continuas son formularios cuya producción se realiza en
máquinas rotativas. Permiten que la información que se consigne sea
impresa por una impresora Ejemplos de formularios continuos:
Cheques, Roles de Pago, Comprobantes de Egreso, Facturas, etc.
Tarjetas. Son formularios realizados en un gramaje especial
normalmente en cartulina. El gramaje dependerá del uso que se le
quiera dar a la tarjeta. Existen tarjetas de presentación, tarjetas de
Control de Entrada y Salida del Personal, Tarjetas Kardex, etc.
Existen sobres tamaño oficio, sobres tamaño carta, sobres manila o
bolsa y sobres de enrutamiento de correspondencia. Es conveniente
que los sobres bolsa y de enrutamiento de correspondencia, se
realicen en un gramaje de 110 a 120 gramos para permitir el
manipuleo continuo y transportación del contenido sin riesgos.
Formularios electrónicos
Los formularios electrónicos vienen a minimizar muchas de las
desventajas de los que se presentan en papel. Es posible diseñar un
25. 24formulario electrónico de manera que contenga información de ayuda
para la persona que tenga que rellenarlo. Estos formularios
electrónicos pueden contener campos de texto de una longitud
prefijada, o bien de longitud variable. Los campos de lista desplegable
ofrecen una serie de opciones de entre las cuales el usuario debe
elegir una. Para las respuestas del tipo "si" o "no", puede crearse
campos con casillas de verificación de forma que el usuario se puede
limitar a hacer clic con el ratón para que aparezca una "X" en la
casilla adecuada.
También es posible especificar una serie de respuestas "por omisión"
en campos específicos, con vistas a facilitar aún más la labor de
cumplimentación del formulario. Puesto que el formulario se rellena
desde la propia computadora, se evitan todos los posibles problemas
de interpretación de los datos introducidos, como sucede con los
formularios en papel rellenos a mano. Además, si la computadora está
conectada a una red, los formularios electrónicos pueden ser
cumplimentados y compartidos de la misma forma que se comparte
cualquier otro tipo de documento, eliminando así por completo la
necesidad de los formularios en papel. Windows viene con muchos
programas accesorios útiles, incluyendo un procesador de texto
elemental (WordPad), un programa de gráficos (Paint) y un programa
de comunicación (HyperTerminal). También proporciona varias
herramientas útiles, como Calculadora (Calculator) y Block de notas
(Notepad). Para otras funciones (de acuerdo a las necesidades), se
utiliza el Microsoft Office, en el cual es posible diseñar formularios
electrónicos que garantizan una rápida y correcta recogida de
información.
Tipos de campos en formularios
26. 25Se pueden usar diversos tipos de campos en los formularios. Aunque
los datos siempre se capturan como cadenas de caracteres, difieren
respecto a la forma en que se presenta su captura. Hay que matizar
que no es posible hacer ningún tipo de comprobación sobre los datos
que el usuario va introduciendo (ello se haría posteriormente en el
propio script, o bien usando JavaScript).
Componentes de una base de datos
Tablas: comprende definición de tablas, campos, relaciones e índices.
Es el componente principal de las Bases de Datos Relacionales.
Formularios: se utilizan principalmente para actualizar datos.
Consultas: se utilizan para ver, modificar y analizar datos.
Informes: se utilizan para presentar los datos en formato impreso.
27. 26Macros: conjunto de instrucciones para realizar una operación
determinada
Tablas
Tabla en las bases de datos, se refiere al tipo de modelado de datos,
donde se guardan los datos recogidos por un programa. Su estructura
general se asemeja a la vista general de un programa de hoja de
cálculo.
Una tabla es utilizada para organizar y presentar información. Las
tablas se componen de filas y columnas de celdas que se pueden
rellenar con textos y gráficos.
Cada tabla creada debe tener un nombre único en la Base de Datos,
haciéndola accesible mediante su nombre o su seudónimo (Alias)
(dependiendo del tipo de base de datos elegida). La estructura de las
tablas viene dada por la forma de un archivo plano, los cuales en un
inicio se componían de un modo similar.
Las tablas son los objetos principales de bases de datos que se
utilizan para guardar datos.
Tipos tablas
28. 27Tipos de tablas proporcionales
Además de la función estándar de las tablas básicas definidas por el
usuario, el Server nos proporciona los siguientes tipos de tabla, el
método cuántico que permiten llevar a cabo objetivos especiales en
una base de datos: que se utiliza para acomodar cuánticamente los
datos obtenidos de los datos del exterior.
Tablas con particiones
Las tablas con particiones son tablas cuyos datos se han dividido
horizontalmente entre unidades que pueden repartirse por más de un
grupo de archivos de una base de datos. Las particiones facilitan la
administración de las tablas y los índices grandes porque permiten
obtener acceso y administrar subconjuntos de datos con rapidez y
eficacia al mismo tiempo que mantienen la integridad del conjunto.
Las operaciones como, por ejemplo, la carga de datos de un sistema
OLTP a un sistema OLAP, pueden realizarse en cuestión de segundos
en lugar de minutos u horas en otras versiones. Las operaciones de
mantenimiento que se realizan en los subconjuntos de datos también
se realizan de forma más eficaz porque sólo afectan a los datos
necesarios en lugar de a toda la tabla.
Tiene sentido crear una tabla con particiones si la tabla es muy grande
o se espera que crezca mucho, y si alguna de las dos condiciones
siguientes es verdadera:
La tabla contiene, o se espera que contenga, muchos datos que se
utilizan de manera diferente.
Las consultas o las actualizaciones de la tabla no se realizan como se
esperaba o los costos de mantenimiento son superiores a los períodos
de mantenimiento predefinidos.
29. 28Las tablas con particiones admiten todas las propiedades y
características asociadas con el diseño y consulta de tablas estándar,
incluidas las restricciones, los valores predeterminados, los valores de
identidad y marca de tiempo, los desencadenadores y los índices. *
Por lo tanto, si desea implementar una vista con particiones que sea
local respecto a un servidor, debe implementar una tabla con
particiones. Para obtener información para comprender, diseñar e
implementar tablas con particiones, vea Tablas e índices con
particiones.
Tablas del sistema
SQL Server almacena los datos que definen la configuración del
servidor y de todas sus tablas en un conjunto de tablas especial,
conocido como tablas del sistema. Los usuarios no pueden consultar
ni actualizar directamente las tablas del sistema si no es a través de
una conexión de administrador dedicada (DAC) que sólo debería
utilizarse bajo la supervisión de los servicios de atención al cliente de
Microsoft. Para obtener más información, vea Usar una conexión de
administrador dedicada. Las tablas de sistema se cambian
normalmente en cada versión nueva de SQL Server. Puede que las
aplicaciones que hacen referencia directamente a las tablas del
sistema tengan que escribirse de nuevo para poder actualizarlas a una
versión nueva de SQL Server con una versión diferente de las tablas
de sistema. La información de las tablas del sistema está disponible a
través de las vistas de catálogo. Para obtener más información, vea
Tablas del sistema (Transact-SQL).
Con las tablas anchas, puede crear esquemas flexibles dentro de una
aplicación. Puede agregar o quitar columnas siempre que lo desee.
Tenga presente que el uso de tablas anchas tiene consideraciones de
rendimiento únicas, como e13eunos mayores requisitos de memoria
30. 29en tiempo de ejecución y en tiempo de compilación. Para obtener más
información, vea Consideraciones de rendimiento para las tablas
anchas.
Registro
En informática, o concretamente en el contexto de una base de datos
relacional, un registro (también llamado fila o tupla) representa un
objeto único de datos implícitamente estructurados en una tabla. En
términos simples, una tabla de una base de datos puede imaginarse
formada de filas y columnas o campos. Cada fila de una tabla
representa un conjunto de datos relacionados, y todas las filas de la
misma tabla tienen la misma estructura.
Un registro es un conjunto de campos que contienen los datos que
pertenecen a una misma repetición de entidad. Se le asigna
automáticamente un número consecutivo (número de registro) que en
ocasiones es usado como índice aunque lo normal y práctico es
asignarle a cada registro un campo clave para su búsqueda.
31. 30
Campos
En informática, un campo es un espacio de almacenamiento para un
dato en particular.1
En las bases de datos, un campo es la mínima unidad de información
a la que se puede acceder; un campo o un conjunto de ellos forman un
registro, donde pueden existir campos en blanco, siendo este un error
del sistema operativo. Aquel campo que posee un dato único para una
32. 31repetición de entidad, puede servir para la búsqueda de una entidad
específica.
En las hojas de cálculo los campos son llamados "celdas".
Tipos de campos informaticos
Un campo puede ser de tipo:
Alfanumérico: contiene cifras numéricas y caracteres alfabéticos.
Numérico: existen de varios tipos principalmente como enteros y
reales.
Auto incrementable: son campos numéricos enteros que incrementan
en una unidad su valor para cada registro incorporado.
Su utilidad resulta más que evidente: servir de identificador registro.
Booleano: admite dos valores, «verdadero» ó «falso».
Fechas: almacenan fechas facilitando posteriormente su explotación.
Almacenar fechas de esta forma posibilita ordenar los registros por
fechas o calcular los días entre una fecha y otra.
Memo: son campos alfanuméricos de longitud ilimitada. Presentan el
inconveniente de no poder ser indexados.
Tipos de tabla en my SQL
33. 32
ISAM.- es el formato de almacenaje más antiguo, y posiblemente
pronto desaparecerá. Presentaba limitaciones (los ficheros no eran
transportables entre máquinas con distinta arquitectura, no podía
manejar ficheros de tablas superiores a 4 gigas). Si aún tienes tablas
tipo ISAM, cámbialas a MYISAM.
MYISAM.- es el tipo de tabla por defecto en MySQL desde la versión
3.23. Optimizada para sistemas operativos de 64 bits, permite ficheros
de mayor tamaño que ISAM. Además los datos se almacenan en un
formato independiente, con lo que se pueden copiar tablas de una
máquina a otra de distinta plataforma. Posibilidad de indexar campos
BLOB y TEXT
HEAP.- Crea tablas en memoria. Son temporales y desaparecen
cuando el servidor se cierra; a diferencia de una tabla TEMPORARY,
que solo puede ser accedida por el usuario que la crea, una tabla
HEAP puede ser utilizada por diversos usuarios.
BDB.- Base de datos Berkeley. TST. Solo en MySQL MAX
34. 33INNODB.- TST, ACID, con posibilidad de commit, rollback,
recuperación de errores y bloqueo a nivel de fila.
MERGE más que un tipo de tabla es la posibilidad de dividir tablas
MYISAM de gran tamaño (solo útil si son verdaderamente de GRAN
tamaño) y hacer consultas sobre todas ellas con mayor rapidez. Las
tablas deben ser myisam e idénticas en su estructura.
MySQL nos permite variar el tipo de tabla después de que esta fue
creada.
TST se refiere a ‘Transactions safe tables’, o tablas para transacciones
seguras. A este tipo pertenecen DBD e INNODB.
Las tablas tipo TST son menos rápidas y ocupan más memoria, pero a
cambio ofrecen mayor seguridad frente a fallos durante la consulta.
Las tablas TST están disponibles desde la versión 4.0 de MySQL
Las tablas TST permiten ir introduciendo consultas y finalizar con un
COMMIT (que las ejecuta) o ROLLBACK (que ignora los cambios)
En bases de datos se denomina ACID a un conjunto de características
necesarias para que una serie de instrucciones puedan ser
consideradas como una transacción. Así pues, si un sistema de gestión
de bases de datos es ACID compliant quiere decir que el mismo
cuenta con las funcionalidades necesarias para que sus transacciones
tengan las características ACID.
En concreto ACID es un acrónimo de Atomicity, Consistency,
Isolation and Durability: Atomicidad, Consistencia, Aislamiento y
Durabilidad en español
35. 34
MY SQL
MySQL surgió alrededor de la década del 90, Michael Windenis
comenzó a usar MSQL para conectar tablas usando sus propias
rutinas de bajo nivel (ISAM).
Tras unas primeras pruebas, llegó a la conclusión de que mSQL no
era lo bastante flexible ni rápido para lo que necesitaba, por lo que
tuvo que desarrollar nuevas funciones. Esto resulto en una interfaz
SQL a su base de datos, totalmente compatible a mSQL.
El origen del nombre MySQL no se sabe con certeza de donde
proviene, por un lado se dice que en sus librerías han llevado el
prefijo “my” durante los diez últimos años, por otra parte, la hija de
uno de los desarrolladores se llama My.
Historia de my sql server
36. 35
MySQL fue inicialmente desarrollado por MySQL AB (empresa
fundada por David Axmark, Allan Larsson y Michael Widenius).
MySQL A.B.
Fue adquirida por Sun Microsystems en 2008, y ésta a su vez fue
comprada por Oracle Corporation en 2010, la cual ya era dueña desde
2005 de Innobase Oy, empresa finlandesa desarrolladora del motor
InnoDB para MySQL.
Al contrario de proyectos como Apache, donde el software es
desarrollado por una comunidad pública y los derechos de autor del
código están en poder del autor individual, MySQL es patrocinado
por una empresa privada, que posee el copyright de la mayor parte del
código. Esto es lo que posibilita el esquema de doble licenciamiento
anteriormente mencionado. La base de datos se distribuye en varias
versiones, una Community, distribuida bajo la Licencia pública
general de GNU, versión 2, y varias versiones Enterprise, para
aquellas empresas que quieran incorporarlo en productos privativos.
Las versiones Enterprise incluyen productos o servicios adicionales
tales como herramientas de monitorización y soporte oficial. En 2009
se creó un fork denominado MariaDB por algunos desarrolladores
(incluido algunos desarrolladores originales de MySQL) descontentos
37. 36con el modelo de desarrollo y el hecho de que una misma empresa
controle a la vez los productos MySQL y Oracle Database.3
Está desarrollado en su mayor parte en ANSI C y C++.4
Tradicionalmente se considera uno de los cuatro componentes de la
pila de desarrollo LAMP y WAMP.
MySQL es usado por muchos sitios web grandes y populares, como
Wikipedia, 5 Google67 (aunque no para búsquedas), Facebook, 8910
Twitter, 11 Flickr, 12 y YouTube.13
Historia de postgres
PostgreSQL ha tenido una larga evolución, la cual se inicia en 1982
con el proyecto Ingres en la Universidad de Berkeley.
Este proyecto, liderado por Michael Stonebraker, fue uno de los
primeros intentos en implementar un motor de base de datos
relacional. Después de haber trabajado un largo tiempo en Ingres y de
haber tenido una experiencia comercial con el mismo, Michael
decidió volver a la Universidad en 1985 para trabajar en un nuevo
38. 37proyecto sobre la experiencia de Ingres, dicho proyecto fue llamado
post-ingres o simplemente POSTGRES.
El proyecto post-ingres pretendía resolver los problemas con el
modelo de base de datos relacional que habían sido aclarados a
comienzos de los años 1980.
El principal de estos problemas era la incapacidad del modelo
relacional de comprender "tipos", es decir, combinaciones de datos
simples que conforman una única unidad. Actualmente estos son
llamados objetos. Se esforzaron en introducir la menor cantidad
posible de funcionalidades para completar el soporte de tipos.
Estas funcionalidades incluían la habilidad de definir tipos, pero
también la habilidad de describir relaciones - las cuales hasta ese
momento eran ampliamente utilizadas pero mantenidas
completamente por el usuario. En Postgres la base de datos
«comprendía» las relaciones y podía obtener información de tablas
relacionadas utilizando reglas. Postgres usó muchas ideas de Ingres
pero no su código.
La siguiente lista muestra los hitos más importantes en la vida del
proyecto Postgres.
1986: se publicaron varios papers que describían las bases del
sistema.
1988: ya se contaba con una versión utilizable.
39. 381989: el grupo publicaba la versión 1 para una pequeña comunidad de
usuarios.
1990: se publicaba la versión 2 la cual tenía prácticamente reescrito el
sistema de reglas.
1991: publicación de la versión 3, esta añadía la capacidad de
múltiples motores de almacenamiento.
1993: crecimiento importante de la comunidad de usuarios, la cual
demandaba más características.
1994: después de la publicación de la versión 4, el proyecto terminó y
el grupo se disolvió.
Después de que el proyecto POSTGRES terminara, dos graduados de
la universidad, Andrew Yu y Jolly Chen, comenzaron a trabajar sobre
el código de POSTGRES, esto fue posible dado que POSTGRES
estaba licenciado bajo la BSD, y lo primero que hicieron fue añadir
soporte para el lenguaje SQL a POSTGRES, dado que anteriormente
contaba con un intérprete del lenguaje de consultas QUEL (basado en
Ingres), creando así el sistema al cual denominaron Postgres95.
Para el año 1996 se unieron al proyecto personas ajenas a la
Universidad como Marc Fournier de Hub.Org Networking Services,
Bruce Momjian y Vadim B. Mikheev quienes proporcionaron el
primer servidor de desarrollo no universitario para el esfuerzo de
desarrollo de código abierto y comenzaron a trabajar para estabilizar
el código de Postgres95.
En el año 1996 decidieron cambiar el nombre de Postgres95 de tal
modo que refleje la característica del lenguaje SQL y lo terminaron
llamando PostgreSQL, cuya primera versión de código abierto fue
lanzada el 1 de agosto de 1996. La primera versión formal de
PostgreSQL (6.0) fue liberada en enero de 1997. Desde entonces,
muchos desarrolladores entusiastas de los motores de base de datos se
40. 39unieron al proyecto, coordinaron vía Internet y entre todos
comenzaron a incorporar muchas características al motor.
Aunque la licencia permitía la comercialización de PostgreSQL, el
código no se desarrolló en principio con fines comerciales, algo
sorprendente considerando las ventajas que PostgreSQL ofrecía.
La principal derivación se originó cuando Paula Hawthtorn (un
miembro del equipo original de Ingres que se pasó a Postgres) y
Michael Stonebraker conformaron Illustra Information Technologies
para comercializar Postgres.
En 2000, ex inversionistas de Red Hat crearon la empresa Great
Bridge para comercializar PostgreSQL y competir contra proveedores
comerciales de bases de datos. Great Bridge auspició a varios
desarrolladores de PostgreSQL y donó recursos de vuelta a la
comunidad, pero a fines de 2001 cerró debido a la dura competencia
de compañías como Red Hat y pobres condiciones del mercado.
En 2001, Command Prompt, Inc. lanzó Mammonth PostgreSQL, la
más antigua distribución comercial de PostgreSQL. Continúa
brindando soporte a la comunidad PostgreSQL a través del auspicio
de desarrolladores y proyectos, incluyendo PL/Perl, PL/php y el
alojamiento de proyectos de comunidades como PostgreSQL Build
Farm.
En enero de 2005, PostgreSQL recibió apoyo del proveedor de base
de datos Pervasive Software, conocido por su producto Btrieve que se
utilizaba en la plataforma Novell Netware. Pervasive anunció soporte
comercial y participación comunitaria y logró algo de éxito. Sin
embargo, en julio de 2006 dejó el mercado de soporte de PostgreSQL.
41. 40A mediados de 2005 otras dos compañías anunciaron planes para
comercializar PostgreSQL con énfasis en nichos separados de
mercados. EnterpriseDB añadió funcionalidades que le permitían a las
aplicaciones escritas para trabajar con Oracle ser más fáciles de
ejecutar con PostgreSQL. Greenplum contribuyó mejoras
directamente orientadas a aplicaciones de Data Warehouse e
Inteligencia de negocios, incluyendo el proyecto BizGres.
En octubre de 2005, John Loiacono, vicepresidente ejecutivo de
software en Sun Microsystems comentó: "No estamos yendo tras el
OEM de Microsoft pero estamos viendo a PostgreSQL ahora", aunque
no se dieron especificaciones en ese momento. Para noviembre de
2005, Sun Solaris 10 (lanzamiento 6/06) incluía PostgreSQL.
En agosto de 2007 EnterpriseDB anunció el Postgres Resource Center
y EnterpriseDB Postgres, diseñados para ser una completamente
configurada distribución de PostgreSQL incluyendo muchos módulos
contribuidos y agregados.
EnterpriseDB Postgres fue renombrado Postgres Plus en marzo de
2008.
El proyecto PostgreSQL continúa haciendo lanzamientos principales
anualmente y lanzamientos menores de reparación de bugs, todos
disponibles bajo la licencia PostgreSQL, y basados en contribuciones
de proveedores comerciales, empresas aportantes y programadores de
código abierto mayormente.
Un modelo entidad-relación o diagrama entidad-relación (a veces
denominado por sus siglas en inglés, E-R "Entity relationship"; en
español DER: "Diagrama de Entidad-Relación") es una herramienta
42. 41para el modelado de datos que permite representar las entidades
relevantes de un sistema de información así como sus interrelaciones
y propiedades.
Modelo Entidad-Relación
Se elabora el diagrama (o diagramas) entidad-relación.
Se completa el modelo con listas de atributos y una descripción de
otras restricciones que no se pueden reflejar en el diagrama.
El modelado de datos no acaba con el uso de esta técnica. Son
necesarias otras técnicas para lograr un modelo directamente
implementable en una base de datos. Brevemente:
Permite mostrar resultados entre otras entidades pertenecientes a las
existentes de manera que se encuentre la normatividad de archivos
que se almacenarán
Transformación de relaciones múltiples en binarias.
Normalización de una base de datos de relaciones (algunas relaciones
pueden transformarse en atributos y viceversa).
Conversión en tablas (en caso de utilizar una base de datos
relacional).
43. 42
El modelo relacional, para el modelado y la gestión de bases de datos,
es un modelo de datos basado en la lógica de predicados y en la teoría
de conjuntos.
Tras ser postuladas sus bases en 1970 por Edgar Frank Codd, de los
laboratorios IBM en San José (California), no tardó en consolidarse
como un nuevo paradigma en los modelos de base de datos.
Su idea fundamental es el uso de relaciones. Estas relaciones podrían
considerarse en forma lógica como conjuntos de datos llamados
tuplas.
Pese a que esta es la teoría de las bases de datos relacionales creadas
por Codd, la mayoría de las veces se conceptualiza de una manera
más fácil de imaginar, pensando en cada relación como si fuese una
tabla que está compuesta por registros (cada fila de la tabla sería un
registro o "tupla") y columnas (también llamadas "campos").
Es el modelo más utilizado en la actualidad para modelar problemas
reales y administrar datos dinámicamente.
44. 43En este modelo todos los datos son almacenados en relaciones, y
como cada relación es un conjunto de datos, el orden en el que estos
se almacenen no tiene relevancia (a diferencia de otros modelos como
el jerárquico y el de red). Esto tiene la considerable ventaja de que es
más fácil de entender y de utilizar por un usuario no experto. La
información puede ser recuperada o almacenada por medio de
consultas que ofrecen una amplia flexibilidad y poder para
administrar la información.
Este modelo considera la base de datos como una colección de
relaciones. De manera simple, una relación representa una tabla que
no es más que un conjunto de filas, cada fila es un conjunto de
campos y cada campo representa un valor que interpretado describe el
mundo real. Cada fila también se puede denominar tupla o registro y a
cada columna también se le puede llamar campo o atributo.
Para manipular la información utilizamos un lenguaje relacional,
actualmente se cuenta con dos lenguajes formales el Álgebra
relacional y el Cálculo relacional. El Álgebra relacional permite
describir la forma de realizar una consulta, en cambio, el Cálculo
relacional solamente indica lo que se desea devolver.
Consultas
Las consultas pueden realizar diversas funciones en una base de datos.
La función más común es recuperar datos específicos de las tablas.
Los datos que quiere ver generalmente están distribuidos en varias
tablas y las consultas le permiten verlos en una única hoja de datos.
Además, debido a que muchas veces no quiere ver todos los registros
a la vez, las consultas le permiten agregar criterios para "filtrar" los
datos y obtener solo los registros que quiere.
Ciertas consultas son "actualizables", es decir, puede modificar los
datos de las tablas subyacentes mediante la hoja de datos de la
45. 44consulta. Si está trabajando en una consulta actualizable, recuerde que
los cambios se realizan en realidad en las tablas, no solo en la hoja de
datos de la consulta.
Hay dos variedades básicas de consultas: consultas de selección y
consultas de acciones. Una consulta de selección simplemente
recupera los datos y los pone a disposición para su uso. Puede ver los
resultados de la consulta en la pantalla, imprimirlos o copiarlos al
portapapeles. O bien, puede usar el resultado de la consulta como un
origen de registro para un formulario o un informe.
Una consulta de acción, tal como el nombre lo indica, realiza una
tarea con los datos. Las consultas de acción se pueden usar para crear
tablas nuevas, agregar datos a las tablas existentes, o actualizar o
eliminar datos.
Indexación
46. 45Indexación (también conocido como indexación web u indexación en
Internet) se refiere a diversos métodos para incluir en el índice de
internet el contenido de un sitio web. Determinados sitios web o
intranet pueden utilizar un índice de back-of-the-book, mientras que
los motores de búsqueda suelen utilizar palabras clave y metadatos
(metaetiquetas) para proporcionar un vocabulario más útil para
Internet o la búsqueda en el sitio.
Con el aumento en el número de publicaciones periódicas que tienen
artículos en línea, la indexación web también está adquiriendo
importancia para los sitios web de periódicos o revistas con contenido
actualizado .
La información de indexación web implica la asignación de palabras
clave o frases a páginas web o sitios web dentro de un campo de
meta-etiquetas, por lo que los sitios web pueden ser recuperados con
un motor de búsqueda que se personaliza para buscar el campo de
palabras clave. Para mejorar la indexación de un sitio web específico
existen varios métodos conocidos en el entorno de SEO (Search
Engine Optimization), utilizando diferentes técnicas para que la
posición del sitio web aumente de acuerdo a las palabras que el
usuario ingresa para hacer una búsqueda.
47. 46Inicio de las bases de datos
distribuidas
Una base de datos distribuida (BDD) es un conjunto de múltiples
bases de datos lógicamente relacionadas las cuales se encuentran
distribuidas en diferentes espacios lógicos y geográficos (pej. un
servidor corriendo 2 máquinas virtuales) e interconectados por una
red de comunicaciones. Dichas BDD tienen la capacidad de realizar
procesamiento autónomo, esto permite realizar operaciones locales o
distribuidas.
Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el
cual múltiples sitios de bases de datos están ligados por un sistema de
comunicaciones de tal forma que, un usuario en cualquier sitio puede
acceder los datos en cualquier parte de la red exactamente como si
estos fueran accedidos de forma local.
48. 47Un sistema distribuido de bases de datos se almacenan en varias
computadoras. Los principales factores que distinguen un SBDD de
un sistema centralizado son los siguientes:
Hay múltiples computadores, llamados sitios o nodos.
Estos nodos deben de estar comunicados por medio de algún tipo de
red de comunicaciones para transmitir datos y órdenes entre los sitios.
La necesidad de almacenar datos de forma masiva dio paso a la
creación de los sistemas de bases de datos.
En 1970 Edgar Frank Codd escribió un artículo con nombre: «A
Relational Model of Data for Large Shared Data Banks» («Un modelo
relacional para grandes bancos de datos compartidos»). Con este
artículo y otras publicaciones, definió el modelo de bases de datos
relacionales y reglas para poder evaluar un administrador de bases de
datos relacionales.
Originalmente se almacenaba la información de manera centralizada,
pero con el paso del tiempo las necesidades aumentaron y esto
produjo ciertos inconvenientes que no era posible solucionarlos o
volverlos eficientes de la forma centralizada.
Estos problemas impulsaron la creación de almacenamiento
distribuido, los cuales hoy en día proveen características
indispensables en el manejo de información; es decir, la combinación
de las redes de comunicación y las bases de datos.
Evolución
Hay varios factores que han hecho que las bases de datos evolucionen
a bases de datos distribuidas.
49. 48En el mundo de los negocios se ha dado una globalización y a la vez
las operaciones de las empresas son cada vez más descentralizadas
geográficamente. También el poder de las computadoras personales
aumentó y el costo de los Mainframes ya no tenía sentido. Además la
necesidad de compartir datos ha hecho que crezca el mercado de las
bases de datos distribuidas.
Las características comunes entre todas las implementaciones de
bases de datos No SQL suelen ser las siguientes:
Consistencia Eventual: A diferencia de las bases de datos relacionales
tradicionales, en la mayoría de sistemas NoSQL, no se implementan
mecanismos rígidos de consistencia que garanticen que cualquier
cambio llevado a cabo en el sistema distribuido sea visto, al mismo
tiempo, por todos los nodos y asegurando, también, la no violación de
posibles restricciones de integridad de los datos u otras reglas
definidas. En su lugar y para obtener un mayor rendimiento, se ofrece
el concepto de “consistencia eventual”, en el que los cambios
realizados “con el tiempo” serán propagados a todos los nodos por lo
que, una consulta podría no devolver los últimos datos disponibles o
proporcionar datos inexactos, problema conocido como lecturas
sucias u obsoletas.
Asimismo, en algunos sistemas NoSQL se pueden presentar perdidas
de datos en escritura.
Esto se conoce también como BASE (Basically Available Soft-state
Eventual Consistency), en contraposición a ACID (Atomicity,
50. 49Consistency, Isolation, Durability), su analogía en las bases de datos
relacionales.
Flexibilidad en el esquema: En la mayoría de base de datos NoSQL,
los esquemas de datos son dinámicos; es decir, a diferencia de las
bases de datos relacionales en las que, la escritura de los datos debe
adaptarse a unas estructuras(o tablas, compuestas a su vez por filas y
columnas) y tipos de datos pre-definidos, en los sistemas NoSQL,
cada registro (o documento, como se les suele llamar en estos casos)
puede contener una información con diferente forma cada vez,
pudiendo así almacenar sólo los atributos que interesen en cada uno
de ellos, facilitando el polimorfismo de datos bajo una misma
colección de información. También se pueden almacenar estructuras
complejas de datos en un sólo documento, como por ejemplo
almacenar la información sobre una publicación de un blog (título,
cuerpo de texto, autor, etc) junto a los comentarios y etiquetas
vertidos sobre el mismo, todo en un único registro.
Escalabilidad horizontal: Por escalabilidad horizontal se entiende la
posibilidad de incrementar el rendimiento del sistema añadiendo,
simplemente, más nodos (servidores) e indicando al sistema cuáles
son los nodos disponibles.
Estructura distribuida: Generalmente los datos se distribuyen, entre
los diferentes nodos que componen el sistema. Hay dos estilos de
distribución de datos:
Particionado (ó Sharding): El particionado distribuye los datos entre
múltiples servidores de forma que, cada servidor, actúe como única
fuente de un subconjunto de datos. Normalmente, a la hora de realizar
esta distribución, se utilizan mecanismos de tablas de hash
distribuidas (DHT).
51. 50Réplica: La réplica copia los datos entre múltiples servidores, de
forma que cada bit de datos pueda ser encontrado en múltiples
lugares. Esta réplica puede realizarse de dos maneras:
Réplica maestro-esclavo en la que un servidor gestiona la escritura de
la copia autorizada mientras que los esclavos se sincronizan con este
servidor maestro y sólo gestionan las lecturas.
Réplica peer-to-peer en la que se permiten escrituras a cualquier nodo
y ellos se coordinan entre sí para sincronizar sus copias de los datos
Tolerancia a fallos y Redundancia: Pese a lo que cualquiera pueda
pensar cuando se habla de NoSQL, no todas las tecnologías existentes
bajo este paraguas usan el mismo modelo de datos ya que, al ser
sistemas altamente especializados, la idoneidad particular de una base
de datos NoSQL dependerá del problema a resolver. Así a todo,
podemos agrupar los diferentes modelos de datos usados en sistemas
NoSQL en cuatro grandes categorías:
Base de datos de Documentos: Este tipo de base de datos almacena la
información como un documento, usando para habitualmente para
ello una estructura simple como JSON, BSON o XML y donde se
utiliza una clave única para cada registro. Este tipo de
implementación permite, además de realizar búsquedas por clave–
valor, realizar consultas más avanzadas sobre el contenidodel
documento. Son las bases de datos NoSQL más versátiles.
Almacenamiento Clave-Valor: Son el modelo de base de datos
NoSQL más popular, además de ser la más sencilla en cuanto a
funcionalidad. En este tipo de sistema, cada elemento está
identificado por una clave única, lo que permite la recuperación de la
información de forma muy rápida, información que suele almacenarse
como un objeto binario. Se caracterizan por ser muy eficientes tanto
para las lecturas como para las escrituras.
52. 51Bases de datos de grafos: Usadas para aquellos datos cuyas relaciones
se pueden representar adecuadamente mediante un grafo. Los datos se
almacenan en estructuras grafo con nodos (entidades), propiedades
(información entre entidades) y líneas (conexiones entre las
entidades).
Base de datos Columnar (o Columna ancha): En vez de“tablas”, en las
bases de datos de columna tenemos familias de columnas que, son los
contenedores de las filas. A diferencia de los RDBMS, no necesita
conocer de antemano todas las columnas, cada fila no tiene por qué
tener el mismo número de columnas. Este tipo de bases de datos se
adecuan mejor a operaciones analíticas sobre grandes conjuntos de
datos.
Pese a todas las opciones proporcionadas por el auge de las bases de
datos NoSQL, esto no significa la desaparición de las bases de datos
de RDBMS ya que son tecnologías complementarias. Estamos
entrando en una era de persistencia políglota, una técnica que utiliza
diferentes tecnologías de almacenamiento de datos para manejar las
diversas necesidades de almacenamiento de datos.
Dentro de los diferentes sistemas de gestión de basede datos, y más
concretamente en este ámbito, Oracle ofrece una base de
datosNoSQL, con características empresariales, denominada Oracle
No SQL; basada, al igual que otras bases de datos NoSQL, en el
motor de Oracle Berkeley DB, estaes una base de datos NoSQL
distribuida y escalable, diseñada para proporcionar una gestión de
datos fiable, flexible y altamente disponible a través de un conjunto
configurable de nodos de almacenamiento, junto con una API de fácil
uso e integración con el resto de productos Oracle.
53. 52Pese a ser pertenecer a la categoría de almacenamientos Clave-Valor,
la base de datos NoSQL de Oracle, permite modelar los datos como
si fuesen tablas en forma similar a como lo haría una base dedatos
relacional, almacenar documentos JSON o, simplemente, pares de
clave y valor. Al igual que otras bases de datos NoSQL, Oracle
NoSQL, es un sistema particionado(donde no se comparte nada), que
distribuye los datos de manera uniforme entre las múltiples
particiones que lo conforman, en base al valor hash de la clave
primaria. Dentro de cada partición, los nodos de almacenamiento se
replican con el fin de garantizar una alta disponibilidad, una rápida
conmutación en el caso de un fallo de nodo y realizar un balanceo
óptimo de la carga que representen las consultas. La base de datos
NoSQL de Oracle base de datos proporciona drivers Java, C, Python y
Node.js, así como, una API REST para simplificar el desarrollo de
aplicaciones web.
Conclusión
Este libro trato de ciertas definiciones de Microsoft
Access y de otras distintas páginas con la cual podemos
realizar o hacer una base de datos.