1. Las bases de datos
Una base de datos o banco de datos es un conjunto de
datos pertenecientes a un mismo contexto y
almacenados sistemáticamente para su posterior uso.
En este sentido; una biblioteca puede considerarse una
base de datos compuesta en su mayoría por
documentos y textos impresos en papel e indexados
para su consulta.
Alexander Rubio Chala
07/12/2017
5. Evolución delabasededatos distribuida----Pág. 78
Basededatos no SQL--------------------------------------Pág. 79
Que es una base de datos
Una base de datos o banco de datos es un conjunto de datos pertenecientes a un
mismo contexto y almacenados sistemáticamente para su posterior uso. En este
sentido; una biblioteca puede considerarse una base de datos compuesta en su
mayoría por documentos y textos impresos en papel e indexados para su consulta.
6. Actualmente, y debido al desarrollo tecnológico de campos como la informática y la
electrónica, la mayoría de las bases de datos están en formato digital, siendo este un
componente electrónico, por tanto se ha desarrollado y se ofrece un amplio rango de
soluciones alproblema del almacenamiento de datos.
Existen programas denominados sistemas gestores de bases de datos, abreviado SGBD
(del inglés data base management system o DBMS), que permiten almacenar y
posteriormente acceder a los datos de forma rápida y estructurada. Las propiedades de
estos DBMS, así como su utilización y administración, se estudian dentro del ámbito
de la informática.
Las aplicaciones más usuales son para la gestión de empresas e instituciones públicas;
También son ampliamente utilizadas en entornos científicos con el objeto de
almacenar la información experimental.
Clasificacióndebasesdedatos
Base de datos de particulares
Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto que
se esté manejando, la utilidad de las mismas o lasnecesidades que satisfagan.
7. Según la variabilidad de la base de
datos
Bases de datos estáticas
Son bases de datos únicamente de lectura, utilizadas primordialmente para almacenar
datos históricos que posteriormente se pueden utilizar para estudiar el
comportamiento de un conjunto de datos a través del tiempo, realizar proyecciones,
tomar decisiones y realizar análisis de datos para inteligencia empresarial.
Bases de datos dinámicas
Son bases de datos donde la información almacenada se modifica con el tiempo,
permitiendo operaciones como actualización, borrado y edición de datos, además de
las operaciones fundamentales de consulta. Un ejemplo, puede ser la base de datos
utilizada en un sistema de información de un supermercado.
Según el contenido
Bases de datos bibliográficas
Solo contienen un subrogante (representante) de la fuente primaria, que permite
localizarla. Un registro típico de una base de datos bibliográfica contiene información
8. sobre el autor, fecha de publicación, editorial, título, edición, de una determinada
publicación, etc. Puede contener un resumen o extracto de la publicación original, pero
nunca el texto completo, porque si no, estaríamos en presencia de una base de datos a
texto completo (o de fuentes primarias —ver más abajo). Como su nombre lo indica,
el contenido son cifras o números. Por ejemplo, una colección de resultados de análisis
de laboratorio, entre otras.
Bases de datos de texto completo
Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las
ediciones de una colección de revistas científicas.
Directorios
Un ejemplo son las guíastelefónicas en formato electrónico.
Estos directorios se pueden clasificar en dos grandes tipos dependiendo de si son
personales o empresariales (llamadas páginasblancas o amarillasrespectivamente).
Los directorios empresariales hayde tres tipos
9. Tienen nombre de la empresa y dirección Ejemplo
Contienen teléfono y los más avanzados contienen correo electrónico Ejemplo
Contienen datos como facturación o número de empleados además de códigos
nacionales que ayudana su distinción Ejemplo
Los directorios personales solo hay de un tipo, ya que leyes como la LOPD en España
protege la privacidad de los usuarios pertenecientes aldirectorio
La búsqueda inversa está prohibida en los directorios personales (a partir de un
número de teléfono saber el titular de la línea)
Bases de datos o "bibliotecas" de información
química o biológica
Son bases de datos que almacenan diferentes tipos de información proveniente de la
química, las ciencias de la vida o médicas. Se pueden considerar en varios subtipos:
Las que almacenan secuencias de nucleótidos o proteínas.
Las bases de datos de rutas metabólicas.
Bases de datos de estructura, comprende los registros de datos experimentales sobre
estructuras 3D de biomoléculas-
10. Bases de datos clínicas.
Bases de datos bibliográficas (biológicas, químicas, médicas y de otros campos):
PubChem, Medline, EBSCOhost.
Modelos de bases de datos
Además de la clasificación por la función de las bases de datos, estas también se
pueden clasificar de acuerdo a su modelo de administración de datos.
Un modelo de datos es básicamente una "descripción" de algo conocido como
contenedor de datos (algo en donde se guardan los datos), así como de los métodos
para almacenar y recuperar datos de esos contenedores. Los modelos de datos no son
cosas físicas: son abstracciones que permiten la implementación de un sistema eficiente
de base de datos; por lo general se refieren a algoritmos, yconceptos matemáticos.
Tiposdebasesdedatos
11. Bases de datos jerárquicas
Artículo principal: Base de datos jerárquica
En este modelo los datos se organizan en forma de árbol invertido (algunos dicen raíz),
en donde un nodo padre de información puede tener varios hijos. El nodo que no tiene
padres es llamado raíz, y a los nodos que no tienen hijos se los conoce como hojas.
Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que
manejan un gran volumen de información y datos muy compartidos permitiendo
crear estructuras estables y de gran rendimiento.
Una de las principales limitaciones de este modelo es su incapacidad de representar
eficientemente la redundancia de datos.
Base de datos de red
12. Artículo principal: Base de datos de red
Este es un modelo ligeramente distinto del jerárquico; su diferencia fundamental es la
modificación del concepto de nodo: se permite que un mismo nodo tenga varios padres
(posibilidad no permitida en el modelo jerárquico).
Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una solución
eficiente al problema de redundancia de datos; pero, aun así, la dificultad que significa
administrar la información en una base de datos de red ha significado que sea un
modelo utilizado en su mayoría por programadores más que por usuarios finales.
Bases de datos transaccionales
Son bases de datos cuyo único fin es el envío y recepción de datos a grandes
velocidades, estas bases son muy poco comunes y están dirigidas por lo general al
entorno de análisis de calidad, datos de producción e industrial, es importante
entender que su fin único es recolectar y recuperar los datos a la mayor velocidad
posible, por lo tanto la redundancia y duplicación de información no es un problema
como con las demás bases de datos, por lo general para poderlas aprovechar al
máximo permiten algún tipo de conectividad a bases de datos relacionales.
13. Un ejemplo habitual de transacción es el traspaso de una cantidad de dinero entre
cuentas bancarias. Normalmente se realiza mediante dos operaciones distintas, una en
la que se debita el saldo de la cuenta origen y otra en la que acreditamos el saldo de la
cuenta destino. Para garantizar la atomicidad del sistema (es decir, para que no
aparezca o desaparezca dinero), las dos operaciones deben ser atómicas, es decir, el
sistema debe garantizar que, bajo cualquier circunstancia (incluso una caída del
sistema), el resultado final es que, o bien se han realizado las dos operaciones, o bien
no se ha realizado ninguna.
Bases de datos relacionales
Artículo principal: Modelo relacional
Artículo principal: Base de datos relacional
Este es el modelo utilizado en la actualidad para representar problemas reales y
administrar datos dinámicamente. Tras ser postulados sus fundamentos en 1970 por
Edgar Frank Codd, 2 de los laboratorios IBM en San José (California), no tardó en
consolidarse como un nuevo paradigma en los modelos de base de datos. Su idea
fundamental es el uso de "relaciones". Estas relaciones podrían considerarse en forma
lógica como conjuntos de datos llamados "tuplas". Pese a que esta es la teoría de las
bases de datos relacionales creadas por Codd, la mayoría de las veces se conceptualiza
de una manera más fácil de imaginar.
14. Esto es pensando en cada relación como si fuese una tabla que está compuesta por
registros (las filas de una tabla), que representarían las tuplas, y campos (las columnas
de una tabla).
En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia
(a diferencia de otros modelos como el jerárquico y el de red).
Esto tiene la considerable ventaja de que es más fácil de entender y de utilizar para un
usuario esporádico de la base de datos. La información puede ser recuperada o
almacenada mediante "consultas" que ofrecen una amplia flexibilidad y poder para
administrar la información.
El lenguaje más habitual para construir las consultas a bases de datos relacionales es
SQL, Structured Query Language o Lenguaje Estructurado de Consultas, un estándar
implementado por los principales motores o sistemas de gestión de bases de datos
relacionales.
Durante su diseño, una base de datos relacional pasa por un proceso al que se le
conoce como normalización de una base de datos.
Bases de datos multidimensionales
Artículo principal: Base de datos multidimensional
15. Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creación
de Cubos OLAP.
Básicamente no se diferencian demasiado de las bases de datos relacionales (una tabla
en una base de datos relacional podría serlo también en una base de datos
multidimensional), la diferencia está más bien a nivel conceptual; en las bases de datos
multidimensionales los campos o atributos de una tabla pueden ser de dos tipos, o
bien representan dimensiones de la tabla, o bien representan métricas que se desean
aprender.
Bases de datos orientadas a objetos
Artículo principal: Base de datos orientada a objetos
Este modelo, bastante reciente, y propio de los modelos informáticos orientados a
objetos, trata de almacenar en la base de datos los objetos completos (estado y
comportamiento).
Una base de datos orientada a objetos es una base de datos que incorpora todos los
conceptos importantes del paradigma de objetos:
Encapsulación - Propiedad que permite ocultar la información al resto de los objetos,
impidiendo así accesos incorrectos o conflictos.
Herencia - Propiedad a través de la cual los objetos heredan comportamiento dentro de
una jerarquía de clases.
16. Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a
distintos tipos de objetos.
En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre
los datos como parte de la definición de la base de datos. Una operación (llamada
función) se especifica en dos partes. La interfaz (o signatura) de una operación incluye
el nombre de la operación y los tipos de datos de sus argumentos (o parámetros).
La implementación (o método) de la operación se especifica separadamente y puede
modificarse sin afectar la interfaz. Los programas de aplicación de los usuarios pueden
operar sobre los datos invocando a dichas operaciones a través de sus nombres y
argumentos, sea cual sea la forma en la que se han implementado. Esto podría
denominarse independencia entre programas y operaciones.
SQL: 2003, es el estándar de SQL92 ampliado, soporta los conceptos orientados a
objetos y mantiene la compatibilidad con SQL92.
Bases de datos documentales
Artículo principal: Base de datos documental
17. Permiten la indexación a texto completo, y en líneas generales realizar búsquedas más
potentes, sirven para almacenar grandes volúmenes de información de antecedentes
históricos. Tesaurus es un sistema de índices optimizado para este tipo de bases de
datos.
Bases de datos deductivas
Un sistema de base de datos deductiva, es un sistema de base de datos pero con la
diferencia de que permite hacer deducciones a través de inferencias. Se basa
principalmente en reglas y hechos que son almacenados en la base de datos. Las bases
de datos deductivas son también llamadas bases de datos lógicas, a raíz de que se basa
en lógica matemática. Este tipo de base de datos surge debido a las limitaciones de la
Base de Datos Relacional de responder a consultas recursivas y de deducir relaciones
indirectas de los datos almacenados.
Evolucióndelasbasesdedatos
18. Las bases de datos se han constituido como una de las herramientas más ampliamente
difundidas en la actual sociedad de la información, utilizadas como fuentes
secundarias en cuanto recuperación y almacenamiento de información en todos los
campos ha nivel científico, social, económico, político ycultural.
A partir de este trabajo queremos llegar a presentar una panorámica histórica de las
bases de datos sistematizadas y su evolución a través de las décadas, las cuales han
sido utilizadas especialmente como fuentes de consulta y de producción de
19. conocimiento por investigadores, científicos y académicos de todas las áreas, que han
encontrado en estas, una herramienta importante para el desarrollo del conocimiento.
De esta manera la Ciencia de la Información, ha desarrollado una producción
científica importante a nivel mundial, la cual ha utilizado las bases de datos, como
repositorio de almacenamiento y difusión de información.
Por lo anterior haremos un énfasis en mostrar una vista histórica de las bases de datos
y los principales distribuidores en nuestra área del saber, de tal manera que sirva como
referente de consulta de estudiantes, profesores e interesados en el tema, que conozcan
en contexto y el desarrollo de estás fuentes, para concienciar acerca de las
herramientas que se encuentran disponibles para el uso y aportes que podemos hacer
en nuestra área del saber.
El uso de sistemas de bases de datos automatizadas, se desarrollo a partir de la
necesidad de almacenar grandes cantidades de datos, para su posterior consulta,
producidas por las nuevas industrias que creaban gran cantidad de información.
Herman Hollerith (1860-1929) fue denominado el primer ingeniero estadístico de la
historia, ya que invento una computadora llamada “Máquina Automática Perforadora
de Tarjetas”.
20. Para hacer el censo de Estados Unidos en 1880 se tardaron 7 años para obtener
resultados, pero Herman Hollerith en 1884 creo la máquina perforadora, con la cual,
en el censo de 1890 dio resultados en 2 años y medio, donde se podía obtener datos
importantes como número de nacimientos, población infantil y número de familias. La
máquina usó sistemas mecánicos para procesar la información de las tarjetas y para
tabular los resultados.
A diferencia con la maquina de Babbage, que utilizaba unas tarjetas similares, estas se
centraban en dar instrucciones a la máquina.
En el invento de Herman Hollerith, cada perforación en las tarjetas representaba un
número y cada dos perforaciones una letra, cada tarjeta tenia capacidad para 80
variables. La máquina estaba compuesta por una perforadora automática y una
lectora, la cual por medio de un sistema eléctrico leía los orificios de las tarjetas, esta
tenía unas agujas que buscaban los orificios y al tocar el plano inferior de mercurio
enviaba por medio del contacto eléctrico los datos a la unidad.
Década de 1950
En este lapso de tiempo se da origen a las cintas magnéticas, las cuales sirvieron para
suplir las necesidades de información de las nuevas industrias. Por medio de este
mecanismo se empezó a automatizar la información de las nóminas, como por ejemplo
el aumento de salario. Consistía en leer una cinta o más y pasar los datos a otra, y
también se podían pasar desde las tarjetas perforadas. Simulando un sistema de
21. Backup, que consiste en hacer una copia de seguridad o copia de respaldo, para
guardar en un medio extraíble la información importante. La nueva cinta a la que se
transfiere la información pasa a ser una cinta maestra.
Estas cintas solo se podían leer secuencial y ordenadamente.
Década de 1960
El uso de los discos en ese momento fue un adelanto muy efectivo, ya que por medio de
este soporte se podía consultar la información directamente, esto ayudo a ahorrar
tiempo. No era necesario saber exactamente donde estaban los datos en los discos, ya
que en milisegundos era recuperable la información.
A diferencia de las cintas magnéticas, ya no era necesaria la secuencialidad, y este tipo
de soporte empieza a ser ambiguo.
Los discos dieron inicio a las Bases de Datos, de red y jerárquicas, pues los
programadores con su habilidad de manipulación de estructuras junto con las
ventajas de los discos era posible guardarestructuras de datos como listas y árboles.
22. Década de 1970
Edgar Frank Codd (23 de agosto de 1923 – 18 de abril de 2003), en un artículo "Un
modelo relacional de datos para grandes bancos de datos compartidos" ("A Relational
Model of Data for Large Shared Data Banks") en 1970, definió el modelo relacional y
publicó una serie de reglas para la evaluación de administradores de sistemas de datos
relacionales y así nacieron las bases de datos relacionales.
A partir de los aportes de Codd el multimillonario Larry Ellison desarrollo la base de
datos Oracle, el cual es un sistema de administración de base de datos, que se destaca
por sus transacciones, estabilidad, escalabilidad ymultiplataforma.
Inicialmente no se uso el modelo relacional debido a que tenía inconvenientes por el
rendimiento, ya que no podían ser competitivas con las bases de datos jerárquicas y de
red. Ésta tendencia cambio por un proyecto de IBM el cual desarrolló técnicas para la
construcción de unsistema de bases de datos relacionales eficientes, llamado System R.
Década de 1980
Las bases de datos relacionales con su sistema de tablas, filas y columnas, pudieron
competir con las bases de datos jerárquicas y de red, ya que su nivel de programación
era bajo y su uso muy sencillo.
23. En esta década el modelo relacional ha conseguido posicionarse del mercado de las
bases de datos. Y también en este tiempo se iniciaron grandes investigaciones paralelas
y distribuidas, como las bases de datos orientadas a objetos.
Principios década de los 90
Para la toma de decisiones se crea el lenguaje SQL, que es un lenguaje programado
para consultas.
El programa de alto nivel SQL es un lenguaje de consulta estructurado que analiza
grandes cantidades de información el cual permite especificar diversos tipos de
operaciones frente a la misma información, a diferencia de las bases de datos de los 80
que eran diseñadas para las aplicaciones de procesamiento de transacciones. Los
grandes distribuidores de bases de datos incursionaron con la venta de bases de datos
orientada a objetos.
Finales de la década de los 90
El boom de esta década fue la aparición de la WWW “Word Wide Web” ya que por
éste medio se facilitaba la consulta de las bases de datos. Actualmente tienen una
amplia capacidad de almacenamiento de información, también una de las ventajas es
el servicio de siete días a la semana las veinticuatro horas del día, sin interrupciones a
menos que haya planificaciones de mantenimiento de las plataformas o el software.
Siglo XXI
24. En la actualidad existe gran cantidad de alternativas en línea que permiten hacer
búsquedas orientadas a necesidades especificas de los usuarios, una de las tendencias
más amplias son las bases de datos que cumplan con el protocolo Open Archives
Initiative – Protocol for Metadata Harvesting (OAI-PMH) los cuales permiten el
almacenamiento de gran cantidad de artículos que permiten una mayor visibilidad y
acceso en el ámbito científico y general.
Cuatro generaciones han manejado datos de computación: Sistema de Administración
de Archivos, Sistemas de administración de Bases de Datos Jerárquicos, Sistemas de
Administración de Bases de Datos por Relación, Sistemas de Administración
Orientada a Objetos de Bases de Datos. Al principio los lenguajes y las instrucciones de
máquina eren similares, lo que producía un modelo de programación orientada a
procesos.
En un principio los programas ejecutaban las tareas y nunca las escribían en un
dispositivo de almacenamiento. Sin embargo, los programadores se dieron cuenta del
valor de registrar los resultados.
25. La grabación aumentó con la aparición del almacenamiento en discos magnéticos
rotatorios.
Formularios
26. La función del formulario es que sirve para guardar información en la base de datos
sin tener que recurrir a Access , un formulario es una ventana de programa en la cual
se le indica al usuario que datos se requieren de el para ser ingresados en la base de
datos , un ejemplo muy clásico es el de las páginas de internet como yahoo que tienes
que llenar un formulario para que esos datos se guarden y puedas crear tu cuenta , un
formulario es un programa independiente a Access para poder guardar información.
Usos de los formularios.- Se pueden emplear para recoger cualquier tipo de
información, como por ejemplo:
Crear un formulario de registro para conocer quiénes son sus usuarios.
Proporcionar un formulario de comentarios para recoger las opiniones de los usuarios.
27. Diseñar un formulario web para actualizar una base de datos.
Desarrollar una herramienta de búsqueda para buscar en el sitio web.
Ofrecer un registro online para un acontecimiento, conferencia o concurso.
Crear un sistema de nombre y usuario para restringir el acceso al sitio
A través de los formularios haremos clic en Botones, seleccionaremos Casillas de
verificación, teclearemos texto y seleccionaremos Opciones de las listas desplegables.
Después de rellenar un formulario, a través del botón denominado Enviar la
información se enviará a un "gestor de formulario" que puede hacer varias cosas con
los datos:
Almacenar los datos en un archivo de texto para recuperarlos mástarde.
Enviar los datos por correo electrónico directamente al administrador de la web.
Añadir la información desde los formularios a la base de datos
Introducir directamente los datos en una página web del sitio.
Es importante crear una página de confirmación que informe al usuario de que los
datos han sido recibidos y aceptados. Igualmente esta página de confirmación
proporciona al usuario un enlace para volver a la página principal o a la página desde
la que se hizo la encuesta.
28. Clasificación de formularios
Determinar para cada caso cuál clasificación es más conveniente a los fines de control
que se persiguen y a la empresa en que se aplica.
Número correlativo: asignar un número de código a todos los formularios. Éste es poco
flexible y se desactualizada constantemente por lo que es ideal para empresas
pequeñas.
Por área emisora:
29. Asignar a cada departamento un millar de números, de códigos o una centena de
acuerdo a la magnitud.
Compras: 0000 al 0999
Contabilidad 1000 al 1999
Ventas 2000 al 2999
Asignar los dígitos característicos a cada área y un número correlativo.
Compras 01 – XXXX
Contabilidad 02 – XXXX
Ventas 03 - XXXX
Por el procedimiento en que interviene: Es el que presenta mayores ventajas por la fácil
ubicación del formulario por parte del usuario.
Sistemas de control de formularios
Es un plan o método usado por la gerencia para guiar y regular las operaciones de
oficina, mediante la normalización del flujo de papeles, donde se detecta la necesidad
de realizar ajustes o para utilizar los formularios en forma más eficiente y mantener el
seguimiento a cada formulario implantado.
Consideraciones generales de los sistemas de control
30. Eliminar los formularios innecesarios y evitar su creación, consolidar formularios que
se complementen, rediseñar formularios para aumentar la eficiencia y disminuir los
errores.
Nivel de organización.
El control de formularios se debe centrar en un lugar suficientemente alto dentro de la
organización como para dar una visión amplia, necesaria para la revisión,
coordinación y mejora de la instalación de los formularios. Se debe tomar en cuenta la
opinión del analista y de los usuarios, ya que el analista es quien decide cómo deben ir
distribuidos los datos y el usuario decide cuáles son los datos necesarios.
Control de formularios.
En la etapa del control de formularios se incluye el establecimiento de un programa de
control como política de la empresa y la comprensión de los factores que componen el
problema. Debe existir relación entre el control y, los sistemas y procedimientos. Los
componentes básicos de este programa deben ser la función que efectúa la forma, el
tema principal de la forma y el tema secundario.
31. El índice funcional
Es la principal herramienta en la unidad de control, contiene los formularios
agrupados de acuerdo con el propósito a que sirven. El índice funcional es para uso
exclusivo de quienes son responsables del control de formularios. Los formularios
destinados a propósitos similares pueden ser analizados para determinar cuál puede
ser eliminado y cuál puede ser más ampliamente usado. Para las necesidades de
nuestras empresas, es suficiente con los propósitos de acordar autorizar, facturar,
instruir, notificar, registrar, reportar y requerir.
Pasos para la elaboración de unformulario.
Tomar muestra de todos los formularios, posteriormente agrupar los formularios por
los que se hayan escogido, así como las subdivisiones de esos temas, y codificar por
temas, agrupar por función, codificar por función, preparar carpetas para archivar las
muestras, preparar una lista tabulada con la información del número y nombre del
formulario, y el número de índice funcional que le corresponde.
Consideraciones generales para la elaboración de un formulario.
32. Debemos considerar ciertos aspectos para elaborar un formulario exitosamente, el
primer aspecto a considerar es realizar una revisión y determinar la necesidad del
formulario y si existen formularios que compartan en mismo objetivo. Posteriormente
elegir el tamaño estándar de papel y letra adecuada para el diseño e impresión, y de
ahíelaborar una lista con toda la formación que contendrá el formulario.
Determinar espacios horizontales para cada dato y la mejor distribución de estos, de
acuerdo con los responsables de su llenado, que debe ser a mano o a máquina,
evitando áreas libres o desperdicios de papel yexceso de zonas sombreadas.
Una vez realizada esta revisión se procede a poner a prueba el formulario, por tres
meses y constatar si cumple su objetivo.
Tipos de formularios
Formularios Pre-impresos.
Los formularios que se envían a una industria gráfica para su confección, pueden ser
de diferente tipo:
Hojas Sueltas. Son los formularios que se requieren individualmente. Dependiendo a
quién se solicite el trabajo (industria gráfica o imprenta), el sistema de impresión varía
entre máquinas tipográficas y, rotativas (con corte posterior para formar la hoja
33. suelta). Se utilizan hojas sueltas cuando la información a consignarse normalmente es
manuscrita o máquina de escribir.
Hojas Continuas. Son formularios cuya producción se realiza en máquinas rotativas.
Permiten que la información que se consigne sea impresa por una impresora Ejemplos
de formularios continuos: Cheques, Roles de Pago, Comprobantes de Egreso, Facturas,
etc.
Tarjetas. Son formularios realizados en un gramaje especial normalmente en cartulina.
El gramaje dependerá del uso que se le quiera dar a la tarjeta. Existen tarjetas de
presentación, tarjetas de Control de Entrada y Salida del Personal, Tarjetas Kardex,
etc.
Sobres. Los sobres son realizados en formas, tamaños ygramajes especiales.
Existen sobres tamaño oficio, sobres tamaño carta, sobres manila o bolsa y sobres de
enrutamiento de correspondencia. Es conveniente que los sobres bolsa y de
enrutamiento de correspondencia, se realicen en un gramaje de 110 a 120 gramos para
permitir el manipuleo continuo y transportación del contenido sin riesgos.
Formularios electrónicos
34. Los formularios electrónicos vienen a minimizar muchas de las desventajas de los que
se presentan en papel. Es posible diseñar un formulario electrónico de manera que
contenga información de ayuda para la persona que tenga que rellenarlo. Estos
formularios electrónicos pueden contener campos de texto de una longitud prefijada, o
bien de longitud variable. Los campos de lista desplegable ofrecen una serie de
opciones de entre las cuales el usuario debe elegir una. Para las respuestas del tipo "si"
o "no", puede crearse campos con casillas de verificación de forma que el usuario se
puede limitar a hacer clic con el ratón para que aparezca una "X" en la casilla
adecuada.
También es posible especificar una serie de respuestas "por omisión" en campos
específicos, con vistas a facilitar aún más la labor de cumplimentación del formulario.
Puesto que el formulario se rellena desde la propia computadora, se evitan todos los
posibles problemas de interpretación de los datos introducidos, como sucede con los
formularios en papel rellenos a mano. Además, si la computadora está conectada a
una red, los formularios electrónicos pueden ser cumplimentados y compartidos de la
misma forma que se comparte cualquier otro tipo de documento, eliminando así por
completo la necesidad de los formularios en papel. Windows viene con muchos
programas accesorios útiles, incluyendo un procesador de texto elemental (WordPad),
un programa de gráficos (Paint) y un programa de comunicación (HyperTerminal).
También proporciona varias herramientas útiles, como Calculadora (Calculator) y
35. Block de notas (Notepad). Para otras funciones (de acuerdo a las necesidades), se
utiliza el Microsoft Office, en el cual es posible diseñar formularios electrónicos que
garantizan una rápida y correcta recogida de información.
Tipos de campos en formularios
Se pueden usar diversos tipos de campos en los formularios. Aunque los datos siempre
se capturan como cadenas de caracteres, difieren respecto a la forma en que se
presenta su captura. Hay que matizar que no es posible hacer ningún tipo de
comprobación sobre los datos que el usuario va introduciendo (ello se haría
posteriormente en el propio script, o bien usando JavaScript).
Componentes de una base de datos
36. Tablas: comprende definición de tablas, campos, relaciones e índices. Es el componente
principal de lasBases de Datos Relacionales.
Formularios: se utilizan principalmente para actualizar datos.
Consultas: se utilizan para ver, modificar y analizar datos.
Informes: se utilizan para presentar los datos en formato impreso.
37. Macros: conjunto de instrucciones para realizar una operación determinada.
Tablas
38. Tabla en las bases de datos, se refiere al tipo de modelado de datos, donde se guardan
los datos recogidos por un programa. Su estructura general se asemeja a la vista
general de un programa de hoja de cálculo.
Una tabla es utilizada para organizar y presentar información. Las tablas se
componen de filasy columnas de celdas que se pueden rellenar con textos y gráficos.
Cada tabla creada debe tener un nombre único en la Base de Datos, haciéndola
accesible mediante su nombre o su seudónimo (Alias) (dependiendo del tipo de base
de datos elegida). La estructura de las tablas viene dada por la forma de un archivo
plano, los cuales en un inicio se componían de unmodo similar.
Las tablas son los objetos principales de bases de datos que se utilizan para guardar
datos.
Tipostablas
39. Tipos de tablas proporcionales
Además de la función estándar de las tablas básicas definidas por el usuario, el Server
nos proporciona los siguientes tipos de tabla, el método cuántico que permiten llevar a
cabo objetivos especiales en una base de datos: que se utiliza para acomodar
cuánticamente los datos obtenidos de los datos del exterior.
Tablas con particiones
Las tablas con particiones son tablas cuyos datos se han dividido horizontalmente
entre unidades que pueden repartirse por más de un grupo de archivos de una base de
datos. Las particiones facilitan la administración de las tablas y los índices grandes
porque permiten obtener acceso y administrar subconjuntos de datos con rapidez y
eficacia al mismo tiempo que mantienen la integridad del conjunto. Las operaciones
40. como, por ejemplo, la carga de datos de un sistema OLTP a un sistema OLAP, pueden
realizarse en cuestión de segundos en lugar de minutos u horas en otras versiones. Las
operaciones de mantenimiento que se realizan en los subconjuntos de datos también se
realizan de forma más eficaz porque sólo afectan a los datos necesarios en lugar de a
toda la tabla.
Tiene sentido crear una tabla con particiones si la tabla es muy grande o se espera que
crezca mucho, ysi alguna de las dos condiciones siguientes es verdadera:
La tabla contiene, o se espera que contenga, muchos datos que se utilizan de manera
diferente.
Las consultas o las actualizaciones de la tabla no se realizan como se esperaba o los
costos de mantenimiento son superiores a los períodos de mantenimiento predefinidos.
Las tablas con particiones admiten todas las propiedades y características asociadas
con el diseño y consulta de tablas estándar, incluidas las restricciones, los valores
predeterminados, los valores de identidad y marca de tiempo, los desencadenadores y
los índices. * Por lo tanto, si desea implementar una vista con particiones que sea local
respecto a un servidor, debe implementar una tabla con particiones. Para obtener
información para comprender, diseñar e implementar tablas con particiones, vea
Tablas e índices con particiones.
41. Tablas del sistema
SQL Server almacena los datos que definen la configuración del servidor y de todas sus
tablas en un conjunto de tablas especial, conocido como tablas del sistema. Los
usuarios no pueden consultar ni actualizar directamente las tablas del sistema si no es
a través de una conexión de administrador dedicada (DAC) que sólo debería utilizarse
bajo la supervisión de los servicios de atención al cliente de Microsoft. Para obtener
más información, vea Usar una conexión de administrador dedicada. Las tablas de
sistema se cambian normalmente en cada versión nueva de SQL Server. Puede que las
aplicaciones que hacen referencia directamente a las tablas del sistema tengan que
escribirse de nuevo para poder actualizarlas a una versión nueva de SQL Server con
una versión diferente de las tablas de sistema. La información de las tablas del sistema
está disponible a través de las vistas de catálogo. Para obtener más información, vea
Tablas del sistema (Transact-SQL).
Con las tablas anchas, puede crear esquemas flexibles dentro de una aplicación. Puede
agregar o quitar columnas siempre que lo desee. Tenga presente que el uso de tablas
anchas tiene consideraciones de rendimiento únicas, como e13eunos mayores requisitos
de memoria en tiempo de ejecución y en tiempo de compilación. Para obtener más
información, vea Consideraciones de rendimiento para las tablas anchas.
42. Registro
En informática, o concretamente en el contexto de una base de datos relacional, un
registro (también llamado fila o tupla) representa un objeto único de datos
implícitamente estructurados en una tabla. En términos simples, una tabla de una
base de datos puede imaginarse formada de filas y columnas o campos. Cada fila de
43. una tabla representa un conjunto de datos relacionados, y todas las filas de la misma
tabla tienen la misma estructura.
Un registro es un conjunto de campos que contienen los datos que pertenecen a una
misma repetición de entidad. Se le asigna automáticamente un número consecutivo
(número de registro) que en ocasiones es usado como índice aunque lo normal y
práctico es asignarle a cada registro un campo clave para su búsqueda.
Campos
44. En informática, un campo es un espacio de almacenamiento para un dato en
particular.1
En las bases de datos, un campo es la mínima unidad de información a la que se puede
acceder; un campo o un conjunto de ellos forman un registro, donde pueden existir
campos en blanco, siendo este un error del sistema operativo. Aquel campo que posee
un dato único para una repetición de entidad, puede servir para la búsqueda de una
entidad específica.
En las hojasde cálculo los campos son llamados "celdas".
Tipos de campos informáticos
45. Un campo puede ser de tipo:
Alfanumérico: contiene cifras numéricas y caracteres alfabéticos.
Numérico: existen de varios tipos principalmente como enteros y reales.
Auto incrementable: son campos numéricos enteros que incrementan en una unidad
su valor para cada registro incorporado.
Su utilidad resulta más que evidente: servir de identificador registro.
Booleano: admite dos valores, «verdadero» ó «falso».
Fechas: almacenan fechas facilitando posteriormente su explotación. Almacenar fechas
de esta forma posibilita ordenar los registros por fechas o calcular los días entre una
fecha y otra.
Memo: son campos alfanuméricos de longitud ilimitada. Presentan el inconveniente de
no poder ser indexados.
Tipos de tabla en my SQL
46. ISAM.- es el formato de almacenaje más antiguo, y posiblemente pronto desaparecerá.
Presentaba limitaciones (los ficheros no eran transportables entre máquinas con
distinta arquitectura, no podía manejar ficheros de tablas superiores a 4 gigas). Si aun
tienes tablas tipo ISAM, cámbialas a MYISAM.
MYISAM.- es el tipo de tabla por defecto en MySQL desde la versión 3.23. Optimizada
para sistemas operativos de 64 bits, permite ficheros de mayor tamaño que ISAM.
Además los datos se almacenan en un formato independiente, con lo que se pueden
copiar tablas de una máquina a otra de distinta plataforma. Posibilidad de indexar
campos BLOB y TEXT
47. HEAP.- Crea tablas en memoria. Son temporales y desaparecen cuando el servidor se
cierra; a diferencia de una tabla TEMPORARY, que solo puede ser accedida por el
usuario que la crea, una tabla HEAP puede ser utilizada por diversos usuarios.
BDB.- Base de datos Berkeley. TST. Solo en MySQL MAX
INNODB.- TST, ACID, con posibilidad de commit, rollback, recuperación de errores y
bloqueo a nivel de fila.
MERGE más que un tipo de tabla es la posibilidad de dividir tablas MYISAM de gran
tamaño (solo útil si son verdaderamente de GRAN tamaño) y hacer consultas sobre
todas ellas con mayor rapidez. Las tablas deben ser myisam e idénticas en su
estructura.
MySQL nos permite variar el tipo de tabla después de que esta fue creada.
TST se refiere a ‘Transactions safe tables’, o tablas para transacciones seguras. A este
tipo pertenecen DBD e INNODB.
Las tablas tipo TST son menos rápidas y ocupan mas memoria, pero a cambio ofrecen
mayor seguridad frente a fallos durante la consulta.
Las tablas TST están disponibles desde la versión 4.0 de MySQL
48. Las tablas TST permiten ir introduciendo consultas y finalizar con un COMMIT (que
las ejecuta) o ROLLBACK (que ignora los cambios)
En bases de datos se denomina ACID a un conjunto de características necesarias para
que una serie de instrucciones puedan ser consideradas como una transacción. Así
pues, si un sistema de gestión de bases de datos es ACID compliant quiere decir que el
mismo cuenta con las funcionalidades necesarias para que sus transacciones tengan
las características ACID.
En concreto ACID es un acrónimo de Atomicity, Consistency, Isolation and Durability:
Atomicidad, Consistencia, Aislamiento y Durabilidad en español.
HistoriadeMicrosoftAccess
49. Fue llamado EB ("Embedded Basic") que se utilizaría en la mayoría de software
Microsoft hasta la llegada de VBA. También se buscaba que Omega funcionara como
front-end para Microsoft SQL Server.
Omega requería una enorme cantidad de recursos de los procesadores 386 disponibles
en la época para usos comerciales, retrasando su llegada desde el primer cuatrimestre
de 1990 hasta enero de 1991. Más tarde partes del proyecto fueron utilizados para otros
proyectos de Microsoft. Cirrus (nombre clave para Access) y Thunder (nombre clave
para Visual Basic, en el que se utilizó el motor Embedded Basic). Tras el adelanto de
Access, Omega fue demostrado ante varios periodistas en 1992 y Access presentaba
funciones que no tenía.
Después de la cancelación de Omega, algunos de sus desarrolladores fueron
reasignados al proyecto Cirrus (la mayoría fue a parar al equipo creador de Visual
Basic). Su meta era crear un competidor de productos como dBase y Paradox en el
entorno Windows. El proyecto pareció condenado con la compra de FoxPro (una app
de base de datos completamente diferente a Access) por parte de Microsoft, pero la
compañía decidió continuar con el desarrollo de Cirrus. Al principio se asumió que el
producto usaría el motor Extensible Storage Engine (Jet Blue) pero al final fue
reemplazado por otro motor llamado Microsoft Jet Data base Engine (Jet Red).
50. El proyecto usó partes del código escrito para Omega y una versión pre-publicada de
Visual Basic. En julio de 1992, llegó la versión final con el nombre de Access que
continua hasta el momento unicultural 2017.
Requisitos para versiones antiguas
Requisitos de hardware
Un equipo personal o multimedia con un microprocesador 486 o superior.
80 megabytes (MB) de memoria de acceso aleatorio (RAM) para que se ejecute en
Microsoft Windows 95 y Windows 98 o 16 MB de memoria RAM para ejecutar en
Microsoft Windows NT y Microsoft Windows 2000. Puede que tenga más memoria
para ejecutar más aplicaciones simultáneamente.
Unidad de CD-ROM o unidad de disco de 3,5 pulgadas de alta densidad. Si desea
recibir Microsoft Access 97 en discos de 3,5 pulgadas, deberá canjear un cupón adjunto
en la versión en CD-ROM.
Resolución VGA o adaptador de vídeo superior (Súper VGA (SVGA) se recomienda 256
colores).
Microsoft Mouse, Microsoft IntelliMouse o dispositivo señalador compatible.
Espacio en disco duro
Los requisitos de espacio de disco duro siguientes son aproximados:
51. 44 MBpara una instalación típica
60 MB para una instalación personalizada con todas las opciones
32 MB para ejecutar desde CD-ROM de instalación
Requisitos para usos adicionales
Módem de 9600 baudios o superior (14400 baudios o superior, es lo recomendable).
Si piensa crear páginas Web dinámicas, la característica "Publicar en el Web" requiere
software de Internet Information Server (IIS) o Microsoft Personal Web Server para
Windows 95 en el equipo donde residen las páginas Web. Esto no tiene que ser el
mismo equipo donde se utiliza Microsoft Access 97 para crear las páginasWeb.
Requisitos de la versión2013
52. Procesador de x32 o x64 bits a 1 GHzo más rápido con instrucciones SSE2.
Memoria RAM de 1 GB (Windows de 32 bits) o 2 GB(Windows de 64 bits).
5 GB de disco.
EvolucióndeMicrosoftAccess
1992 Access 1.0
1993 Access 1.1
1994 Access 2.0
1995 Access 95
1997 Access 97
2000 Access 2000
53. 2001 Access XP
2003 Access 2003
2007 Access 2007
2010 Access 2010 "Actual"
HistoriadeMySQL
MySQL surgió alrededor de la década del 90, Michael Windenis comenzó a usar MSQL
para conectar tablas usando sus propias rutinas de bajo nivel (ISAM).
Tras unas primeras pruebas, llegó a la conclusión de que mSQL no era lo bastante
flexible ni rápido para lo que necesitaba, por lo que tuvo que desarrollar nuevas
funciones. Esto resulto en una interfaz SQL a su base de datos, totalmente compatible
a mSQL.
54. El origen del nombre MySQL no se sabe con certeza de donde proviene, por un lado se
dice que en sus librerías han llevado el prefijo “my” durante los diez últimos años, por
otra parte, la hija de uno de los desarrolladores se llama My. Así que no está
claramente definido cual de estas dos causas han dado lugar al nombre de este
conocido gestor de bases de datos.
Historiademysqlserver
MySQL fue inicialmente desarrollado por MySQL AB (empresa fundada por David
Axmark, Allan Larsson y Michael Widenius). MySQL A.B.
Fue adquirida por Sun Microsystems en 2008, y ésta a su vez fue comprada por Oracle
Corporation en 2010, la cual ya era dueña desde 2005 de Innobase Oy, empresa
finlandesa desarrolladora del motor InnoDB para MySQL.
55. Al contrario de proyectos como Apache, donde el software es desarrollado por una
comunidad pública y los derechos de autor del código están en poder del autor
individual, MySQL es patrocinado por una empresa privada, que posee el copyright de
la mayor parte del código. Esto es lo que posibilita el esquema de doble licenciamiento
anteriormente mencionado. La base de datos se distribuye en varias versiones, una
Community, distribuida bajo la Licencia pública general de GNU, versión 2, y varias
versiones Enterprise, para aquellas empresas que quieran incorporarlo en productos
privativos. Las versiones Enterprise incluyen productos o servicios adicionales tales
como herramientas de monitorización y soporte oficial. En 2009 se creó un fork
denominado MariaDB por algunos desarrolladores (incluido algunos desarrolladores
originales de MySQL) descontentos con el modelo de desarrollo y el hecho de que una
misma empresa controle a la vez los productos MySQL y Oracle Database.3
Está desarrollado en su mayor parte en ANSI C y C++.4 Tradicionalmente se considera
uno de los cuatro componentes de la pila de desarrollo LAMP yWAMP.
MySQL es usado por muchos sitios web grandes y populares, como Wikipedia, 5
Google67 (aunque no para búsquedas), Facebook, 8910 Twitter, 11 Flickr, 12 y
YouTube.13
56. Historiadepostgres
PostgreSQL ha tenido una larga evolución, la cual se inicia en 1982 con el proyecto
Ingres en la Universidad de Berkeley.
Este proyecto, liderado por Michael Stonebraker, fue uno de los primeros intentos en
implementar un motor de base de datos relacional. Después de haber trabajado un
largo tiempo en Ingres y de haber tenido una experiencia comercial con el mismo,
Michael decidió volver a la Universidad en 1985 para trabajar en un nuevo proyecto
sobre la experiencia de Ingres, dicho proyecto fue llamado post-ingres o simplemente
POSTGRES.
El proyecto post-ingres pretendía resolver los problemas con el modelo de base de
datos relacional que habían sido aclarados a comienzos de los años 1980.
57. El principal de estos problemas era la incapacidad del modelo relacional de
comprender "tipos", es decir, combinaciones de datos simples que conforman una
única unidad. Actualmente estos son llamados objetos. Se esforzaron en introducir la
menor cantidad posible de funcionalidades para completar el soporte de tipos.
Estas funcionalidades incluían la habilidad de definir tipos, pero también la habilidad
de describir relaciones - las cuales hasta ese momento eran ampliamente utilizadas
pero mantenidas completamente por el usuario. En Postgres la base de datos
«comprendía» las relaciones y podía obtener información de tablas relacionadas
utilizando reglas. Postgres usó muchas ideas de Ingres pero no su código.
La siguiente lista muestra los hitos más importantes en la vida del proyecto Postgres.
1986: se publicaron varios papers que describían las bases del sistema.
1988: ya se contaba con una versión utilizable.
1989: el grupo publicaba la versión 1 para una pequeña comunidad de usuarios.
1990: se publicaba la versión 2 la cual tenía prácticamente reescrito el sistema de
reglas.
58. 1991: publicación de la versión 3, esta añadía la capacidad de múltiples motores de
almacenamiento.
1993: crecimiento importante de la comunidad de usuarios, la cual demandaba más
características.
1994: después de la publicación de la versión 4, el proyecto terminó y el grupo se
disolvió.
Después de que el proyecto POSTGRES terminara, dos graduados de la universidad,
Andrew Yu y Jolly Chen, comenzaron a trabajar sobre el código de POSTGRES, esto fue
posible dado que POSTGRES estaba licenciado bajo la BSD, y lo primero que hicieron
fue añadir soporte para el lenguaje SQL a POSTGRES, dado que anteriormente
contaba con un intérprete del lenguaje de consultas QUEL (basado en Ingres), creando
así el sistema alcual denominaron Postgres95.
Para el año 1996 se unieron al proyecto personas ajenas a la Universidad como Marc
Fournier de Hub.Org Networking Services, Bruce Momjian y Vadim B. Mikheev
quienes proporcionaron el primer servidor de desarrollo no universitario para el
esfuerzo de desarrollo de código abierto y comenzaron a trabajar para estabilizar el
código de Postgres95.
En el año 1996 decidieron cambiar el nombre de Postgres95 de tal modo que refleje la
característica del lenguaje SQL y lo terminaron llamando PostgreSQL, cuya primera
versión de código abierto fue lanzada el 1 de agosto de 1996. La primera versión formal
59. de PostgreSQL (6.0) fue liberada en enero de 1997. Desde entonces, muchos
desarrolladores entusiastas de los motores de base de datos se unieron al proyecto,
coordinaron vía Internet y entre todos comenzaron a incorporar muchas
características al motor.
Aunque la licencia permitía la comercialización de PostgreSQL, el código no se
desarrolló en principio con fines comerciales, algo sorprendente considerando las
ventajas que PostgreSQL ofrecía.
La principal derivación se originó cuando Paula Hawthtorn (un miembro del equipo
original de Ingres que se pasó a Postgres) y Michael Stonebraker conformaron Illustra
Information Technologies para comercializar Postgres.
En 2000, ex inversionistas de Red Hat crearon la empresa Great Bridge para
comercializar PostgreSQL y competir contra proveedores comerciales de bases de
datos. Great Bridge auspició a varios desarrolladores de PostgreSQL y donó recursos de
vuelta a la comunidad, pero a fines de 2001 cerró debido a la dura competencia de
compañías como Red Haty pobres condiciones del mercado.
En 2001, Command Prompt, Inc. lanzó Mammonth PostgreSQL, la más antigua
distribución comercial de PostgreSQL. Continúa brindando soporte a la comunidad
60. PostgreSQL a través del auspicio de desarrolladores y proyectos, incluyendo PL/Perl,
PL/php yel alojamiento de proyectos de comunidades como PostgreSQL Build Farm.
En enero de 2005, PostgreSQL recibió apoyo del proveedor de base de datos Pervasive
Software, conocido por su producto Btrieve que se utilizaba en la plataforma Novell
Netware. Pervasive anunció soporte comercial y participación comunitaria y logró algo
de éxito. Sin embargo, en julio de 2006 dejó el mercado de soporte de PostgreSQL.
A mediados de 2005 otras dos compañías anunciaron planes para comercializar
PostgreSQL con énfasis en nichos separados de mercados. EnterpriseDB añadió
funcionalidades que le permitían a las aplicaciones escritas para trabajar con Oracle
ser más fáciles de ejecutar con PostgreSQL. Greenplum contribuyó mejoras
directamente orientadas a aplicaciones de Data Warehouse e Inteligencia de negocios,
incluyendo el proyecto BizGres.
En octubre de 2005, John Loiacono, vicepresidente ejecutivo de software en Sun
Microsystems comentó: "No estamos yendo tras el OEM de Microsoft pero estamos
viendo a PostgreSQL ahora", aunque no se dieron especificaciones en ese momento.
Para noviembre de 2005, Sun Solaris 10 (lanzamiento 6/06) incluía PostgreSQL.
En agosto de 2007 EnterpriseDB anunció el Postgres Resource Center y EnterpriseDB
Postgres, diseñados para ser una completamente configurada distribución de
PostgreSQL incluyendo muchos módulos contribuidos y agregados.
61. EnterpriseDB Postgres fue renombrado Postgres Plusen marzo de 2008.
El proyecto PostgreSQL continúa haciendo lanzamientos principales anualmente y
lanzamientos menores de reparación de bugs, todos disponibles bajo la licencia
PostgreSQL, y basados en contribuciones de proveedores comerciales, empresas
aportantes y programadores de código abierto mayormente.
Un modelo entidad-relación o diagrama entidad-relación (a veces denominado por sus
siglas en inglés, E-R "Entity relationship"; en español DER: "Diagrama de Entidad-
Relación") es una herramienta para el modelado de datos que permite representar las
entidades relevantes de un sistema de información así como sus interrelaciones y
propiedades.
Modelo Entidad-Relación
62. Se elabora el diagrama (o diagramas) entidad-relación.
Se completa el modelo con listas de atributos y una descripción de otras restricciones
que no se pueden reflejar en el diagrama.
El modelado de datos no acaba con el uso de esta técnica. Son necesarias otras técnicas
para lograr un modelo directamente implementable en una base de datos. Brevemente:
Permite mostrar resultados entre otras entidades pertenecientes a las existentes de
manera que se encuentre la normatividad de archivos que se almacenarán
Transformación de relaciones múltiples en
binarias.
Normalización de una base de datos de relaciones (algunas relaciones pueden
transformarse en atributos yviceversa).
Conversión en tablas (en caso de utilizar una base de datos relacional).
Modelorelacional
63. El modelo relacional, para el modelado y la gestión de bases de datos, es un modelo de
datos basado en la lógica de predicados y en la teoría de conjuntos.
Tras ser postuladas sus bases en 1970 por Edgar Frank Codd, de los laboratorios IBM
en San José (California), no tardó en consolidarse como un nuevo paradigma en los
modelos de base de datos.
Su idea fundamental es el uso de relaciones. Estas relaciones podrían considerarse en
forma lógica como conjuntos de datos llamados tuplas.
Pese a que esta es la teoría de las bases de datos relacionales creadas por Codd, la
mayoría de las veces se conceptualiza de una manera más fácil de imaginar, pensando
en cada relación como si fuese una tabla que está compuesta por registros (cada fila de
la tabla sería un registro o "tupla") ycolumnas (también llamadas"campos").
64. Es el modelo más utilizado en la actualidad para modelar problemas reales y
administrar datos dinámicamente.
En este modelo todos los datos son almacenados en relaciones, y como cada relación es
un conjunto de datos, el orden en el que estos se almacenen no tiene relevancia (a
diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable
ventaja de que es más fácil de entender y de utilizar por un usuario no experto. La
información puede ser recuperada o almacenada por medio de consultas que ofrecen
una amplia flexibilidad y poder para administrar la información.
Este modelo considera la base de datos como una colección de relaciones. De manera
simple, una relación representa una tabla que no es más que un conjunto de filas, cada
fila es un conjunto de campos y cada campo representa un valor que interpretado
describe el mundo real. Cada fila también se puede denominar tupla o registro y a
cada columna también se le puede llamar campo o atributo.
Para manipular la información utilizamos un lenguaje relacional, actualmente se
cuenta con dos lenguajes formales el Álgebra relacional y el Cálculo relacional. El
Álgebra relacional permite describir la forma de realizar una consulta, en cambio, el
Cálculo relacional solamente indica lo que se desea devolver.
65. Consultas
Las consultas pueden realizar diversas funciones en una base de datos. La función más
común es recuperar datos específicos de las tablas. Los datos que quiere ver
generalmente están distribuidos en varias tablas y las consultas le permiten verlos en
una única hoja de datos. Además, debido a que muchas veces no quiere ver todos los
registros a la vez, las consultas le permiten agregar criterios para "filtrar" los datos y
obtener solo los registros que quiere.
Ciertas consultas son "actualizables", es decir, puede modificar los datos de las tablas
subyacentes mediante la hoja de datos de la consulta. Si está trabajando en una
consulta actualizable, recuerde que los cambios se realizan en realidad en las tablas, no
solo en la hoja de datos de la consulta.
Hay dos variedades básicas de consultas: consultas de selección y consultas de
acciones. Una consulta de selección simplemente recupera los datos y los pone a
disposición para su uso. Puede ver los resultados de la consulta en la pantalla,
imprimirlos o copiarlos al portapapeles. O bien, puede usar el resultado de la consulta
como unorigen de registro para un formulario o uninforme.
Una consulta de acción, tal como el nombre lo indica, realiza una tarea con los datos.
Las consultas de acción se pueden usar para crear tablas nuevas, agregar datos a las
tablas existentes, o actualizar o eliminar datos.
66. Indexación
Indexación (también conocido como indexación web u indexación en Internet) se
refiere a diversos métodos para incluir en el índice de internet el contenido de un sitio
web. Determinados sitios web o intranet pueden utilizar un índice de back-of-the-
book, mientras que los motores de búsqueda suelen utilizar palabras clave y metadatos
(metaetiquetas) para proporcionar un vocabulario más útil para Internet o la
búsqueda en el sitio.
67. Con el aumento en el número de publicaciones periódicas que tienen artículos en línea,
la indexación web también está adquiriendo importancia para los sitios web de
periódicos o revistas con contenido actualizado .
La información de indexación web implica la asignación de palabras clave o frases a
páginas web o sitios web dentro de un campo de meta-etiquetas, por lo que los sitios
web pueden ser recuperados con un motor de búsqueda que se personaliza para
buscar el campo de palabras clave. Para mejorar la indexación de un sitio web
específico existen varios métodos conocidos en el entorno de SEO (Search Engine
Optimization), utilizando diferentes técnicas para que la posición del sitio web
aumente de acuerdo a las palabrasque el usuario ingresa para hacer una búsqueda.
Iniciodelasbasesdedatosdistribuidas
68. Una base de datos distribuida (BDD) es un conjunto de múltiples bases de datos
lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios
lógicos y geográficos (pej. un servidor corriendo 2 máquinas virtuales) e
interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de
realizar procesamiento autónomo, esto permite realizar operaciones locales o
distribuidas.
Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual múltiples
sitios de bases de datos están ligados por un sistema de comunicaciones de tal forma
que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red
exactamente como si estos fueran accedidos de forma local.
69. Un sistema distribuido de bases de datos se almacenan en varias computadoras. Los
principales factores que distinguen un SBDD de un sistema centralizado son los
siguientes:
Haymúltiples computadores, llamados sitios o nodos.
Estos nodos deben de estar comunicados por medio de algún tipo de red de
comunicaciones para transmitir datos y órdenes entre los sitios.
La necesidad de almacenar datos de forma masiva dio paso a la creación de los
sistemas de bases de datos.
En 1970 Edgar Frank Codd escribió un artículo con nombre: «A Relational Model of
Data for Large Shared Data Banks» («Un modelo relacional para grandes bancos de
datos compartidos»). Con este artículo y otras publicaciones, definió el modelo de bases
de datos relacionales y reglas para poder evaluar un administrador de bases de datos
relacionales.
70. Originalmente se almacenaba la información de manera centralizada, pero con el paso
del tiempo las necesidades aumentaron y esto produjo ciertos inconvenientes que no
era posible solucionarlos o volverlos eficientes de la forma centralizada.
Estos problemas impulsaron la creación de almacenamiento distribuido, los cuales hoy
en día proveen características indispensables en el manejo de información; es decir, la
combinación de las redes de comunicación y las bases de datos.
Evolución
Hay varios factores que han hecho que las bases de datos evolucionen a bases de datos
distribuidas.
En el mundo de los negocios se ha dado una globalización y a la vez las operaciones de
las empresas son cada vez más descentralizadas geográficamente. También el poder de
las computadoras personales aumentó y el costo de los Mainframes ya no tenía
sentido. Además la necesidad de compartir datos ha hecho que crezca el mercado de
las bases de datos distribuidas.
Basededatosnosql
71. Pese a la no existencia de una definición formal, cuando hablamos de base datos
NoSQL, también conocidas como “No sólo SQL”, nos referimos a una amplia clase de
sistemas de gestión de datos (mecanismos para el almacenamiento y recuperación de
datos) que difieren, en aspectos importantes, del modelo clásico de relaciones entre
entidades (o tablas).
Existente en los sistemas de gestión bases de datos relacionales, siendo el más
destacado el que no usan SQL como lenguaje principal de consulta.
Aunque son conocidas desde la década de los 60 del pasado siglo, su auge actual viene
determinado por el uso que, de estos sistemas han hecho las principales compañías de
internet como Amazon, Google, Twitter y Facebook. Estas compañías tenían que
enfrentarse a nuevos desafíos en el tratamiento de los datos motivados por el enorme
crecimiento de la Web donde se requería dar respuesta a la necesidad de proporcionar
información procesada a partir de grandes volúmenes de datos con unas estructuras
horizontales, más o menos, similares y con aplicaciones web que debían dar respuesta
72. a las peticiones de un número elevado e indeterminado de usuarios en el menor tiempo
posible. Estas compañías se dieron cuenta de que el rendimiento y sus necesidades de
tiempo real eran más importantes que la consistencia de los datos, aspecto este último
al que las bases de datos relacionales tradicionales dedicaban una gran cantidad de
tiempo de proceso.
Las características comunes entre todas las
implementaciones de bases de datos No SQL
suelen ser las siguientes:
Consistencia Eventual: A diferencia de las bases de datos relacionales tradicionales, en
la mayoría de sistemas NoSQL, no se implementan mecanismos rígidos de consistencia
que garanticen que cualquier cambio llevado a cabo en el sistema distribuido sea visto,
al mismo tiempo, por todos los nodos y asegurando, también, la no violación de
posibles restricciones de integridad de los datos u otras reglas definidas. En su lugar y
para obtener un mayor rendimiento, se ofrece el concepto de “consistencia eventual”,
en el que los cambios realizados “con el tiempo” serán propagados a todos los nodos
por lo que, una consulta podría no devolver los últimos datos disponibles o
proporcionar datos inexactos, problema conocido como lecturas sucias u obsoletas.
Asimismo, en algunos sistemas NoSQL se pueden presentar perdidas de datos en
escritura.
73. Esto se conoce también como BASE (Basically Available Soft-state Eventual
Consistency), en contraposición a ACID (Atomicity, Consistency, Isolation, Durability),
su analogía en las bases de datos relacionales.
Flexibilidad en el esquema: En la mayoría de base de datos NoSQL, los esquemas de
datos son dinámicos; es decir, a diferencia de las bases de datos relacionales en las que,
la escritura de los datos debe adaptarse a unas estructuras(o tablas, compuestas a su
vez por filas y columnas) y tipos de datos pre-definidos, en los sistemas NoSQL, cada
registro (o documento, como se les suele llamar en estos casos) puede contener una
información con diferente forma cada vez, pudiendo así almacenar sólo los atributos
que interesen en cada uno de ellos, facilitando el polimorfismo de datos bajo una
misma colección de información. También se pueden almacenar estructuras complejas
de datos en un sólo documento, como por ejemplo almacenar la información sobre una
publicación de un blog (título, cuerpo de texto, autor, etc) junto a los comentarios y
etiquetas vertidos sobre el mismo, todo en un único registro.
Escalabilidad horizontal: Por escalabilidad horizontal se entiende la posibilidad de
incrementar el rendimiento del sistema añadiendo, simplemente, más nodos
(servidores) e indicando al sistema cuáles son los nodos disponibles.
Estructura distribuida: Generalmente los datos se distribuyen, entre los diferentes
nodos que componen el sistema. Haydos estilos de distribución de datos:
74. Particionado (ó Sharding): El particionado distribuye los datos entre múltiples
servidores de forma que, cada servidor, actúe como única fuente de un subconjunto de
datos. Normalmente, a la hora de realizar esta distribución, se utilizan mecanismos de
tablas de hash distribuidas (DHT).
Réplica: La réplica copia los datos entre múltiples servidores, de forma que cada bit de
datos pueda ser encontrado en múltiples lugares. Esta réplica puede realizarse de dos
maneras:
Réplica maestro-esclavo en la que un servidor gestiona la escritura de la copia
autorizada mientras que los esclavos se sincronizan con este servidor maestro y sólo
gestionan las lecturas.
Réplica peer-to-peer en la que se permiten escrituras a cualquier nodo y ellos se
coordinan entre sí para sincronizar sus copias de los datos
Tolerancia a fallos y Redundancia: Pese a lo que cualquiera pueda pensar cuando se
habla de NoSQL, no todas las tecnologías existentes bajo este paraguas usan el mismo
modelo de datos ya que, al ser sistemas altamente especializados, la idoneidad
particular de una base de datos NoSQL dependerá del problema a resolver. Así a todo,
podemos agrupar los diferentes modelos de datos usados en sistemas NoSQL en cuatro
grandes categorías:
Base de datos de Documentos: Este tipo de base de datos almacena la información
como un documento, usando para habitualmente para ello una estructura simple
75. como JSON, BSON o XML y donde se utiliza una clave única para cada registro. Este
tipo de implementación permite, además de realizar búsquedas por clave–valor,
realizar consultas más avanzadas sobre el contenidodel documento. Son las bases de
datos NoSQL más versátiles.
Almacenamiento Clave-Valor: Son el modelo de base de datos NoSQL más popular,
además de ser la más sencilla en cuanto a funcionalidad. En este tipo de sistema, cada
elemento está identificado por una clave única, lo que permite la recuperación de la
información de forma muy rápida, información que suele almacenarse como un objeto
binario. Se caracterizan por ser muy eficientes tanto para las lecturas como para las
escrituras.
Bases de datos de grafos: Usadas para aquellos datos cuyas relaciones se pueden
representar adecuadamente mediante un grafo. Los datos se almacenan en estructuras
grafo con nodos (entidades), propiedades (información entre entidades) y líneas
(conexiones entre las entidades).
Base de datos Columnar (o Columna ancha): En vez de“tablas”, en las bases de datos
de columna tenemos familias de columnas que, son los contenedores de las filas. A
diferencia de los RDBMS, no necesita conocer de antemano todas las columnas, cada
fila no tiene por qué tener el mismo número de columnas. Este tipo de bases de datos
se adecuan mejor a operaciones analíticas sobre grandes conjuntos de datos.
76. Pese a todas las opciones proporcionadas por el auge de las bases de datos NoSQL, esto
no significa la desaparición de las bases de datos de RDBMS ya que son tecnologías
complementarias. Estamos entrando en una era de persistencia políglota, una técnica
que utiliza diferentes tecnologías de almacenamiento de datos para manejar las
diversas necesidades de almacenamiento de datos.
Dentro de los diferentes sistemas de gestión de basede datos, y más concretamente en
este ámbito, Oracle ofrece una base de datosNoSQL, con características empresariales,
denominada Oracle No SQL; basada, al igual que otras bases de datos NoSQL, en el
motor de Oracle Berkeley DB, estaes una base de datos NoSQL distribuida y escalable,
diseñada para proporcionar una gestión de datos fiable, flexible y altamente
disponible a través de un conjunto configurable de nodos de almacenamiento, junto
con una API de fácil uso e integración con el resto de productos Oracle.
Pese a ser pertenecer a la categoría de almacenamientos Clave-Valor, la base de datos
NoSQL de Oracle, permite modelar los datos como si fuesen tablas en forma similar a
como lo haría una base dedatos relacional, almacenar documentos JSON o,
simplemente, pares de clave y valor. Al igual que otras bases de datos NoSQL, Oracle
NoSQL, es un sistema particionado(donde no se comparte nada), que distribuye los
datos de manera uniforme entre las múltiples particiones que lo conforman, en base al
77. valor hash de la clave primaria. Dentro de cada partición, los nodos de
almacenamiento se replican con el fin de garantizar una alta disponibilidad, una
rápida conmutación en el caso de un fallo de nodo y realizar un balanceo óptimo de la
carga que representen las consultas. La base de datos NoSQL de Oracle base de datos
proporciona drivers Java, C, Python y Node.js, así como, una API REST para simplificar
el desarrollo de aplicaciones web.
Así mismo, se integra con una amplia variedad de aplicaciones Oracle y de código
abierto con el fin de simplificar y agilizar el desarrollo y despliegue de aplicaciones
modernas en entornos big data.