3. Page 3
Introducción.
• El manejo de información es utilizado constantemente en el mundo.
La utilizamos desde el manejo de la información de una agenda
hasta grandes cantidades de datos. Gracias a la capacidad que
tenemos, los seres humanos, de utilizar las computadoras para
almacenar, utilizar y modificar esta información podemos mantener
un orden de ella y solicitarla con facilidad y rapidez en cualquier
momento. Existen muchos programas hechos especialmente para la
manipulación de la información. Entre ellos se encuentra, el muy
conocido programa, Microsoft Access, podremos ver mucho mas
afondo sobre como se componen tanto como las misma base de
datos y sus componentes: tabla, consulta, registro, etc.
5. Page 5
¿Qué es Access?
• Es un sistema de gestión de
bases de datos incluido en el
paquete ofimático denominado
Microsoft Office. Access es un
gestor de datos que recopila
información relativa a un
asunto o propósito particular,
como el seguimiento de
pedidos de clientes o el
mantenimiento de una
colección de música, etc. Está
pensado en recopilar datos de
otras utilidades (Excel,
SharePoint, etc.) y manejarlos
por medio de las consultas e
informes.
• Utiliza los conceptos de bases
de datos relacionales.
6. Page 6
• Access es ahora mucho más que una
forma de crear bases de datos de
escritorio. Es una herramienta fácil de
usar que permite crear rápidamente
aplicaciones de base de datos basadas
en el explorador que te ayudarán a
dirigir tu negocio. Los datos de Access
se almacenan automáticamente en una
base de datos en la nube, por lo que
están más protegidos. Además, puedes
compartir fácilmente las aplicaciones de
Access con compañeros de trabajo.
7. Page 7
• Puede utilizar Access para administrar todos sus
datos en un solo archivo. Dentro de un archivo
de base de datos de Access, puede utilizar:
• Tablas para almacenar los datos.
• Consultas para buscar y recuperar exactamente
los datos que desee.
• Formularios para ver, agregar y actualizar datos
en las tablas.
• Informes para analizar o imprimir los datos con
un diseño específico.
8. Page 8
Historia.
• Fue llamado EB ("Embedded Basic") que se utilizaría en la mayoría
de software Microsoft hasta la llegada de VBA. También se buscaba
que Omega funcionara como front-end para Microsoft SQL Server.
Omega requería una enorme cantidad de recursos de los
procesadores 386 disponibles en la época para usos comerciales,
retrasando su llegada desde el primer cuatrimestre de 1990 hasta
enero de 1991. Más tarde partes del proyecto fueron utilizados para
otros proyectos de Microsoft. Cirrus (nombre clave para Access) y
Thunder (nombre clave para Visual Basic, en el que se utilizó el
motor Embedded Basic). Tras el adelanto de Access, Omega fue
demostrado ante varios periodistas en 1992 y Access presentaba
funciones que no tenía.
9. Page 9
• Después de la cancelación de Omega, algunos de sus
desarrolladores fueron reasignados al proyecto Cirrus (la
mayoría fue a parar al equipo creador de Visual Basic). Su meta
era crear un competidor de productos como de Base y Paradox
en el entorno Windows. El proyecto pareció condenado con la
compra de FoxPro (una app de base de datos completamente
diferente a Access) por parte de Microsoft, pero la compañía
decidió continuar con el desarrollo de Cirrus. Al principio se
asumió que el producto usaría el motor Extensible Storage
Engine (Jet Blue) pero al final fue reemplazado por otro motor
llamado Microsoft Jet Database Engine (Jet Red). El proyecto
usó partes del código escrito para Omega y una versión pre-
publicada de Visual Basic. En julio de 1992, llegó la versión final
con el nombre de Access que continua hasta el momento
unicultural 2017.
10. Page 10
Sus diferentes versiones.
• Año Versión
• 1993 Access 2.0
• 1995 Access 7
• 1997 Access 97
• 1999 Access 2000
• 2001 Access 2002
• 2003 Access 2003
• 2007 Microsoft Office Access 2007
• 2010 Microsoft Office Access 2010
11. Page 11
• Sistema Operativo Office suite
• Windows Office 4.3
• Windows 95 Office 95
• Windows, otros Office 97
• Windows, otros Office 2000
• Windows, otros Office X
• Windows, otros Office 2003
• Windows, otros Office 2007
• Windows, otros Office 2010
13. Page 13
¿Qué es una base de datos?
• Una base de datos es una herramienta para recopilar y organizar
información. Las bases de datos pueden almacenar información
sobre personas, productos, pedidos u otras cosas. Muchas bases
de datos comienzan como una lista en una hoja de cálculo o en
un programa de procesamiento de texto. A medida que la lista
aumenta su tamaño, empiezan a aparecer redundancias e
inconsistencias en los datos. Cada vez es más difícil comprender
los datos en forma de lista y los métodos de búsqueda o
extracción de subconjuntos de datos para revisión son limitados.
Una vez que estos problemas comienzan a aparecer, una buena
idea es transferir los datos a una base de datos creada con un
sistema de administración de bases de datos (DBMS), como
Access.
14. Page 14
• Una base de datos computarizada es un
contenedor de objetos. Una base de datos
puede contener más de una tabla. Por ejemplo,
un sistema de seguimiento de inventario que
usa tres tablas no son tres bases de datos, sino
una base de datos que contiene tres tablas.
Salvo que haya sido específicamente diseñada
para usar datos o códigos de otro origen, una
base de datos de Access almacena sus tablas
en un solo archivo, junto con otros objetos como
formularios, informes, macros y módulos.
17. Page 17
Tipos de bases de datos.
• Los mas comunes son:
• Las bases de datos jerárquicas construyen una estructura de
jerarquía con los datos que permite una estructuración muy estable
cuando gestionamos una gran cantidad de datos muy
interrelacionados.
• Las bases de datos en red derivan de las jerárquicas pero mejoran
la gestión de datos redundantes manteniendo su rendimiento en
consultas de datos.
• Las bases de datos transaccionales están diseñadas para el envío y
recepción de datos a grandes velocidades y de forma continua. Su
único fin es la recepción y envío de información pero la gestión de
almacenamiento o redundancia están fuera de su propósito.
18. Page 18
• Las bases de datos relacionales son las más utilizadas
en aplicaciones reales. La información se almacena
siempre haciendo referencia a otra por lo que se facilita
la gestión y su uso por personal no especialista. En este
modelo el lugar y la forma donde se guarde la
información es secundario.
• Las bases de datos orientadas a objetos han surgido
como concepto tras la aparición de los sistemas de
programación orientada a objetos.
• Las bases de datos documentales están especializadas
en el almacenamiento de textos completos, por lo que
facilitan el tratamiento informatizado de grandes
cadenas de caracteres.
19. Page 19
Evolución de las base de
datos.
• A evolucionado mucho desde la década de 1950 hasta ahora, en 1950 en
este lapso de tiempo se da origen a las cintas magnéticas, las cuales
sirvieron para suplir las necesidades de información de las nuevas industria
en 1960 el uso de los discos en ese momento fue un adelanto muy efectivo,
ya que por medio de este soporte se podía consultar la información
directamente, esto ayudo a ahorrar tiempo. No era necesario saber
exactamente donde estaban los datos en los discos, ya que en milisegundos
era recuperable la información, en 1970 Edgar Frank Codd definió el
modelo relacional y publicó una serie de reglas para la evaluación de
administradores de sistemas de datos relacionales y así nacieron las bases
de datos relacionales, en 1980 en esta década el modelo relacional ha
conseguido posicionarse del mercado de las bases de datos. Y también en
este tiempo se iniciaron grandes investigaciones paralelas y distribuidas,
como las bases de datos orientadas a objetos.
20. Page 20
• Ya a principios de los 90 Para la toma de decisiones se crea el
lenguaje SQL, que es un lenguaje programado para consultas. El
programa de alto nivel SQL es un lenguaje de consulta estructurado
que analiza grandes cantidades de información el cual permite
especificar diversos tipos de operaciones frente a la misma
información, a diferencia de las bases de datos de los 80 que eran
diseñadas para las aplicaciones de procesamiento de transacciones, y
a finales de los 90 el boom de esta década fue la aparición de la WWW
“Word Wide Web ya que por éste medio se facilitaba la consulta de las
bases de datos y por finalizar el siglo XXI En la actualidad existe gran
cantidad de alternativas en línea que permiten hacer búsquedas
orientadas a necesidades específicas de los usuarios, una de las
tendencias más amplias son las bases de datos que cumplan con el
protocolo Open Archives Initiative – Protocol for Metadata Harvesting
(OAI-PMH) los cuales permiten el almacenamiento de gran cantidad de
artículos que permiten una mayor visibilidad y acceso en el ámbito
científico y general.
21. Page 21
Sus componentes
necesarios.
En prácticamente cualquier base de datos actual existen cuatro elementos
esenciales: tablas, consultas, informes y formularios. Todos son
indispensables y necesarios:
• Las tablas permitirán almacenar los datos.
• Con las consultas podremos acceder a los datos almacenados,
ordenarlos y filtrarlos por diferentes criterios.
• Los informes serán la forma más eficaz de presentar nuestros datos.
• Con los formularios se facilitan las tareas de introducción de datos.
• Esta es una definición muy básica de cada uno de los elementos que
forman parte de una base de datos pero suficiente para comenzar a
familiarizarnos con estos conceptos.
23. Page 23
¿Qué es un registro?
• Representa un objeto único de datos implícitamente
estructurados en una tabla. En términos simples, una tabla
de una base de datos puede imaginarse formada de filas y
columnas o campos. Cada fila de una tabla representa un
conjunto de datos relacionados, y todas las filas de la
misma tabla tienen la misma estructura. Un registro es un
conjunto de campos que contienen los datos que
pertenecen a una misma repetición de entidad. Se le
asigna automáticamente un número consecutivo (número
de registro) que en ocasiones es usado como índice
aunque lo normal y práctico es asignarle a cada registro un
campo.
26. Page 26
¿Qué es un campo?
• Un campo es el nombre de la unidad de información.
Cada entrada en una base de datos puede tener
múltiples campos de diversos tipos. Por ejemplo, un
campo de texto llamado 'color favorito', que permite
escribirlo, o un menú llamado 'población' que permita
escoger de un listado de poblaciones posibles. La
combinación de campos diversos nos permitirá
recabar toda la información que consideremos
relevante sobre los ítems que constituyen la base de
datos.
27. Page 27
Los tipos de campos.
• Alfanumérico: contiene cifras numéricas y caracteres alfabéticos.
• Numérico: existen de varios tipos principalmente como enteros y
reales.
• Autoincrementable: son campos numéricos enteros que incrementan
en una unidad su valor para cada registro incorporado. Su utilidad
resulta más que evidente: servir de identificador registro.
• Booleano: admite dos valores, «verdadero» o «falso».
• Fechas: almacenan fechas facilitando posteriormente su
explotación. Almacenar fechas de esta forma posibilita ordenar los
registros por fechas o calcular los días entre una fecha y otra.
• Memo: son campos alfanuméricos de longitud ilimitada. Presentan el
inconveniente de no poder ser indexados.
30. Page 30
¿Qué son consultas?
• Las consultas pueden realizar diversas funciones en una base de
datos. La función más común es recuperar datos específicos de las
tablas. Los datos que quiere ver generalmente están distribuidos en
varias tablas y las consultas le permiten verlos en una única hoja de
datos. Además, debido a que muchas veces no quiere ver todos los
registros a la vez, las consultas le permiten agregar criterios para
"filtrar" los datos y obtener solo los registros que quiere. Ciertas
consultas son "actualizables", es decir, puede modificar los datos de
las tablas subyacentes mediante la hoja de datos de la consulta. Si
está trabajando en una consulta actualizable, recuerde que los
cambios se realizan en realidad en las tablas, no solo en la hoja de
datos de la consulta.
31. Page 31
• Técnicamente hablando, las consultas a la base de
datos se realizan a través de un lenguaje de
manipulación de datos (DML – Data Manipulation
Language). SQL es un lenguaje DML, pero además
posee otras características de otros lenguajes. Por
ejemplo, permite también crear bases de datos.
• La consulta básica en SQL es llamada select-from-
where.
32. Page 32
¿Cómo se utilizan las
consultas?
• Las consultas son mucho más que filtros o búsquedas
simples que puedes usar para encontrar los datos de
una tabla. Con estas puedes acceder a información de
múltiples tablas. Por ejemplo, puedes utilizar una
búsqueda en la tabla de clientes para encontrar la
dirección de uno de ellos o un filtro en la tabla vehículos
para ver cuál es el carro que corresponde a determinado
cliente. Debes tener en cuenta que una consulta bien
diseñada te puede dar información que no podrías
averiguar examinado cada uno de los registros de la
tabla de datos.
33. Page 33
Tipos de consultas.
• Hay dos variedades básicas de consultas: consultas de
selección y consultas de acciones.
• Una consulta de selección simplemente recupera los datos
y los pone a disposición para su uso. Puede ver los
resultados de la consulta en la pantalla, imprimirlos o
copiarlos al portapapeles. O bien, puede usar el resultado
de la consulta como un origen de registro para un
formulario o un informe.
• Una consulta de acción, tal como el nombre lo indica,
realiza una tarea con los datos. Las consultas de acción se
pueden usar para crear tablas nuevas, agregar datos a las
tablas existentes, o actualizar o eliminar datos.
36. Page 36
¿Qué es una tabla?
• Las tablas son objetos de base de datos que contienen
todos sus datos. En las tablas, los datos se organizan
con arreglo a un formato de filas y columnas, similar al
de una hoja de cálculo. Cada fila representa un registro
único y cada columna un campo dentro del registro. Por
ejemplo, en una tabla que contiene los datos de los
empleados de una compañía puede haber una fila para
cada empleado y distintas columnas en las que figuren
detalles de los mismos, como el número de empleado, el
nombre, la dirección, el puesto que ocupa y su número
de teléfono particular.
37. Page 37
• El número de tablas de una base de datos se limita solo por el número
de objetos admitidos en una base (2.147.483.647). Una tabla definida
por el usuario estándar puede tener hasta 1.024 columnas. El número
de filas de la tabla solo está limitado por la capacidad de
almacenamiento del servidor.
• Puede asignar propiedades a la tabla y a cada columna de la tabla
para controlar los datos admitidos y otras propiedades. Por ejemplo,
puede crear restricciones en una columna para no permitir valores
nulos o para proporcionar un valor predeterminado si no se especifica
un valor, o puede asignar una restricción de clave en la tabla que
exige la unicidad o definir una relación entre las tablas.
• Los datos de la tabla se pueden comprimir por filas o por página. La
compresión de datos puede permitir que se almacenen más filas en
una página. Para más información, consulte Data Compresión.
39. Page 39
Tipos de tablas en MySQL.
• ISAM.- es el formato de almacenaje mas antiguo, y posiblemente
pronto desaparecerá. Presentaba limitaciones (los ficheros no eran
transportables entre máquinas con distinta arquitectura, no podía
manejar ficheros de tablas superiores a 4 gigas). Si aun tienes
tablas tipo ISAM, cámbialas a MYISAM.
• MYISAM.- es el tipo de tabla por defecto en MySQL desde la versión
3.23. Optimizada para sistemas operativos de 64 bits, permite
ficheros de mayor tamaño que ISAM. Además los datos se
almacenan en un formato independiente, con lo que se pueden
copiar tablas de una máquina a otra de distinta plataforma.
40. Page 40
• HEAP.- Crea tablas en memoria. Son temporales y
desaparecen cuando el servidor se cierra; a diferencia de una
tabla TEMPORARY, que solo puede ser accedida por el usuario
que la crea, una tabla HEAP puede ser utilizada por diversos
usuarios.
• BDB.- Base de datos Berkeley. TST. Solo en MySQL MAX
• INNODB.- TST, ACID, con posibilidad de commit, rollback,
recuperación de errores y bloqueo a nivel de fila.
• MERGE mas que un tipo de tabla es la posibilidad de dividir
tablas MYISAM de gran tamaño (solo útil si son
verdaderamente de GRAN tamaño) y hacer consultas sobre
todas ellas con mayor rapidez. Las tablas deben ser myisam e
idénticas en su estructura.
41. Page 41
SQL-SEVER.
• Es un sistema de manejo de bases de datos del modelo relacional,
desarrollado por la empresa Microsoft.
• El lenguaje de desarrollo utilizado (por línea de comandos o mediante la
interfaz gráfica de Management Studio) es Transact-SQL (TSQL), una
implementación del estándar ANSI del lenguaje SQL, utilizado para
manipular y recuperar datos (DML), crear tablas y definir relaciones entre
ellas (DDL).
• Dentro de los competidores más destacados de SQL Server están: Oracle,
MariaDB, MySQL, PostgreSQL. SQL Server ha estado tradicionalmente
disponible solo para sistemas operativos Windows de Microsoft, pero desde
2017 también está disponible para Linux y Docker containers.34
• Puede ser configurado para utilizar varias instancias en el mismo servidor
físico, la primera instalación lleva generalmente el nombre del servidor, y
las siguientes - nombres específicos (con un guion invertido entre el
nombre del servidor y el nombre de la instalación).
42. Page 42
Historia de PostgreSQL.
• PostgreSQL (o Postgres) comenzó su vida en 1986 como
POSTGRES, un proyecto de investigación de la universidad de
Berkeley en California, dirigido por el investigador de base de datos
de gran influencia Michael Stonebraker. El equipo de Stonebraker
desarrolló POSTGRES activamente por ocho años, y desarrolló
características que incluyen reglas, procedimientos y tipos
extensivos con índices. POSTGRES luego se comercializó como
Ilustra, que luego fue adquirido por Informix para integrarlo en su
Servidor Universal. En 2001, IBM adquirió Informix por la cifra de
1000 millones de dólares. El equipo de Stonebraker desarrolló
POSTGRES activamente por ocho años, y desarrolló características
que incluyen reglas, procedimientos y tipos extensivos con índices.
En 2001, IBM adquirió Informix por la cifra de 1000 millones de
dólares.
43. Page 43
• En 1996, el proyecto obtuvo un gran interés desde fuera
de la academia. Estaba claro que el nombre Postgre95
no iría bien con el tiempo, y el proyecto se renombró a
PostgreSQL. El grupo global de desarrolladores de
PostgreSQL, una afiliación internacional de
desarrolladores de base de datos que trabajan
principalmente en la industria, había nacido y asumió
control del código fuente de Postgres. PostgreSQL
empezó con la versión 6, para mantener consistencia
con el control de versiones de Berkeley, como una señal
de reconocimiento a la importante contribución hecha
por el equipo de Stonebraker.
45. Page 45
Modelo entidad-relación.
• Es una herramienta para el modelado de datos que permite
representar las entidades relevantes de un sistema de
información así como sus interrelaciones y propiedades.
• El modelo de datos entidad-relación está basado en una
percepción del mundo real que consta de una colección de
objetos básicos, llamados entidades, y de relaciones entre esos
objetos.
• El Modelo Entidad-Relación
• Se elabora el diagrama (o diagramas) entidad-relación.
• Se completa el modelo con listas de atributos y una descripción
de otras restricciones que no se pueden reflejar en el
diagrama.
46. Page 46
• El modelado de datos no acaba con el uso de esta técnica.
Son necesarias otras técnicas para lograr un modelo
directamente implementarle en una base de datos.
Brevemente:
• permite mostrar resultados entre otras entidades
pertenecientes a las existentes de manera que se encuentre
la normatividad de archivos que se almacenarán
• Transformación de relaciones múltiples en binarias.
• Normalización de una base de datos de relaciones (algunas
relaciones pueden transformarse en atributos y viceversa).
• Conversión en tablas (en caso de utilizar una base de datos
relacional).
47. Page 47
• Son reglas que deben respetar las entidades y relaciones almacenadas en la
base de datos.
• Correspondencia de cardinalidades.
• Dado un conjunto de relaciones en el que participan dos o más conjuntos
de entidades, la correspondencia de cardinalidad indica el número de
entidades con las que puede estar relacionada una entidad dada.
• Restricciones de participación.
• Dado un conjunto de relaciones R en el cual participa un conjunto de
entidades A, dicha participación puede ser de dos tipos:
• Total: Cuando cada entidad en A participa en al menos una relación de R.
• Parcial: Cuando al menos una entidad en A NO participa en alguna relación
de R.
50. Page 50
Modelo relacional.
• modelo de organización y gestión de bases de datos consistente en
el almacenamiento de datos en tablas compuestas por filas, o
tuplas, y columnas o campos. Se distingue de otros modelos, como
el jerárquico, por ser más comprensible para el usuario inexperto, y
por basarse en la lógica de predicados para establecer relaciones
entre distintos datos. Surge como solución a la creciente variedad
de los datos que integran las data warehouses y podemos resumir
el concepto como una colección de tablas (relaciones). Es un
modelo de datos basado en la lógica de predicados y en la teoría de
conjuntos.
• Tras ser postuladas sus bases en 1970 por Edgar Frank Codd, de los
laboratorios IBM en San José (California), no tardó en consolidarse
como un nuevo paradigma en los modelos de base de datos.
51. Page 51
• Su idea fundamental es el uso de relaciones. Estas relaciones
podrían considerarse en forma lógica como conjuntos de
datos llamados tuplas. Pese a que esta es la teoría de las
bases de datos relacionales creadas por Codd, la mayoría de
las veces se conceptualiza de una manera más fácil de
imaginar, pensando en cada relación como si fuese una tabla
que está compuesta por registros (cada fila de la tabla sería
un registro o "tupla") y columnas (también llamadas
"campos"). Es el modelo más utilizado en la actualidad para
modelar problemas reales y administrar datos
dinámicamente.
52. Page 52
• En este modelo todos los datos son almacenados en relaciones, y como
cada relación es un conjunto de datos, el orden en el que estos se
almacenen no tiene relevancia (a diferencia de otros modelos como el
jerárquico y el de red). Esto tiene la considerable ventaja de que es más
fácil de entender y de utilizar por un usuario no experto. La información
puede ser recuperada o almacenada por medio de consultas que ofrecen
una amplia flexibilidad y poder para administrar la información.
• Este modelo considera la base de datos como una colección de relaciones.
De manera simple, una relación representa una tabla que no es más que
un conjunto de filas, cada fila es un conjunto de campos y cada campo
representa un valor que interpretado describe el mundo real. Cada fila
también se puede denominar tupla o registro y a cada columna también
se le puede llamar campo o atributo.
53. Page 53
Sus ventajas.
1. Provee herramientas que garantizan
evitar la duplicidad de registros.
2. Garantiza la integridad referencial, así, al
eliminar un registro elimina todos los
registros relacionados dependientes.
3. Favorece la normalización por ser más
comprensible y aplicable.
54. Page 54
Sus desventajas.
1. Presentan deficiencias con datos gráficos, multimedia,
CAD y sistemas de información geográfica.
2. No se manipulan de forma eficiente los bloques de texto
como tipo de dato.
3. Las bases de datos orientadas a objetos (BDOO) se
propusieron con el objetivo de satisfacer las
necesidades de las aplicaciones anteriores y así,
complementar pero no sustituir a las bases de datos
relacionales.
55. Page 55
Base de datos relacional.
• Una base de datos relacional es un conjunto de una o más tablas
estructuradas en registros (líneas) y campos (columnas), que se
vinculan entre sí por un campo en común, en ambos casos posee las
mismas características como por ejemplo el nombre de campo, tipo y
longitud; a este campo generalmente se le denomina ID,
identificador o clave. A esta manera de construir bases de datos se le
denomina modelo relacional.
• Estrictamente hablando el término se refiere a una colección
específica de datos pero a menudo se le usa, en forma errónea como
sinónimo del software usado para gestionar esa colección de datos.
Ese software se conoce como sistema gestor de base de datos
relacional (SGBD) o en inglés relational database management
system (RDBMS).
56. Page 56
Algunas ventajas del
modelo relacional:
1. Garantiza herramientas para evitar la
duplicidad de registros, a través de campos
claves o llaves.
2. Garantiza la integridad referencial: Así al
eliminar un registro elimina todos los registros
relacionados dependientes.
3. Favorece la normalización por ser más
comprensible y aplicable.
59. Page 59
¿Qué es indexación?
• Se refiere a diversos métodos para incluir en el índice de
internet el contenido de un sitio web. Determinados sitios
web o intranet pueden utilizar un índice de back-of-the-book,
mientras que los motores de búsqueda suelen utilizar
palabras clave y metadatos (metaetiquetas) para proporcionar
un vocabulario más útil para Internet o la búsqueda en el
sitio. Con el aumento en el número de publicaciones
periódicas que tienen artículos en línea, la indexación web
también está adquiriendo importancia para los sitios web de
periódicos o revistas con contenido actualizado .
60. Page 60
• Pues bien, en la red, el indexado se hace de los sitios
webs que pasan a incluirse a la propia base de datos
del buscador para que salten posteriormente entre
los resultados que obtiene el usuario. Así, han ido
surgiendo diversas fórmulas para la indexación, ya
que a todas las páginas les interesa aparecer entre
las primeras posiciones en los buscadores. Por ello,
técnicas como ser enlazado en otras webs se ha
impuesto para lograr un buen puesto.
61. Page 61
• La información de indexación web implica la asignación de
palabras clave o frases a páginas web o sitios web dentro de
un campo de meta-etiquetas, por lo que los sitios web
pueden ser recuperados con un motor de búsqueda que se
personaliza para buscar el campo de palabras clave. Para
mejorar la indexación de un sitio web específico existen
varios métodos conocidos en el entorno de SEO (Search
Engine Optimization), utilizando diferentes técnicas para que
la posición del sitio web aumente de acuerdo a las palabras
que el usuario ingresa para hacer una búsqueda.
62. Page 62
• Esta relación se produce a nivel interno en el buscador que se
trate, que asigna a determinadas palabras un determinado
contenido existente en la Web (páginas), a la vez que lo
jerarquiza también internamente (indexado) en función de la
relevancia asignada, dando prioridad en la presentación de
resultados a unos contenidos sobre otros, prioridad que viene
marcada por una serie de parámetros (el famosos algoritmo
de búsqueda de Google) tendentes a dar al usuario que
realiza la búsqueda el mejor resultado posible de acuerdo a
las palabras introducidas.
63. Page 63
• Además, el indexado no sólo se hace
imprescindible en los motores de búsqueda,
sino también en cualquier base de datos que
requiere de una ordenación concreta para
encontrar el documento que necesita de la
manera más rápida y eficaz.
64. Page 64
Sus ventajas.
• Una de las mayores ventajas es que cuando Mysql se encuentra un índice
evitamos un “escaneo completo de la tabla” lo que hace que cuando
tenemos grandes cantidades de datos en nuestras tablas, la mejora puede
ser muy importante.
1. Muy relacionado con el anterior… al evitar “escaneos completos de las
tablas”, evitamos los siguientes problemas: Sobrecarga de CPU, sobrecarga
de disco y concurrencia.
2. Con los índices evitamos que Mysql tenga que hacer lecturas secuenciales.
3. Los índices nos permiten una mayor rapidez en la ejecución de las consultas
tipo SELECT lo que sea WHERE …
4. Y por último será una ventaja para aquellos campos que no tengan datos
duplicados, sin embargo si es un campo con valores que se repiten
continuamente (Ej. Masculino/Femenino) no es aconsejable.
65. Page 65
Sus desventajas.
• Pero a pesar de sus grandes ventajas no debemos abusar de ellos
puesto que en determinadas situaciones no supondrá una mejora:
1. Los índices son una desventaja en aquellas tablas las que se utiliza
frecuentemente operaciones de escritura (Insert, Delete, Update), esto
es porque los índices se actualizan cada vez que se modifica una
columna.
2. Los índices también suponen una desventaja en tablas demasiado
pequeñas puesto que no necesitaremos ganar tiempo en las consultas.
3. Tampoco son muy aconsejables cuando pretendemos que la tabla sobre
la que se aplica devuelva una gran cantidad de datos en cada consulta.
4. Por último hay que tener en cuenta que ocupan espacio y en
determinadas ocasiones incluso más espacio que los propios datos.
68. Page 68
¿Qué es una Base da datos
distribuida?
• Es un conjunto de múltiples bases de datos lógicamente
relacionadas las cuales se encuentran distribuidas en diferentes
espacios lógicos y geográficos (pej. un servidor corriendo 2
máquinas virtuales) e interconectados por una red de
comunicaciones. Dichas BDD tienen la capacidad de realizar
procesamiento autónomo, esto permite realizar operaciones
locales o distribuidas. Un sistema de Bases de Datos Distribuida
(SBDD) es un sistema en el cual múltiples sitios de bases de
datos están ligados por un sistema de comunicaciones de tal
forma que, un usuario en cualquier sitio puede acceder los datos
en cualquier parte de la red exactamente como si estos fueran
accedidos de forma local.
69. Page 69
• Por ende una Base de Datos Distribuida es una
colección de datos que pertenecen
lógicamente a un solo sistema, pero se
encuentra físicamente distribuido en varios
computadores o servidores de datos en una
red de computadoras.
70. Page 70
¿De qué se compone?
• Un sistema de bases de datos distribuidas se compone de un
conjunto de sitios lógicos, conectados entre sí, mediante algún tipo
de red de comunicaciones, en el cual:
1. Cada sitio lógico puede tener un sistema de base de datos.
2. Los sitios han sido diseñados para trabajar en conjunto, con el fin
de que un usuario de cualquier posición geográfica pueda obtener
acceso a los datos desde cualquier punto de la red tal como si
todos los datos estuvieran almacenados en la posición propia del
usuario. Entonces, la llamada "Base de Datos Distribuida" es en
realidad una especie de “objeto virtual”, cuyos componentes se
almacenan físicamente en varias “bases de datos reales” ubicadas
en diferentes sitios. En esencia es la unión lógica de esas
diferentes bases de datos.
71. Page 71
Los principios fundamentales de
un sistema de datos distribuido .
1. Autonomía local.
2. No dependencia de un sitio central.
3. Operación continúa.
4. Independencia con respecto a la localización.
5. Independencia con respecto a la fragmentación.
6. Independencia de réplica.
7. Procesamiento distribuido de consultas.
8. Manejo distribuido de transacciones.
9. Independencia con respecto al equipo.
10. Independencia con respecto al sistema operativo.
72. Page 72
13. Independencia con respecto a la red.
12. Independencia con respecto al SGBD.
• Estos doce postulados no son todas independientes
entre sí, ni tienen todos la misma importancia que
cada usuario le otorgue. Sin embargo, sí son útiles
como fundamento para entender la tecnología
distribuida y como marco de referencia para
caracterizar la funcionalidad de sistemas distribuidos
específicos.
73. Page 73
Definiciones.
1. Autonomía local: Los sitios o posiciones de un sistema distribuido
deben ser autónomos. La autonomía local significa que todas las
operaciones en un sitio determinado se controlan en ese sitio; ningún
sitio A deberá depender de algún otro sitio B para su buen
funcionamiento (pues de otra manera el sitio A podría ser incapaz de
trabajar, aunque no tenga en sí problema alguno, si cae el sitio B).
2. No dependencia de un sitio central: La no dependencia de un sitio
central, sería lo ideal pero si esto no se logra la autonomía local
completa se vería comprometida.
3. Operación continúa: En un sistema distribuido, lo mismo que en uno
no distribuido, nunca debería haber necesidad de apagar o dejar de
funcionar. Es decir, el sistema nunca debería necesitar apagarse para
que se pueda realizar alguna operación, como añadirse un nuevo sitio
o instalar una versión mejorada del SGBD en un sitio ya existente.
74. Page 74
4. Independencia con respecto a la localización: La independencia con respecto
a la localización, permite que los usuarios finales no sepan donde están
almacenados físicamente los datos, sino que trabajen como si todos los datos
estuvieran almacenados en su propio sitio local. La independencia con respecto
a la localización es deseable porque simplifica los sistemas de información de los
usuarios y sus actividades en la terminal.
5. Independencia con respecto a la fragmentación: Un sistema tiene
fragmentación de datos solo si es posible dividir una relación en partes o
"fragmentos" para propósitos de almacenamiento físico. La fragmentación es
deseable por razones de desempeño: los datos pueden almacenarse en la
localidad donde se utilizan con mayor frecuencia, de manera que la mayor parte
de las operaciones sean solo locales y se reduzca el tráfico en la red de cómputo.
75. Page 75
6. Independencia de réplica: Un sistema maneja réplica de datos si una
relación dada se puede representar en el nivel físico mediante varias copias
réplicas, en muchos sitios distintos. La réplica es deseable al menos por dos
razones: en primer lugar, puede producir un mejor desempeño (las
aplicaciones pueden operar sobre copias locales en vez de tener que
comunicarse con sitios remotos); en segundo lugar, también puede significar
una mejor disponibilidad (un objeto estará disponible para su procesamiento
en tanto esté disponible por lo menos una copia, al menos para propósitos de
recuperación).
7. Procesamiento distribuido de consultas: Este manejo de datos en las
consultas permite las consultas eficientes desde diferentes usuarios con las
características que determine el sistema; la consulta de datos es más
importante en un sistema distribuido que en uno centralizado.
76. Page 76
8. Manejo distribuido de transacciones: Este manejo tiene dos aspectos
principales, el control de recuperación y el control de concurrencia, cada uno
de los cuales requiere un tratamiento más amplio en el ambiente distribuido.
En un sistema distribuido, una sola transacción puede implicar la ejecución de
programas o procesos en varios sitios (en particular puede implicar
actualizaciones en varios sitios).
9. Independencia con respecto al equipo: Las instalaciones de cómputo en el
mundo real por lo regular incluyen varias máquinas de diferentes marcas
comerciales como IBM, DELL, HP, SUN, entre otras; por esta razón existe una
verdadera necesidad de poder integrar los datos en todos esos sistemas y
presentar al usuario "una sola imagen del sistema".
77. Page 77
10. Independencia con respecto al sistema operativo: Es necesario y
conveniente no sólo de poder ejecutar el mismo SGBD en diferentes equipos,
sino también poder ejecutarlo en diferentes sistemas operativos y lograr que
una versión LINUX y una WINDOWS participen todas en el mismo sistema
distribuido.
11. Independencia con respecto a la red: Si el sistema puede manejar múltiples
sitios, con equipos distintos y diferentes sistemas operativos, resulta obvia la
conveniencia de manejar también varios tipos de redes de comunicación
distintas.
12. Independencia con respecto al SGBD: En la independencia con respecto a su
manejo, se requiere que los SGBD en los diferentes sitios manejen todos la
misma interfaz; no necesitan ser por fuerza copias del mismo sistema.
78. Page 78
Ventajas de las BDD.
1. Favorecer la naturaleza distribuidora de muchas
aplicaciones, no solamente a nivel local sino incluso en
diferentes lugares.
2. Existe un acercamiento bastante notable a las estructuras
organizacionales de las empresas o sectores productivos.
3. Se consigue compartir los datos, sin perder el control local.
4. El rendimiento es más alto cuando se distribuye una gran
base de datos por múltiples sitios, las consultas locales y
las transacciones tienen mejor rendimiento porque las
bases de datos locales son más pequeñas.
79. Page 79
• A parte de esta distribución, se puede conseguir lo siguiente en estos
sistemas:
1. Reducir el número de transacciones ejecutándose por sitio.
2. Un paralelismo entre las consultas ejecutando varias de estas en sitios
diferentes.
3. Descomposición de consultas en sub consultas que pueden ejecutarse
en paralelo.
4. Aumento de la fiabilidad y la disponibilidad de los datos.
5. Los procesos de expansión se hacen más sencillos en un sistema
distribuido; cuando se quiere añadir un nuevo sitio en nuestro sistema
distribuido, el resto de operaciones que se ejecutan en los demás no
se verán afectados.
6. La autonomía de estos sistemas es alta.
82. Page 82
¿Qué es NOSQL?
• Cuando hablamos de base datos NoSQL, también conocidas
como “No sólo SQL”, nos referimos a una amplia clase de
sistemas de gestión de datos (mecanismos para el
almacenamiento y recuperación de datos) que difieren, en
aspectos importantes, del modelo clásico de relaciones entre
entidades (o tablas) existente en los sistemas de gestión
bases de datos relacionales, siendo el más destacado el que
no usan SQL como lenguaje principal de consulta. Aunque son
conocidas desde la década de los 60 del pasado siglo, su auge
actual viene determinado por el uso que, de estos sistemas
han hecho las principales compañías de internet como
Amazon, Google, Twitter y Facebook.
83. Page 83
¿Qué hace a NoSQL
diferente?
• Una diferencia clave entre las bases de datos de NoSQL y las bases de
datos relacionales tradicionales, es el hecho de que NoSQL es una forma de
almacenamiento no estructurado.
• Esto significa que NoSQL no tiene una estructura de tabla fija como las que
se encuentran en las bases de datos relacionales.
84. Page 84
Sus características mas
comunes.
• Consistencia Eventual: A diferencia de las bases de datos relacionales
tradicionales, en la mayoría de sistemas NoSQL, no se implementan
mecanismos rígidos de consistencia que garanticen que cualquier cambio
llevado a cabo en el sistema distribuido sea visto, al mismo tiempo, por todos
los nodos y asegurando, también, la no violación de posibles restricciones de
integridad de los datos u otras reglas definidas.
• Flexibilidad en el esquema: En la mayoría de base de datos NoSQL, los
esquemas de datos son dinámicos; es decir, a diferencia de las bases de datos
relacionales en las que, la escritura de los datos debe adaptarse a unas
estructuras(o tablas, compuestas a su vez por filas y columnas) y tipos de datos
pre-definidos, en los sistemas NoSQL, cada registro (o documento, como se les
suele llamar en estos casos) puede contener una información con diferente
forma cada vez, pudiendo así almacenar sólo los atributos que interesen en
cada uno de ellos, facilitando el polimorfismo de datos bajo una misma
colección de información.
85. Page 85
• Escalabilidad horizontal: Por escalabilidad horizontal se entiende la
posibilidad de incrementar el rendimiento del sistema añadiendo,
simplemente, más nodos (servidores) e indicando al sistema cuáles
son los nodos disponibles.
• Estructura distribuida: Generalmente los datos se distribuyen, entre
los diferentes nodos que componen el sistema.
• Tolerancia a fallos y Redundancia: Pese a lo que cualquiera pueda
pensar cuando se habla de NoSQL, no todas las tecnologías
existentes bajo este paraguas usan el mismo modelo de datos ya
que, al ser sistemas altamente especializados, la idoneidad particular
de una base de datos NoSQL dependerá del problema a resolver.
86. Page 86
Los diferentes modelos de datos
usados en sistemas NoSQL
1. Base de datos de Documentos: Este tipo de base de datos almacena la
información como un documento, usando para habitualmente para ello
una estructura simple como JSON, BSON o XML y donde se utiliza una
clave única para cada registro.
2. Almacenamiento Clave-Valor: Son el modelo de base de datos NoSQL
más popular, además de ser la más sencilla en cuanto a funcionalidad.
3. Bases de datos de grafos: Usadas para aquellos datos cuyas relaciones
se pueden representar adecuadamente mediante un grafo.
4. Base de datos Columna (o Columna ancha): En vez de “tablas”, en las
bases de datos de columna tenemos familias de columnas que, son los
contenedores de las filas.
87. Page 87
Sus ventajas.
• A diferencia de las bases de datos relacionales, las bases de datos NoSQL están
basadas en key-value pairs
• Algunos tipos de almacén de bases de datos NoSQL incluyen diferentes tipos de
almacenes como por ejemplo el almacén de columnas, de documentos, de key
value store, de gráficos, de objetos, de XML y otros modos de almacén de
datos.
• Algunos tipos de almacén de bases de datos NoSQL incluyen almacenes de
columnas, de documentos, de valores de claves, de gráficos, de objetos, de XML
y otros modos de almacén de datos.
• podría decirse que las bases de datos NoSQL de código abierto tienen una
implementación rentable. Ya que no requieren las tarifas de licencia y pueden
ejecutarse en hardware de precio bajo.
• Cuando trabajamos con bases de datos NoSQL, ya sean de código abierto o
tengan un propietario, la expansión es más fácil y más barata que cuando se
trabaja con bases de datos relacionales. Esto se debe a que se realiza un
escalado horizontal y se distribuye la carga por todos los nodos.
88. Page 88
Sus desventajas.
• La mayoría de las bases de datos NoSQL no admiten funciones de
fiabilidad, que son soportadas por sistemas de bases de datos
relacionales. Estas características de fiabilidad pueden resumirse en:
“atomicidad, consistencia, aislamiento y durabilidad.”
• Con el fin de apoyar las características de fiabilidad y coherencia, los
desarrolladores deben implementar su propio código, lo que agrega más
complejidad al sistema.
• Esto podría limitar el número de aplicaciones en las que podemos
confiar para realizar transacciones seguras y confiables, como por
ejemplo los sistemas bancarios.
• Otras formas de complejidad encontradas en la mayoría de las bases de
datos NoSQL, incluyen la incompatibilidad con consultas SQL. Esto
significa que se necesita un lenguaje de consulta manual, haciendo los
procesos mucho más lentos y complejos.
90. Page 90
¿Qué es?
• Es un sistema de base de datos NoSQL orientado a documentos,
desarrollado bajo el concepto de código abierto. MongoDB forma parte
de la nueva familia de sistemas de base de datos NoSQL. En lugar de
guardar los datos en tablas como se hace en las base de datos
relacionales, MongoDB guarda estructuras de datos en documentos
similares a JSON con un esquema dinámico (MongoDB utiliza una
especificación llamada BSON), haciendo que la integración de los datos
en ciertas aplicaciones sea más fácil y rápida.
• El desarrollo de MongoDB empezó en octubre de 2007 por la compañía
de software 10gen. Ahora MongoDB es una base de datos lista para su
uso en producción y con muchas características (features). Esta base de
datos se utiliza mucho en la industria, contando con implantaciones en
empresas como MTV Network,Craiglist o Foursquare.
91. Page 91
• El desarrollo de MongoDB empezó con la empresa de software 10gen Inc.
(ahora llamada MongoDB Inc.) en 2007 cuando estaban desarrollando una
plataforma como servicio (Padas) similar al conocido Google App Engine.
En 2009 MongoDB fue lanzado como un producto independiente y
publicado bajo la licencia de código abierto AGPL.
• En marzo de 2011, se lanzó la versión 1.4 y se consideró ya como una base
de datos lista para su uso en producción.8
93. Page 93
Conclusión.
• Microsoft Access contiene también muchas formas para poder
mantener un orden con la información como las tablas y los
formularios al igual que también cuenta con elementos que ayudan
al usuario o usuaria como, por ejemplo, las consultas, utilizadas
para ubicar los datos, informes, utilizado para imprimir la
información y la base de datos, macros y módulos, utilizados para
crear funciones que faciliten el trabajo, y los controles, que facilitan
la internas con el usuario, y pudimos conocer muchos mas sobres
las tablas, sus tipos y como se componen entre otras cosas y no
solo de las tablas si no de la misma base de datos, consultas e
registros.