1. FUNCIONES DE UN DBA
Universidad Nacional del Callao
Chapa Príncipe Angy Milagros
2. Definición de DBA
▪ El administrador de base de datos (DBA) es un
especialista en BASE DE DATOS e informática
que conoce las herramientas de gestión de la
BD, así como la forma de desarrollar los planes
del administrador de datos. Así mismo, decide
la política de copias de seguridad, duplicación
de la información filtros de acceso de usuarios
que aseguren los niveles de seguridad deseados,
tanto frente a la pérdida de información como
frente al acceso no autorizado.
3. Funciones del DBA
• RECUPERABILIDAD
– La Recuperabilidad significa que, si se da algún error en los datos, hay un bug de
programa ó de hardware, el DBA puede traer de vuelta la base de datos al
tiempo y estado en que se encontraba en estado consistente antes de que el
daño se causara.
– Las actividades de recuperación incluyen el hacer respaldos de la base de datos y
almacenar esos respaldos de manera que se minimice el riesgo de daño ó
pérdida de los mismos, tales como hacer diversas copias en medios de
almacenamiento removibles y almacenarlos fuera del área en antelación a un
desastre anticipado.
– La recuperación es una de las tareas más importantes de los DBA. La
recuperabilidad tiene dos formas primarias. Los respaldos y las pruebas de
recuperación.
4. • INTEGRIDAD
− Consiste en que la base de datos ó los programas que generaron su contenido,
incorporen métodos que aseguren que el contenido de los datos del sistema no
se rompa así como las reglas del negocio.
− Por ejemplo, un distribuidor puede tener una regla la cual permita que solo los
clientes individuales puedan solicitar órdenes; a su vez cada orden identifique a
uno y solo un proveedor. El servidor Oracle y otros DBMS relacionales hacen
cumplir este tipo de reglas del negocio con limitantes, las cuales pueden ser
configuradas implícitamente a través de consultas.
• SEGURIDAD
− Es la capacidad de los usuarios para acceder y cambiar los datos de acuerdo a las
políticas del negocio, así como, las decisiones de los encargados. Al igual que
otros metadatos, una DBMS relacional maneja la seguridad en forma de tablas.
Estas tablas son las "llaves del reino" por lo cual se deben proteger de posibles
intrusos.
5. • DISPONIBILIDAD
− Consiste en que los usuarios autorizados tengan acceso a los datos cuando lo
necesiten para atender a las necesidades del negocio. De manera incremental
los negocios han ido requiriendo que su información esté disponible todo el
tiempo (7x24", o siete días a la semana, 24 horas del día). La industria de TI ha
respondido a estas necesidades con redundancia de red y hardware para
incrementar las capacidades administrativas en línea.
• RENDIMIENTO
− El rendimiento significa que la base de datos no cause tiempos de respuesta
poco razonables. En sistemas muy complejos cliente/servidor y de tres capas, la
base de datos es solo uno de los elementos que determinan la experiencia de los
usuarios en línea y los programas desatendidos. El rendimiento es una de las
mayores motivaciones de los DBA para coordinarse con los especialistas de
otras áreas del sistema fuera de las líneas burocráticas tradicionales.
6. • DESARROLLO / SOPORTE A PRUEBAS
− Uno de los deberes menos respetados por el administrador de base de datos es
el desarrollo y soporte a pruebas, mientras que algunos otros encargados lo
consideran como la responsabilidad más importante de un DBA. Las actividades
de soporte incluyen la colecta de datos de producción para llevar a cabo pruebas
con ellos; consultar a los programadores respecto al desempeño; y hacer
cambios a los diseños de tablas de manera que se puedan proporcionar nuevos
tipos de almacenamientos para las funciones de los programas.
7. Recuperabilidad - Crear y probar Respaldos.
Integridad - Verificar ó ayudar a la
verificación en la integridad de datos.
Seguridad - Definir y/o implementar
controles de acceso a los datos.
Disponibilidad - Asegurarse del mayor
tiempo de encendido.
Desempeño - Asegurarse del máximo
desempeño incluso con las limitaciones
Desarrollo y soporte a pruebas - Ayudar a los
programadores e ingenieros a utilizar
eficientemente la base de datos.
• EN CONCLUSIÓN… un DBA es la persona responsable de los aspectos ambientales de una base de datos. En
general esto incluye:
8. El diseño lógico y físico de las bases de datos a pesar de no ser obligaciones de un
administrador de bases de datos, es a veces parte del trabajo. Esas funciones por lo
general están asignadas a los analistas de bases de datos ó a los diseñadores de bases
de datos.
Programador de aplicaciones.
Administrador de sistema.
Administrador de datos.
Arquitecto de datos.
10. ¿Qué es una base de datos?
▪ Uno de los términos de tecnología que la mayoría
de las personas se han acostumbrado a escuchar,
ya sea en el trabajo o mientras se navega por
Internet es base de datos. La base de datos solía
ser un término muy técnico, sin embargo con el
aumento de los sistemas informáticos y la
tecnología de información a lo largo de nuestra
cultura, las bases de datos se han convertido en
un término común.
▪ La definición de una base de datos es una
recolección estructurada de registros o datos
que se almacena en un sistema informático.
▪ Para que una base de datos sea realmente
funcional, no sólo debe almacenar grandes
cantidades de registros, también se deben
acceder fácilmente. Además, la nueva
información y los cambios deberían ser también
bastante fáciles de efectuarse.
11. Tipos de bases de datos
Bases De Datos Estáticas
Estas son bases de datos de solo
lectura, utilizadas primordialmente
para almacenar datos históricos que
posteriormente se pueden utilizar para
estudiar el comportamiento de un
conjunto de datos a través del tiempo,
realizar proyecciones y tomar
decisiones.
Bases De Datos Dinámicas
Estas son bases de datos donde la
información almacenada se modifica
con el tiempo, permitiendo operaciones
como actualización, borrado y adición
de datos, además de las operaciones
fundamentales de consulta. Un ejemplo
de esto puede ser la base de datos
utilizada en un sistema de información
de un supermercado, una farmacia, un
videoclub o una empresa.
Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto que se este
manejando, o la utilidad de la misma.
Según la variabilidad de los datos almacenados:
12. Según la variabilidad de los datos almacenados:
• Bases de datos bibliográficas
Solo contienen un surrogante (representante) de la fuente primaria, que
permite localizarla.Un registro típico de una base de datos bibliográfica
• Bases de datos de texto completo
Almacenan las fuentes primarias, como por ejemplo, todo el contenido de
todas las ediciones de una colección de revistas científicas.
• Bases de datos o "bibliotecas" de información química o biológica
Son bases de datos que almacenan diferentes tipos de información
proveniente de la química, las ciencias de la vida o médicas.
• Bases de datos clínicas.
Bases de datos bibliográficas (biológicas, químicas, médicas y de otros
campos).
13. Modelos de Bases de Datos
▪ Ademas de la clasificacion por la función de las bases de datos, estas
también se pueden clasificar de acuerdo a su modelo de
administración de datos.
▪ Un modelo de datos es básicamente una "descripción" de algo
conocido como contenedor de datos (algo en donde se guarda la
información), así como de los métodos para almacenar y recuperar
información de esos contenedores. Los modelos de datos no son
cosas físicas: son abstracciones que permiten la implementación de
un sistema eficiente de base de datos; por lo general se refieren a
algoritmos , y conceptos matemáticos.
14. • Bases De Datos Jerárquicas
• En este modelo los datos se organizan en una forma similar a un árbol (visto al revés), en donde un
nodo padre de información puede tener varios hijos. El nodo que no tiene padres es llamado raíz, y
a los nodos que no tienen hijos se los conoce como hojas.
• Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que manejan un
gran volumen de información y datos muy compartidos permitiendo crear estructuras estables y
de gran rendimiento.
• Una de las principales limitaciones de este modelo es su incapacidad de representar
eficientemente la redundancia de datos.
• Base De Datos De Red
• Éste es un modelo ligeramente distinto del jerárquico; su diferencia fundamental es la modificación
del concepto de nodo: se permite que un mismo nodo tenga varios padres (posibilidad no permitida
en el modelo jerárquico).
• Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una solución eficiente al
problema de redundancia de datos; pero, aun así, la dificultad que significa administrar la
información en una base de datos de red ha significado que sea un modelo utilizado en su mayoría
por programadores más que por usuarios finales.
15. • Bases De DatosTransaccionales
• Son bases de datos cuyo único fin es el envío y recepción de datos a grandes velocidades, estas
bases son muy poco comunes y están dirigidas por lo general al entorno de análisis de calidad,
datos de producción e industrial, es importante entender que su fin único es recolectar y recuperar
los datos a la mayor velocidad posible, por lo tanto la redundancia y duplicación de información no
es un problema como con las demás bases de datos, por lo general para poderlas aprovechar al
máximo permiten algún tipo de conectividad a bases de datos relacionales.
• Bases De Datos Multidimensionales
• Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creación de cubos
olap Básicamente no se diferencian demasiado de las bases de datos relacionales (una tabla en una
base de datos relacional podría serlo también en una base de datos multidimensional), la diferencia
está más bien a nivel conceptual; en las bases de datos multidimensionales los campos o atributos
de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla, o bien
representan métricas que se desean estudiar.
16. • Bases De Datos Documentales
• Permiten la indexación a texto completo, y en líneas generales realizar búsquedas más potentes.
Tesaurus es un sistema de índices optimizado para este tipo de bases de datos.
• Bases De Datos Deductivas
• Un sistema de base de datos deductiva, es un sistema de base de datos pero con la diferencia de
que permite hacer deducciones a través de inferencias. Se basa principalmente en reglas y hechos
que son almacenados en la base de datos. Las bases de datos deductivas son también llamadas
bases de datos lógicas, a raíz de que se basa en lógica matemática.
• Bases De Datos Orientadas a Objetos
• Este modelo, bastante reciente, y propio de los modelos informáticos enfocado a objetos, trata de
almacenar en la base de datos los objetos completos (estado y comportamiento).
17. • Bases De Datos Relacionales
• Éste es el modelo utilizado en la actualidad para modelar problemas reales y administrar datos
dinámicamente.
• En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a
diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable ventaja de
que es más fácil de entender y de utilizar para un usuario esporádico de la base de datos. La
información puede ser recuperada o almacenada mediante "consultas" que ofrecen una amplia
flexibilidad y poder para administrar la información.
• El lenguaje más habitual para construir las consultas a bases de datos relacionales es
SQL, Structured Query Language o Lenguaje Estructurado de Consultas, un estándar
implementado por los principales motores o sistemas de gestión de bases de datos relacionales.
• Durante su diseño, una base de datos relacional pasa por un proceso al que se le conoce como
normalización de una base de datos.
18. Base de Datos relacional
Ventajas
▪ Está más adaptado su uso y los perfiles que los
conocen son mayoritarios y más baratos.
▪ Debido al largo tiempo que llevan en el
mercado, estas herramientas tienen un mayor
soporte y mejores suites de productos y add-
ons para gestionar estas bases de datos.
▪ La atomicidad de las operaciones en la base de
datos. Esto es, que en estas bases de datos o se
hace la operación entera o no se hace
utilizando la famosa técnica del rollback.
▪ Los datos deben cumplir requisitos de
integridad tanto en tipo de dato como en
compatibilidad.
Desventajas
▪ La atomicidad de las operaciones juegan un
papel crucial en el rendimiento de las bases de
datos.
▪ Escalabilidad, que aunque probada en muchos
entornos productivos suele, por norma, ser
inferior a las bases de datos NoSQL.
19. • Bases De Datos No Relacionales NoSQL
• Las bases de datos NoSQL son bases de datos no relacionales optimizadas para modelos de datos
sin esquema y de desempeño escalable.También son ampliamente conocidas por su facilidad de
desarrollo, baja latencia y resiliencia. Utilizan una variedad de modelos de datos, como los
almacenes de valor clave en memoria, de gráficos, de documentos y en columnas. Esta página
incluye recursos que le servirán para comenzar a usar las bases de datos NoSQL.
• Son muchas las grandes empresas que hacen uso de este tipo de bases de datos no relacionales,
como:
• Cassandra: Facebook,Twitter…
• HBase:Yahoo, Adobe…
• Redis: Flickr, Instagram, Github…
• Neo4j: Infojobs…
• MongoDB: FourSquare, SourceForge, CERN…
20. Base de Datos no relacional
Ventajas
▪ La escalabilidad y su carácter descentralizado.
Soportan estructuras distribuidas.
▪ Suelen ser bases de datos mucho más abiertos y
flexibles. Permiten adaptarse a necesidades de
proyectos mucho más fácilmente que los modelos
de Entidad Relación.
▪ Se pueden hacer cambios de los esquemas sin tener
que parar bases de datos.
▪ Escalabilidad horizontal: son capaces de crecer en
número de máquinas, en lugar de tener que residir
en grandes máquinas.
▪ Se pueden ejecutar en máquinas con pocos
recursos.
▪ Optimización de consultas en base de datos para
grandes cantidades de datos.
Desventajas
▪ No todas las bases de datos NoSQL contemplan la
atomicidad de las instrucciones y la integridad de los
datos. Soportan lo que se llama consistencia eventual.
▪ Problemas de compatibilidad entre instrucciones SQL. Las
nuevas bases de datos utilizan sus propias características
en el lenguaje de consulta y no son 100% compatibles con
el SQL de las bases de datos relacionales. El soporte a
problemas con las queries de trabajo en una base de datos
NoSQL es más complicado.
▪ Falta de estandarización. Hay muchas bases de datos
NoSQL y aún no hay un estándar como si lo hay en las
bases de datos relacionales. Se presume un futuro incierto
en estas bases de datos.
▪ Soporte multiplataforma. Aún quedan muchas mejoras en
algunos sistemas para que soporten sistemas operativos
que no sean Linux.
▪ Suelen tener herramientas de administración no muy
usables o se accede por consola.
21. NoSQL vs SQL: Cuándo utilizar qué tipo
de base de datos
▪ Cuando los datos deben ser consistentes sin dar posibilidad al error
utilizar una base de datos relacional. SQL.
▪ Cuando nuestro presupuesto no se puede permitir grandes máquinas
y debe destinarse a máquinas de menor rendimiento. NoSQL.
▪ Cuando las estructuras de datos que manejamos son variables.
NoSQL.
▪ Análisis de grandes cantidades de datos en modo lectura. NoSQL
▪ Captura y procesado de eventos. NoSQL
▪ Tiendas online con motores de inteligencia complejos. NoSQL