SlideShare una empresa de Scribd logo
1 de 16
BASES DE DATOS
PARALELAS



CARLOS FELIPE FAJARDO PINEDA
Un sistema de gestión de bases de

    datos, consiste en una colección de datos
    interrelacionados y un conjunto de programas
    que permiten a los usuarios acceder y modificar
    dichos datos. La colección de datos se denomina
    base de datos.

    La arquitectura de un sistema de base de datos

    está influenciada en gran medida por el sistema
    informático subyacente en el que se ejecuta el
    sistema de base de datos. En la arquitectura de
    un sistema de base de datos se reflejan
    aspectos como la conexión en red:

    •   Base de datos Distribuidas
    •   Base de datos Paralelas
SGBD paralelo: Un SGBD que se ejecuta
    sobre múltiples procesadores y discos que
    han sido diseñados para ejecutar
    operaciones en paralelo, cuando sea
    posible, con el propósito de mejorar el
    rendimiento.

    Los sistemas paralelos mejoran la velocidad

    de procesamiento y de E/S mediante la
    utilización de UCP y discos en paralelo .

    Los sistemas paralelos de base de datos

    constan de varios procesadores y varios
    discos conectados a través de una red de
    interconexión de alta velocidad. Para medir el
    rendimiento de los sistemas de base de
    datos existen 2 medidas principales:
1. La productividad que se entiende como el

    número de tareas que pueden completarse
    en un intervalo de tiempo determinado.

    2. El tiempo de respuesta que es la cantidad

    de tiempo que necesita para completar una
    única tarea a partir del momento en que se
    envíe. Un sistema que procese un gran
    número de pequeñas transacciones puede
    mejorar su productividad realizando muchas
    transacciones en paralelo. Un sistema que
    procese transacciones más largas puede
    mejorar tanto su productividad como sus
    tiempos de respuesta realizando en paralelo
    cada una de las subtareas de cada
    transacción.
El objetivo del paralelismo en los

    sistemas de bases de datos suele ser
    asegurar que la ejecución del sistema
    continuará realizándose a una
    velocidad aceptable, incluso en el
    caso de que aumente el tamaño de la
    base de datos o el número de
    transacciones (ampliabilidad).
Porque la necesidad de usar Bd
Paralelas ??
Actualmente los Sistemas Paralelos se están
  comercializando con éxito por prácticamente
  todos los fabricantes de BD. Tal cambio lo
  han impulsado las siguientes tendencias:
 Los requisitos transaccionales de las
  empresas han aumentado, con el uso
  creciente de las computadoras.
 El crecimiento de la WWW y los datos
  recogidos por los visitantes han producido
  BD extremadamente grandes en muchas
  empresas.
 Las empresas utilizan volúmenes crecientes
  de datos para planificar sus actividades y sus
  tarifas.
◦ Las consultas utilizadas para estos fines se
  denominan consultas de Ayuda a la Toma de
  Decisiones y las necesidades de datos para las
  mismas pueden llegar a los terabytes.
◦ Los sistemas con un único procesador no son
  capaces de tratar volúmenes de datos tan grandes a
  la velocidad necesaria.
◦ La naturaleza orientada a conjuntos de las consultas
  de BD se presta de manera natural a la
  paralelización.
◦ Varios sistemas comerciales y de investigación han
  demostrado la potencia y dimensionalidad del
  procesamiento paralelo de consultas.
◦ Con el abaratamiento de los microprocesadores, las
  máquinas paralelas se han vuelto comunes y
  relativamente baratas.
◦ El paralelismo también se utiliza para proporcionar
  ampliabilidad, y las cargas de trabajo crecientes se
  tratan sin aumentar el tiempo de respuesta mediante
  un aumento en el grado de paralelismo.
Modelos de Arquitectura



  Memoria compartida. Todos los

  procesadores comparten una
  memoria común.
 Disco compartido. Todos los
  procesadores comparten un disco
  común.
 Sin compartimiento. Los procesadores
  no comparten ni memoria ni disco.
 Jerárquico. Es un híbrido de las
  anteriores.
Modelos de Arquitectura
TÉCNICAS DE DIVISIÓN
  Se presentan 3 estrategias básicas

  para la división de datos.
 Se da por supuesto que hay n
  discos, D0, D1, …, Dn-1, entre los
  cuales se van dividir los datos.

TÉCNICA 1.- TURNO ROTATORIO
    La relación se explora en cualquier

    orden y la i-ésima tupla se envía al
    disco numerado D i mod n.
El esquema de turno rotatorio asegura

    una distribución homogénea de las
    tuplas entre los discos por ello, cada
    disco tiene aproximadamente el
    mismo número de tuplas que los
    demás.

ACCESO
 Con este esquema tanto las consultas
  concretas como las de rango son
  difíciles de procesar, dado que se
  debe emplear en la búsqueda cada
  uno de los n discos.
TÉCNICA 2.- DIVISIÓN POR

    ASOCIACIÓN

  En esta estrategia de división uno o más

  atributos del esquema de la relación se
  designan como atributos de la división.
 Se escoge una función de asociación
  cuyo rango sea [0, 1, …, n-1].
 Cada tupla de la relación original se
  asocia en términos de los atributos de la
  división.
 Si la función de asociación devuelve i, la
  tupla se ubica en el disco Di.
ACCESO

    Este esquema se adapta mejor a las consultas

    concretas basadas en el atributo de división.
    Dirigir la consulta a un solo disco ahorra el costo de

    iniciar una consulta en varios discos.
    Si la función de asociación es una buena función

    aleatoria y los atributos de división forman una clave de
    la relación, el número de tuplas en cada uno de los
    discos será aproximadamente el mismo.
    El esquema, sin embargo, no se adapta bien a las

    búsquedas concretas en términos de atributos que no
    sean de división.
    Por lo tanto, hace falta explorar todos los discos para

    responder a las consultas por rango.

TÉCNICA 3.- DIVISIÓN POR RANGOS
Factores negativos de Paralelismo

Estos pueden atenuar tanto la ganancia
  de velocidad como la ampliabilidad:
 Costes de inicio. El inicio de un único
  proceso lleva asociado un coste de
  inicio.
 Interferencia. Como los procesos que
  se ejecutan en un sistema paralelo
  acceden confrecuencia a recursos
  compartidos, pueden sufrir un cierto
  retardo como consecuencia de la
  esta.
Sesgo. Al dividir cada tarea en un

  cierto número de pasos paralelos se
  reduce el tamaño del paso medio.
  Normalmente es difícil dividir una
  tarea en partes exactamente
  iguales, entonces se dice que la forma
  de distribución de los tamaños es
  sesgada.
 El sesgo se transforma en un
  problema creciente al aumentar el
  grado de paralelismo.
.._____!____.. GRACIAS   !!

Más contenido relacionado

La actualidad más candente

MEMORIA VIRTUAL
MEMORIA VIRTUALMEMORIA VIRTUAL
MEMORIA VIRTUAL
andresinf
 
Arquitectura Multiprocesadores
Arquitectura Multiprocesadores Arquitectura Multiprocesadores
Arquitectura Multiprocesadores
JUANR1022
 
Modelo e r
Modelo e rModelo e r
Modelo e r
garci17
 
Uml lenguaje unificado de modelado
Uml lenguaje unificado de modeladoUml lenguaje unificado de modelado
Uml lenguaje unificado de modelado
Marvin Zumbado
 
Capitulo 8 la tabla de enrutamiento
Capitulo 8 la tabla de enrutamientoCapitulo 8 la tabla de enrutamiento
Capitulo 8 la tabla de enrutamiento
TeleredUSM
 

La actualidad más candente (20)

5. Ejercicios normalización
5. Ejercicios normalización5. Ejercicios normalización
5. Ejercicios normalización
 
MODELO OSI PDU
MODELO OSI PDUMODELO OSI PDU
MODELO OSI PDU
 
control de concurrencia
control de concurrenciacontrol de concurrencia
control de concurrencia
 
Segmentacion de memoria
Segmentacion de memoriaSegmentacion de memoria
Segmentacion de memoria
 
Comparación de Sistemas operativos
Comparación de  Sistemas operativosComparación de  Sistemas operativos
Comparación de Sistemas operativos
 
Middleware en los sistemas distribuidos
Middleware en los sistemas distribuidosMiddleware en los sistemas distribuidos
Middleware en los sistemas distribuidos
 
MEMORIA VIRTUAL
MEMORIA VIRTUALMEMORIA VIRTUAL
MEMORIA VIRTUAL
 
Arquitectura Multiprocesadores
Arquitectura Multiprocesadores Arquitectura Multiprocesadores
Arquitectura Multiprocesadores
 
CUESTIONARIO SISTEMA OPERATIVO
CUESTIONARIO SISTEMA OPERATIVOCUESTIONARIO SISTEMA OPERATIVO
CUESTIONARIO SISTEMA OPERATIVO
 
Modelo e r
Modelo e rModelo e r
Modelo e r
 
Consideraciones para elegir un buen DBMS
Consideraciones para elegir un buen DBMSConsideraciones para elegir un buen DBMS
Consideraciones para elegir un buen DBMS
 
Uml lenguaje unificado de modelado
Uml lenguaje unificado de modeladoUml lenguaje unificado de modelado
Uml lenguaje unificado de modelado
 
Programación 3: Grafos, representación y operaciones
Programación 3: Grafos, representación y operacionesProgramación 3: Grafos, representación y operaciones
Programación 3: Grafos, representación y operaciones
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 
Transacciones
TransaccionesTransacciones
Transacciones
 
Normalización de Base de Datos
Normalización de Base de DatosNormalización de Base de Datos
Normalización de Base de Datos
 
Bases de datos distribuidas heterogéneas
Bases de datos distribuidas heterogéneasBases de datos distribuidas heterogéneas
Bases de datos distribuidas heterogéneas
 
Estándares para el Modelado de Procesos de Negocios
Estándares para el Modelado de Procesos de NegociosEstándares para el Modelado de Procesos de Negocios
Estándares para el Modelado de Procesos de Negocios
 
Interrupciones
InterrupcionesInterrupciones
Interrupciones
 
Capitulo 8 la tabla de enrutamiento
Capitulo 8 la tabla de enrutamientoCapitulo 8 la tabla de enrutamiento
Capitulo 8 la tabla de enrutamiento
 

Similar a Bases De Datos Paralelas

Herramientas del sistema
Herramientas del sistemaHerramientas del sistema
Herramientas del sistema
mimecita
 
Arquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datosArquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datos
negriz
 
EvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De BaseEvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De Base
Freddy Banguero
 
Arquitecturas de bd
Arquitecturas de bdArquitecturas de bd
Arquitecturas de bd
Luis Jherry
 

Similar a Bases De Datos Paralelas (20)

Topicos de adm modificado
Topicos de adm modificadoTopicos de adm modificado
Topicos de adm modificado
 
Topicos de adm
Topicos de admTopicos de adm
Topicos de adm
 
Arquitectura centralizada
Arquitectura centralizadaArquitectura centralizada
Arquitectura centralizada
 
Herramientas del sistema
Herramientas del sistemaHerramientas del sistema
Herramientas del sistema
 
Arquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datosArquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datos
 
Arquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptxArquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptx
 
Tipos_Arquitecturas_de_Base_de_Datos.pptx
Tipos_Arquitecturas_de_Base_de_Datos.pptxTipos_Arquitecturas_de_Base_de_Datos.pptx
Tipos_Arquitecturas_de_Base_de_Datos.pptx
 
EvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De BaseEvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De Base
 
Desnormalización
DesnormalizaciónDesnormalización
Desnormalización
 
Base expo
Base expoBase expo
Base expo
 
Comparacion smdb
Comparacion smdbComparacion smdb
Comparacion smdb
 
Unidad 1 equipo 4
Unidad 1 equipo 4Unidad 1 equipo 4
Unidad 1 equipo 4
 
Alta Disponibilidad con PostgreSQL
Alta Disponibilidad con PostgreSQLAlta Disponibilidad con PostgreSQL
Alta Disponibilidad con PostgreSQL
 
Carbura tusql sesion1_slideshare
Carbura tusql sesion1_slideshareCarbura tusql sesion1_slideshare
Carbura tusql sesion1_slideshare
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
Taller 2
Taller 2Taller 2
Taller 2
 
Business Intelligence en Azure
Business Intelligence en AzureBusiness Intelligence en Azure
Business Intelligence en Azure
 
Arquitecturas de bd
Arquitecturas de bdArquitecturas de bd
Arquitecturas de bd
 
Carbura tusql sesion2_slideshare
Carbura tusql sesion2_slideshareCarbura tusql sesion2_slideshare
Carbura tusql sesion2_slideshare
 
administracion de memoria y archivos
administracion de memoria y archivosadministracion de memoria y archivos
administracion de memoria y archivos
 

Último

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Último (15)

PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
presentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxpresentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Presentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilPresentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmeril
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 

Bases De Datos Paralelas

  • 1. BASES DE DATOS PARALELAS CARLOS FELIPE FAJARDO PINEDA
  • 2. Un sistema de gestión de bases de  datos, consiste en una colección de datos interrelacionados y un conjunto de programas que permiten a los usuarios acceder y modificar dichos datos. La colección de datos se denomina base de datos. La arquitectura de un sistema de base de datos  está influenciada en gran medida por el sistema informático subyacente en el que se ejecuta el sistema de base de datos. En la arquitectura de un sistema de base de datos se reflejan aspectos como la conexión en red: • Base de datos Distribuidas • Base de datos Paralelas
  • 3. SGBD paralelo: Un SGBD que se ejecuta sobre múltiples procesadores y discos que han sido diseñados para ejecutar operaciones en paralelo, cuando sea posible, con el propósito de mejorar el rendimiento. Los sistemas paralelos mejoran la velocidad  de procesamiento y de E/S mediante la utilización de UCP y discos en paralelo . Los sistemas paralelos de base de datos  constan de varios procesadores y varios discos conectados a través de una red de interconexión de alta velocidad. Para medir el rendimiento de los sistemas de base de datos existen 2 medidas principales:
  • 4. 1. La productividad que se entiende como el  número de tareas que pueden completarse en un intervalo de tiempo determinado. 2. El tiempo de respuesta que es la cantidad  de tiempo que necesita para completar una única tarea a partir del momento en que se envíe. Un sistema que procese un gran número de pequeñas transacciones puede mejorar su productividad realizando muchas transacciones en paralelo. Un sistema que procese transacciones más largas puede mejorar tanto su productividad como sus tiempos de respuesta realizando en paralelo cada una de las subtareas de cada transacción.
  • 5. El objetivo del paralelismo en los  sistemas de bases de datos suele ser asegurar que la ejecución del sistema continuará realizándose a una velocidad aceptable, incluso en el caso de que aumente el tamaño de la base de datos o el número de transacciones (ampliabilidad).
  • 6. Porque la necesidad de usar Bd Paralelas ?? Actualmente los Sistemas Paralelos se están comercializando con éxito por prácticamente todos los fabricantes de BD. Tal cambio lo han impulsado las siguientes tendencias:  Los requisitos transaccionales de las empresas han aumentado, con el uso creciente de las computadoras.  El crecimiento de la WWW y los datos recogidos por los visitantes han producido BD extremadamente grandes en muchas empresas.  Las empresas utilizan volúmenes crecientes de datos para planificar sus actividades y sus tarifas.
  • 7. ◦ Las consultas utilizadas para estos fines se denominan consultas de Ayuda a la Toma de Decisiones y las necesidades de datos para las mismas pueden llegar a los terabytes. ◦ Los sistemas con un único procesador no son capaces de tratar volúmenes de datos tan grandes a la velocidad necesaria. ◦ La naturaleza orientada a conjuntos de las consultas de BD se presta de manera natural a la paralelización. ◦ Varios sistemas comerciales y de investigación han demostrado la potencia y dimensionalidad del procesamiento paralelo de consultas. ◦ Con el abaratamiento de los microprocesadores, las máquinas paralelas se han vuelto comunes y relativamente baratas. ◦ El paralelismo también se utiliza para proporcionar ampliabilidad, y las cargas de trabajo crecientes se tratan sin aumentar el tiempo de respuesta mediante un aumento en el grado de paralelismo.
  • 8. Modelos de Arquitectura  Memoria compartida. Todos los  procesadores comparten una memoria común.  Disco compartido. Todos los procesadores comparten un disco común.  Sin compartimiento. Los procesadores no comparten ni memoria ni disco.  Jerárquico. Es un híbrido de las anteriores.
  • 10. TÉCNICAS DE DIVISIÓN Se presentan 3 estrategias básicas  para la división de datos.  Se da por supuesto que hay n discos, D0, D1, …, Dn-1, entre los cuales se van dividir los datos. TÉCNICA 1.- TURNO ROTATORIO La relación se explora en cualquier  orden y la i-ésima tupla se envía al disco numerado D i mod n.
  • 11. El esquema de turno rotatorio asegura  una distribución homogénea de las tuplas entre los discos por ello, cada disco tiene aproximadamente el mismo número de tuplas que los demás. ACCESO  Con este esquema tanto las consultas concretas como las de rango son difíciles de procesar, dado que se debe emplear en la búsqueda cada uno de los n discos.
  • 12. TÉCNICA 2.- DIVISIÓN POR  ASOCIACIÓN En esta estrategia de división uno o más  atributos del esquema de la relación se designan como atributos de la división.  Se escoge una función de asociación cuyo rango sea [0, 1, …, n-1].  Cada tupla de la relación original se asocia en términos de los atributos de la división.  Si la función de asociación devuelve i, la tupla se ubica en el disco Di.
  • 13. ACCESO Este esquema se adapta mejor a las consultas  concretas basadas en el atributo de división. Dirigir la consulta a un solo disco ahorra el costo de  iniciar una consulta en varios discos. Si la función de asociación es una buena función  aleatoria y los atributos de división forman una clave de la relación, el número de tuplas en cada uno de los discos será aproximadamente el mismo. El esquema, sin embargo, no se adapta bien a las  búsquedas concretas en términos de atributos que no sean de división. Por lo tanto, hace falta explorar todos los discos para  responder a las consultas por rango. TÉCNICA 3.- DIVISIÓN POR RANGOS
  • 14. Factores negativos de Paralelismo Estos pueden atenuar tanto la ganancia de velocidad como la ampliabilidad:  Costes de inicio. El inicio de un único proceso lleva asociado un coste de inicio.  Interferencia. Como los procesos que se ejecutan en un sistema paralelo acceden confrecuencia a recursos compartidos, pueden sufrir un cierto retardo como consecuencia de la esta.
  • 15. Sesgo. Al dividir cada tarea en un  cierto número de pasos paralelos se reduce el tamaño del paso medio. Normalmente es difícil dividir una tarea en partes exactamente iguales, entonces se dice que la forma de distribución de los tamaños es sesgada.  El sesgo se transforma en un problema creciente al aumentar el grado de paralelismo.