SlideShare una empresa de Scribd logo
1 de 16
BASES DE DATOS
PARALELAS



CARLOS FELIPE FAJARDO PINEDA
Un sistema de gestión de bases de

    datos, consiste en una colección de datos
    interrelacionados y un conjunto de programas
    que permiten a los usuarios acceder y modificar
    dichos datos. La colección de datos se denomina
    base de datos.

    La arquitectura de un sistema de base de datos

    está influenciada en gran medida por el sistema
    informático subyacente en el que se ejecuta el
    sistema de base de datos. En la arquitectura de
    un sistema de base de datos se reflejan
    aspectos como la conexión en red:

    •   Base de datos Distribuidas
    •   Base de datos Paralelas
SGBD paralelo: Un SGBD que se ejecuta
    sobre múltiples procesadores y discos que
    han sido diseñados para ejecutar
    operaciones en paralelo, cuando sea posible,
    con el propósito de mejorar el rendimiento.

    Los sistemas paralelos mejoran la velocidad

    de procesamiento y de E/S mediante la
    utilización de UCP y discos en paralelo .

    Los sistemas paralelos de base de datos

    constan de varios procesadores y varios
    discos conectados a través de una red de
    interconexión de alta velocidad. Para medir el
    rendimiento de los sistemas de base de
    datos existen 2 medidas principales:
1. La productividad que se entiende como el

    número de tareas que pueden completarse
    en un intervalo de tiempo determinado.

    2. El tiempo de respuesta que es la cantidad

    de tiempo que necesita para completar una
    única tarea a partir del momento en que se
    envíe. Un sistema que procese un gran
    número de pequeñas transacciones puede
    mejorar su productividad realizando muchas
    transacciones en paralelo. Un sistema que
    procese transacciones más largas puede
    mejorar tanto su productividad como sus
    tiempos de respuesta realizando en paralelo
    cada una de las subtareas de cada
    transacción.
El objetivo del paralelismo en los

    sistemas de bases de datos suele ser
    asegurar que la ejecución del sistema
    continuará realizándose a una
    velocidad aceptable, incluso en el
    caso de que aumente el tamaño de la
    base de datos o el número de
    transacciones (ampliabilidad).
Porque la necesidad de usar Bd
Paralelas ??
Actualmente los Sistemas Paralelos se están
  comercializando con éxito por prácticamente
  todos los fabricantes de BD. Tal cambio lo
  han impulsado las siguientes tendencias:
 Los requisitos transaccionales de las
  empresas han aumentado, con el uso
  creciente de las computadoras.
 El crecimiento de la WWW y los datos
  recogidos por los visitantes han producido
  BD extremadamente grandes en muchas
  empresas.
 Las empresas utilizan volúmenes crecientes
  de datos para planificar sus actividades y sus
  tarifas.
◦ Las consultas utilizadas para estos fines se
  denominan consultas de Ayuda a la Toma de
  Decisiones y las necesidades de datos para las
  mismas pueden llegar a los terabytes.
◦ Los sistemas con un único procesador no son
  capaces de tratar volúmenes de datos tan grandes a
  la velocidad necesaria.
◦ La naturaleza orientada a conjuntos de las consultas
  de BD se presta de manera natural a la
  paralelización.
◦ Varios sistemas comerciales y de investigación han
  demostrado la potencia y dimensionalidad del
  procesamiento paralelo de consultas.
◦ Con el abaratamiento de los microprocesadores, las
  máquinas paralelas se han vuelto comunes y
  relativamente baratas.
◦ El paralelismo también se utiliza para proporcionar
  ampliabilidad, y las cargas de trabajo crecientes se
  tratan sin aumentar el tiempo de respuesta mediante
  un aumento en el grado de paralelismo.
Modelos de Arquitectura



  Memoria compartida. Todos los

  procesadores comparten una
  memoria común.
 Disco compartido. Todos los
  procesadores comparten un disco
  común.
 Sin compartimiento. Los procesadores
  no comparten ni memoria ni disco.
 Jerárquico. Es un híbrido de las
  anteriores.
Modelos de Arquitectura
TÉCNICAS DE DIVISIÓN
  Se presentan 3 estrategias básicas

  para la división de datos.
 Se da por supuesto que hay n discos,
  D0, D1, …, Dn-1, entre los cuales se
  van dividir los datos.

TÉCNICA 1.- TURNO ROTATORIO
    La relación se explora en cualquier

    orden y la i-ésima tupla se envía al
    disco numerado D i mod n.
El esquema de turno rotatorio asegura

    una distribución homogénea de las
    tuplas entre los discos por ello, cada
    disco tiene aproximadamente el
    mismo número de tuplas que los
    demás.

ACCESO
 Con este esquema tanto las consultas
  concretas como las de rango son
  difíciles de procesar, dado que se
  debe emplear en la búsqueda cada
  uno de los n discos.
TÉCNICA 2.- DIVISIÓN POR

    ASOCIACIÓN

  En esta estrategia de división uno o más

  atributos del esquema de la relación se
  designan como atributos de la división.
 Se escoge una función de asociación
  cuyo rango sea [0, 1, …, n-1].
 Cada tupla de la relación original se
  asocia en términos de los atributos de la
  división.
 Si la función de asociación devuelve i, la
  tupla se ubica en el disco Di.
ACCESO

    Este esquema se adapta mejor a las consultas

    concretas basadas en el atributo de división.
    Dirigir la consulta a un solo disco ahorra el costo de

    iniciar una consulta en varios discos.
    Si la función de asociación es una buena función

    aleatoria y los atributos de división forman una clave de
    la relación, el número de tuplas en cada uno de los
    discos será aproximadamente el mismo.
    El esquema, sin embargo, no se adapta bien a las

    búsquedas concretas en términos de atributos que no
    sean de división.
    Por lo tanto, hace falta explorar todos los discos para

    responder a las consultas por rango.

TÉCNICA 3.- DIVISIÓN POR RANGOS
Factores negativos de Paralelismo

Estos pueden atenuar tanto la ganancia
  de velocidad como la ampliabilidad:
 Costes de inicio. El inicio de un único
  proceso lleva asociado un coste de
  inicio.
 Interferencia. Como los procesos que
  se ejecutan en un sistema paralelo
  acceden confrecuencia a recursos
  compartidos, pueden sufrir un cierto
  retardo como consecuencia de la
  esta.
Sesgo. Al dividir cada tarea en un

  cierto número de pasos paralelos se
  reduce el tamaño del paso medio.
  Normalmente es difícil dividir una
  tarea en partes exactamente
  iguales, entonces se dice que la forma
  de distribución de los tamaños es
  sesgada.
 El sesgo se transforma en un
  problema creciente al aumentar el
  grado de paralelismo.
.._____!____.. GRACIAS   !!

Más contenido relacionado

La actualidad más candente

Arquitecturas de bd
Arquitecturas de bdArquitecturas de bd
Arquitecturas de bdLuis Jherry
 
EvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De BaseEvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De BaseFreddy Banguero
 
ReplicacióN Base De Datos
ReplicacióN  Base De DatosReplicacióN  Base De Datos
ReplicacióN Base De Datosluisfe
 
Bd centralizadas distribuidas
Bd centralizadas distribuidasBd centralizadas distribuidas
Bd centralizadas distribuidasJuanSaldaaRived
 
Bases de datos distribuidas y bases de datos cliente
Bases de datos distribuidas y bases de datos clienteBases de datos distribuidas y bases de datos cliente
Bases de datos distribuidas y bases de datos clienteGerardo
 
Site con presentación
Site con presentaciónSite con presentación
Site con presentaciónluis angel
 
desventajas de bdd
desventajas de bdddesventajas de bdd
desventajas de bdddavys-bonis
 
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDASUNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDASEduardo S de Loera
 
Bases Datos Distribuidas
Bases Datos DistribuidasBases Datos Distribuidas
Bases Datos DistribuidasFrancisco Godoy
 
Tecnologia Base Datos Implementacion Interna
Tecnologia Base Datos Implementacion InternaTecnologia Base Datos Implementacion Interna
Tecnologia Base Datos Implementacion InternaGuillermo Soler
 
Desventajas de las bases de datos
Desventajas de las bases de datosDesventajas de las bases de datos
Desventajas de las bases de datosxavijho
 
Desventajas de bdd
Desventajas de bddDesventajas de bdd
Desventajas de bdddavys-bonis
 
Bases de datos distribuidas
Bases de datos distribuidasBases de datos distribuidas
Bases de datos distribuidasMax Perez
 
Desventajas de las bases de datos
Desventajas de las bases de datosDesventajas de las bases de datos
Desventajas de las bases de datoslagentecachora
 
Distribución y fragmentación de datos
Distribución y fragmentación  de datosDistribución y fragmentación  de datos
Distribución y fragmentación de datosJosé Mendoza
 
Administración de la memoria virtual.
Administración de la memoria virtual.Administración de la memoria virtual.
Administración de la memoria virtual.Lely
 

La actualidad más candente (20)

Arquitecturas de bd
Arquitecturas de bdArquitecturas de bd
Arquitecturas de bd
 
EvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De BaseEvaluacióN Del Hardware Del Servidor De Base
EvaluacióN Del Hardware Del Servidor De Base
 
ReplicacióN Base De Datos
ReplicacióN  Base De DatosReplicacióN  Base De Datos
ReplicacióN Base De Datos
 
Bd centralizadas distribuidas
Bd centralizadas distribuidasBd centralizadas distribuidas
Bd centralizadas distribuidas
 
Bases de datos distribuidas y bases de datos cliente
Bases de datos distribuidas y bases de datos clienteBases de datos distribuidas y bases de datos cliente
Bases de datos distribuidas y bases de datos cliente
 
Site con presentación
Site con presentaciónSite con presentación
Site con presentación
 
desventajas de bdd
desventajas de bdddesventajas de bdd
desventajas de bdd
 
BASE DE DATOS DISTRIBUIDAS
BASE DE DATOS DISTRIBUIDASBASE DE DATOS DISTRIBUIDAS
BASE DE DATOS DISTRIBUIDAS
 
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDASUNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS
 
Bases de datos distribuidas
Bases de datos distribuidasBases de datos distribuidas
Bases de datos distribuidas
 
Bases Datos Distribuidas
Bases Datos DistribuidasBases Datos Distribuidas
Bases Datos Distribuidas
 
Tecnologia Base Datos Implementacion Interna
Tecnologia Base Datos Implementacion InternaTecnologia Base Datos Implementacion Interna
Tecnologia Base Datos Implementacion Interna
 
Bbd ddistribuidas
Bbd ddistribuidasBbd ddistribuidas
Bbd ddistribuidas
 
Desventajas de las bases de datos
Desventajas de las bases de datosDesventajas de las bases de datos
Desventajas de las bases de datos
 
Desventajas de bdd
Desventajas de bddDesventajas de bdd
Desventajas de bdd
 
Bases de datos distribuidas
Bases de datos distribuidasBases de datos distribuidas
Bases de datos distribuidas
 
Desventajas de las bases de datos
Desventajas de las bases de datosDesventajas de las bases de datos
Desventajas de las bases de datos
 
Unidad 1 equipo 4
Unidad 1 equipo 4Unidad 1 equipo 4
Unidad 1 equipo 4
 
Distribución y fragmentación de datos
Distribución y fragmentación  de datosDistribución y fragmentación  de datos
Distribución y fragmentación de datos
 
Administración de la memoria virtual.
Administración de la memoria virtual.Administración de la memoria virtual.
Administración de la memoria virtual.
 

Destacado (20)

conceptos de world 2007-2010
conceptos de world 2007-2010conceptos de world 2007-2010
conceptos de world 2007-2010
 
Temas grado 11º
Temas grado 11ºTemas grado 11º
Temas grado 11º
 
Practica 8
Practica 8Practica 8
Practica 8
 
Filatelia Temática Portugal 2010
Filatelia Temática Portugal 2010Filatelia Temática Portugal 2010
Filatelia Temática Portugal 2010
 
Slide share
Slide shareSlide share
Slide share
 
Formulario de control_accion_disciplinbaria
Formulario de control_accion_disciplinbariaFormulario de control_accion_disciplinbaria
Formulario de control_accion_disciplinbaria
 
Práctica 29
Práctica 29Práctica 29
Práctica 29
 
Practica 17
Practica 17Practica 17
Practica 17
 
Practica 8
Practica 8Practica 8
Practica 8
 
Reglamento del laboratorio de computo
Reglamento del laboratorio de computoReglamento del laboratorio de computo
Reglamento del laboratorio de computo
 
Unidad 4
Unidad 4Unidad 4
Unidad 4
 
Franz kafka
Franz kafkaFranz kafka
Franz kafka
 
Colegio nacional nicolas esguerra
Colegio nacional nicolas esguerraColegio nacional nicolas esguerra
Colegio nacional nicolas esguerra
 
Vocabulario
VocabularioVocabulario
Vocabulario
 
Practica de desempeño vanessa
Practica de desempeño vanessaPractica de desempeño vanessa
Practica de desempeño vanessa
 
Historia de flash
Historia de flashHistoria de flash
Historia de flash
 
Redes
RedesRedes
Redes
 
Presentación
PresentaciónPresentación
Presentación
 
Guion de la entrevista
Guion de la entrevistaGuion de la entrevista
Guion de la entrevista
 
Francia
FranciaFrancia
Francia
 

Similar a Bases De Datos Paralelas

Similar a Bases De Datos Paralelas (20)

Arquitectura centralizada
Arquitectura centralizadaArquitectura centralizada
Arquitectura centralizada
 
Herramientas del sistema
Herramientas del sistemaHerramientas del sistema
Herramientas del sistema
 
Arquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptxArquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptx
 
Tipos_Arquitecturas_de_Base_de_Datos.pptx
Tipos_Arquitecturas_de_Base_de_Datos.pptxTipos_Arquitecturas_de_Base_de_Datos.pptx
Tipos_Arquitecturas_de_Base_de_Datos.pptx
 
Desnormalización
DesnormalizaciónDesnormalización
Desnormalización
 
Base expo
Base expoBase expo
Base expo
 
Comparacion smdb
Comparacion smdbComparacion smdb
Comparacion smdb
 
Alta Disponibilidad con PostgreSQL
Alta Disponibilidad con PostgreSQLAlta Disponibilidad con PostgreSQL
Alta Disponibilidad con PostgreSQL
 
Business Intelligence en Azure
Business Intelligence en AzureBusiness Intelligence en Azure
Business Intelligence en Azure
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
Carbura tusql sesion1_slideshare
Carbura tusql sesion1_slideshareCarbura tusql sesion1_slideshare
Carbura tusql sesion1_slideshare
 
Taller 2
Taller 2Taller 2
Taller 2
 
Carbura tusql sesion2_slideshare
Carbura tusql sesion2_slideshareCarbura tusql sesion2_slideshare
Carbura tusql sesion2_slideshare
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
administracion de memoria y archivos
administracion de memoria y archivosadministracion de memoria y archivos
administracion de memoria y archivos
 
administración de memoria y archivos
administración de memoria y archivosadministración de memoria y archivos
administración de memoria y archivos
 
Tema 7.3
Tema 7.3Tema 7.3
Tema 7.3
 
Casos de bodegas de datos con SQL Server
Casos de bodegas de datos con SQL ServerCasos de bodegas de datos con SQL Server
Casos de bodegas de datos con SQL Server
 
Esquema de almacenamiento raid
Esquema de almacenamiento raidEsquema de almacenamiento raid
Esquema de almacenamiento raid
 
GestìóN De Memoria
GestìóN De MemoriaGestìóN De Memoria
GestìóN De Memoria
 

Último

pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 

Último (10)

pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 

Bases De Datos Paralelas

  • 1. BASES DE DATOS PARALELAS CARLOS FELIPE FAJARDO PINEDA
  • 2. Un sistema de gestión de bases de  datos, consiste en una colección de datos interrelacionados y un conjunto de programas que permiten a los usuarios acceder y modificar dichos datos. La colección de datos se denomina base de datos. La arquitectura de un sistema de base de datos  está influenciada en gran medida por el sistema informático subyacente en el que se ejecuta el sistema de base de datos. En la arquitectura de un sistema de base de datos se reflejan aspectos como la conexión en red: • Base de datos Distribuidas • Base de datos Paralelas
  • 3. SGBD paralelo: Un SGBD que se ejecuta sobre múltiples procesadores y discos que han sido diseñados para ejecutar operaciones en paralelo, cuando sea posible, con el propósito de mejorar el rendimiento. Los sistemas paralelos mejoran la velocidad  de procesamiento y de E/S mediante la utilización de UCP y discos en paralelo . Los sistemas paralelos de base de datos  constan de varios procesadores y varios discos conectados a través de una red de interconexión de alta velocidad. Para medir el rendimiento de los sistemas de base de datos existen 2 medidas principales:
  • 4. 1. La productividad que se entiende como el  número de tareas que pueden completarse en un intervalo de tiempo determinado. 2. El tiempo de respuesta que es la cantidad  de tiempo que necesita para completar una única tarea a partir del momento en que se envíe. Un sistema que procese un gran número de pequeñas transacciones puede mejorar su productividad realizando muchas transacciones en paralelo. Un sistema que procese transacciones más largas puede mejorar tanto su productividad como sus tiempos de respuesta realizando en paralelo cada una de las subtareas de cada transacción.
  • 5. El objetivo del paralelismo en los  sistemas de bases de datos suele ser asegurar que la ejecución del sistema continuará realizándose a una velocidad aceptable, incluso en el caso de que aumente el tamaño de la base de datos o el número de transacciones (ampliabilidad).
  • 6. Porque la necesidad de usar Bd Paralelas ?? Actualmente los Sistemas Paralelos se están comercializando con éxito por prácticamente todos los fabricantes de BD. Tal cambio lo han impulsado las siguientes tendencias:  Los requisitos transaccionales de las empresas han aumentado, con el uso creciente de las computadoras.  El crecimiento de la WWW y los datos recogidos por los visitantes han producido BD extremadamente grandes en muchas empresas.  Las empresas utilizan volúmenes crecientes de datos para planificar sus actividades y sus tarifas.
  • 7. ◦ Las consultas utilizadas para estos fines se denominan consultas de Ayuda a la Toma de Decisiones y las necesidades de datos para las mismas pueden llegar a los terabytes. ◦ Los sistemas con un único procesador no son capaces de tratar volúmenes de datos tan grandes a la velocidad necesaria. ◦ La naturaleza orientada a conjuntos de las consultas de BD se presta de manera natural a la paralelización. ◦ Varios sistemas comerciales y de investigación han demostrado la potencia y dimensionalidad del procesamiento paralelo de consultas. ◦ Con el abaratamiento de los microprocesadores, las máquinas paralelas se han vuelto comunes y relativamente baratas. ◦ El paralelismo también se utiliza para proporcionar ampliabilidad, y las cargas de trabajo crecientes se tratan sin aumentar el tiempo de respuesta mediante un aumento en el grado de paralelismo.
  • 8. Modelos de Arquitectura  Memoria compartida. Todos los  procesadores comparten una memoria común.  Disco compartido. Todos los procesadores comparten un disco común.  Sin compartimiento. Los procesadores no comparten ni memoria ni disco.  Jerárquico. Es un híbrido de las anteriores.
  • 10. TÉCNICAS DE DIVISIÓN Se presentan 3 estrategias básicas  para la división de datos.  Se da por supuesto que hay n discos, D0, D1, …, Dn-1, entre los cuales se van dividir los datos. TÉCNICA 1.- TURNO ROTATORIO La relación se explora en cualquier  orden y la i-ésima tupla se envía al disco numerado D i mod n.
  • 11. El esquema de turno rotatorio asegura  una distribución homogénea de las tuplas entre los discos por ello, cada disco tiene aproximadamente el mismo número de tuplas que los demás. ACCESO  Con este esquema tanto las consultas concretas como las de rango son difíciles de procesar, dado que se debe emplear en la búsqueda cada uno de los n discos.
  • 12. TÉCNICA 2.- DIVISIÓN POR  ASOCIACIÓN En esta estrategia de división uno o más  atributos del esquema de la relación se designan como atributos de la división.  Se escoge una función de asociación cuyo rango sea [0, 1, …, n-1].  Cada tupla de la relación original se asocia en términos de los atributos de la división.  Si la función de asociación devuelve i, la tupla se ubica en el disco Di.
  • 13. ACCESO Este esquema se adapta mejor a las consultas  concretas basadas en el atributo de división. Dirigir la consulta a un solo disco ahorra el costo de  iniciar una consulta en varios discos. Si la función de asociación es una buena función  aleatoria y los atributos de división forman una clave de la relación, el número de tuplas en cada uno de los discos será aproximadamente el mismo. El esquema, sin embargo, no se adapta bien a las  búsquedas concretas en términos de atributos que no sean de división. Por lo tanto, hace falta explorar todos los discos para  responder a las consultas por rango. TÉCNICA 3.- DIVISIÓN POR RANGOS
  • 14. Factores negativos de Paralelismo Estos pueden atenuar tanto la ganancia de velocidad como la ampliabilidad:  Costes de inicio. El inicio de un único proceso lleva asociado un coste de inicio.  Interferencia. Como los procesos que se ejecutan en un sistema paralelo acceden confrecuencia a recursos compartidos, pueden sufrir un cierto retardo como consecuencia de la esta.
  • 15. Sesgo. Al dividir cada tarea en un  cierto número de pasos paralelos se reduce el tamaño del paso medio. Normalmente es difícil dividir una tarea en partes exactamente iguales, entonces se dice que la forma de distribución de los tamaños es sesgada.  El sesgo se transforma en un problema creciente al aumentar el grado de paralelismo.