Proyecto Fin de Carrera:
« Estudio de la diversidad de poblaciones de romero (Rosmarinus sp.) de la Península Ibérica mediante RAPDs »
Departamento de Biología Vegetal de la ETSIA-UPM.
Directoras: Dña. Mª Carmen Martín Fernández y Dña. Elena González Benito.
«Estudio de la diversidad de poblaciones de romero (Rosmarinus sp.) de la Península Ibérica mediante RAPDs»
1. UNIVERSIDAD POLITÉCNICA DE MADRIDUNIVERSIDAD POLITÉCNICA DE MADRID
Álvaro Aguado – Muñoz OlmedillaÁlvaro Aguado – Muñoz Olmedilla
Madrid - 2007Madrid - 2007
1 / 29
ESCUELA TÉCNICA SUPERIOR DE INGENIEROS AGRÓNOMOSESCUELA TÉCNICA SUPERIOR DE INGENIEROS AGRÓNOMOS
3. RomeroRomero:: pertenece al género Rosmarinus, de la familia de las Labiadas.
Distribución geográficaDistribución geográfica:: preferente en el área mediterránea.
ImportanciaImportancia:: planta aromática que debido a sus
componentes químicos tiene aplicaciones industriales
(alimentación, perfumería…) y farmacológicas.
Distribución del género Rosmarinus sp.
3 / 29
4. Rosmarinus es un género poco estudiado en cuanto a su distribución y diversidad genética.
El estudio de la estructura genética de las poblaciones interesa para plantear una adecuada
conservación de los recursos fitogenéticos.
Este trabajo se centra en Rosmarinus officinalis y Rosmarinus eriocalyx, se ha realizado en el marco
del proyecto ‘Recolección, conservación y caracterización de germoplasma de poblaciones de varias
especies de los géneros Rosmarinus y Origanum’ (INIA).
Rosmarinus officinalis L. Rosmarinus eriocalyx Jourdan & Fourr.
4 / 29
6. InterésInterés
Caracterización de la diversidad genética existente entre las poblaciones silvestres de romero de
España muestreadas y conservadas en el Banco de Semillas1
de la Universidad Politécnica de Madrid
(UPM).
1
Departamento de Biología Vegetal (ETSIA)
Rosmarinus officinalis L.
Rosmarinus eriocalyx Jordan & Fourr.
6 / 29
7. ObjetivosObjetivos
* Aplicación de marcadores moleculares tipo RAPD (Random Amplified Polymorphic DNA)
en la caracterización de poblaciones de romero.
* Estudiar la diversidad interpoblacional detectada por los marcadores empleados.
* Estimación del efecto que algunos factores geográficos y ambientales pudieran ejercer en la
diversidad genética de las poblaciones estudiadas en base a los marcadores moleculares utilizados.
7 / 29
8. Material vegetalMaterial vegetal
* Poblaciones estudiadas
* Recolección y conservación del
material
Extracción de ADNExtracción de ADN
* Protocolo de extracción
Amplificación de ADN (RAPDs)Amplificación de ADN (RAPDs)
Separación de los productosSeparación de los productos
de amplificación por electroforesisde amplificación por electroforesis
Análisis estadísticosAnálisis estadísticos
8 / 29
9. Nº Ref. Especie Término Provincia
R01-00 R. officinalis Turre Almería
R04-00 R. officinalis Valdeconcha Guadalajara
R05-00 R. officinalis Argamasilla de Alba Ciudad Real
R06-00 R. officinalis Alcaraz Albacete
R07-00 R. officinalis Villena Alicante
R08-00 R. officinalis Algimia de Almoacid Castellón
R09-00 R. officinalis S.M.de Virgen del Moncayo Zaragoza
R10-00 R. officinalis Loporzano Huesca
R11-00 R. officinalis Leciñena Zaragoza
R12-00 R. officinalis Soto del Real Madrid
R15-01 R. officinalis Torrejón el Rubio Cáceres
R19-01 R. eriocalyx Tabernas Almería
R21-01 R. officinalis Conil de la Frontera / Chiclana Cádiz
Poblaciones estudiadasPoblaciones estudiadas
Material vegetalMaterial vegetal
9 / 29
10. Nº Provincia biogeográfica Población
I Pirenaica R10
IV Aragonesa R11
V Catalana – Valenciano – Provenzal R07, R08
VII Castellano – Mestrazgo – Manchega R04, R05
VIII Murciano – Almeriense R01, R19
IX Carpetano – Ibérico – Leonesa R09, R12
X Luso – Extremadurense R15
XI Gaditano – Onubo – Algarviense R21
XII Bética R06
Poblaciones estudiadasPoblaciones estudiadas
Material vegetalMaterial vegetal
Provincias biogeográficas (Rivas – Martínez, 1987)
10 / 29
11. Recolección y conservación del materialRecolección y conservación del material
De cada población se tomaron muestras de hoja de 6 individuos.
Estas muestras fueron limpiadas y conservadas a -80ºC.
Material vegetalMaterial vegetal
Protocolo de extracción de ADNProtocolo de extracción de ADN
Método de extracción Gawel & Jarret (1991) modificado.
2 muestras de ADN (mezclas de 3 individuos) / población
Extracción de ADNExtracción de ADN
IndividuosIndividuos
1 2 31 2 3
M1M1
IndividuosIndividuos
1 2 31 2 3
M1M1
IndividuosIndividuos
4 5 64 5 6
M2M2
IndividuosIndividuos
4 5 64 5 6
M2M2
6 individuos / población6 individuos / población6 individuos / población6 individuos / población
11 / 29
12. Inicial: 13 primers → Final: 5 primers (OPF_13, OPO_07, OPO_10, OPO_15, OPO_20)
Protocolo de amplificación mediante PCR (Protocolo de amplificación mediante PCR (Polymerase Chain ReactionPolymerase Chain Reaction))
Num. ciclos Temperatura Tiempo
1 ciclo 94 o
C 1 min.
35 ciclos 92 o
C 45 s.
37 o
C 1 min.
72 o
C 2 min.
1 ciclo 72 o
C 3 min.
Amplificación de ADN (RAPDs)Amplificación de ADN (RAPDs)
12 / 29
13. ElectroforesisElectroforesis
- electroforesis en gel de agarosa al 1,5% en 1 x TBE ( Tris – ácido bórico - EDTA )
Tinción y adquisición de imágenesTinción y adquisición de imágenes
Tinción: inmersión en bromuro de etidio (0,5 μg·ml-1
) + lavado en agua
Visualización y fotografía bajo luz ultravioleta con cámara digital y fotos instantáneas impresas.
Separación de los productos de amplificación por electroforesisSeparación de los productos de amplificación por electroforesis
13 / 29
14. - Matrices de similitud (índices Jaccard y Dice)
[NTSYS]
- Análisis de agrupamiento método UPGMA1
y representación gráfica método SHAN2
(dendrograma)
[NTSYS]
- Diagrama de coordenadas principales
[NTSYS]
- Correlaciones entre distancias genéticas, geográficas y ambientales (Test de Mantel)
[NTSYS]
- Cálculo de la diversidad genética según Nei (1973)
[PopGene]
- Análisis de la varianza molecular (AMOVA)
[WinAmova]
1
Unweighted Pair Group Method with Arithmetic Mean
2
Sequential Agglomerative Hierarchical Nested Cluster Analysis
Análisis estadísticoAnálisis estadístico
14 / 29
15. Caracterización deCaracterización de
las poblaciones de romerolas poblaciones de romero
Análisis de agrupamientoAnálisis de agrupamiento
Distancias genéticasDistancias genéticas
Correlaciones entre distanciasCorrelaciones entre distancias
genéticas, geográficas y ambientalesgenéticas, geográficas y ambientales
* distancia geográfica vs genética
* distancia ambiental vs genética
Diversidad genéticaDiversidad genética
* Nei (1973)
* Análisis de varianza molecular
(AMOVA)
15 / 29
16. Imágenes de los geles:OPF_13 OPO_07OPF_13 OPO_07 OPO_10 OPO_15 OPO_20OPO_10 OPO_15 OPO_20
OPF-13 (03.05.06)
OPF-10 (10.05.04)
OPF-15 (11.05.06)
OPF-20 (01.03.02)
Caracterización de las poblaciones de romeroCaracterización de las poblaciones de romero
OPF-07 (11.05.06)
16 / 29
17. PRIMER
BANDAS AMPLIFICADAS
% POLIMORFISMO Tamaño de bandas (pb)
TOTAL P M
OPF – 13 7 2 5 28,57 650 – 1800
OPO – 07 13 8 5 61,53 325 – 1300
OPO – 10 9 3 6 50,00 600 – 2300
OPO – 15 7 5 2 71,42 800 – 2000
OPO – 20 15 15 0 100,00 450 – 2000
TOTAL de bandas encontradas 5151 33 18 64,7064,70
Técnica molecular: RAPDs (Random Amplified Polymorphic DNA)
Muestras analizadas: 24 (pools de 3 individuos) de 13 poblaciones
* poblaciones R07 y R19 sólo cuentan con una muestra
Los resultados constituyen una primera aproximación a la estimación de la diversidad existenteLos resultados constituyen una primera aproximación a la estimación de la diversidad existente
entre poblacionesentre poblaciones
>>>> número de primers bajonúmero de primers bajo
>>>> tipología de las muestras manejadas (tipología de las muestras manejadas (poolspools))
Caracterización de las poblaciones de romeroCaracterización de las poblaciones de romero
17 / 29
18. Dendrograma (método UPGMA - índice de JACCARD) de las muestras de cada población.
Grupo AGrupo AGrupo AGrupo A
Grupo BGrupo BGrupo BGrupo B
Grupo CGrupo CGrupo CGrupo C
Análisis de agrupamientoAnálisis de agrupamiento
Ajuste de dendrogramas:Ajuste de dendrogramas:
Jaccard 0,75396 (p < 0,05)
Población R19 (Rosmarinus eriocalyx):
¿ error de determinación o híbrido ?
18 / 29
19. Diagrama de coordenadas principales – Vista 2D de las muestras de cada población de romero.
Vista 2D.-Vista 2D.-
Distribución semejante al dendrograma (alguna variación)
Gran dispersión de las muestras, sin constitución de subgrupos definidos.
Análisis de agrupamientoAnálisis de agrupamiento
19 / 29
Grupo B
Grupo A
Grupo C
20. Provincias biogeográficas (Rivas – Martínez, 1987)
Nº Provincia biogeográfica Población
I Pirenaica R10
IV Aragonesa R11
V Catalana – Valenciano – Provenzal R07, R08
VII Castellano – Mestrazgo – Manchega R04, R05
VIII Murciano – Almeriense R01, R19
IX Carpetano – Ibérico – Leonesa R09, R12
X Luso – Extremadurense R15
XI Gaditano – Onubo – Algarviense R21
XII Bética R06
Análisis de agrupamientoAnálisis de agrupamiento
Dendrograma basado en la distancia genética de Nei
(1978): método UPGMA, índice de JACCARD [PopGene]
20 / 29
21. DistanciasDistancias
geográficas vs. genéticasgeográficas vs. genéticas
Cálculo de matriz de distancias geográficasmatriz de distancias geográficas
Correlación 0,22110,2211 (p = 0,074)
No parece existir una relación clara entre las distancias geográficas y las diferenciasNo parece existir una relación clara entre las distancias geográficas y las diferencias
genéticas encontradas en las poblacionesgenéticas encontradas en las poblaciones
Correlaciones entre distancias genéticas, geográficas y ambientalesCorrelaciones entre distancias genéticas, geográficas y ambientales
21 / 29
22. DistanciasDistancias
ambientales vs. genéticasambientales vs. genéticas
Cálculo de matrices de distancias ambientalesmatrices de distancias ambientales
(total y parciales: altitud, temperatura y precipitación)
No parece existir una relación clara entre los parámetros ambientales considerados y lasNo parece existir una relación clara entre los parámetros ambientales considerados y las
diferencias genéticas encontradas en las poblaciones.diferencias genéticas encontradas en las poblaciones.
>>>> especie con amplia distribución geográficaespecie con amplia distribución geográfica →→ especie con una alta adaptación a un amplioespecie con una alta adaptación a un amplio
rango de condiciones ambientales.rango de condiciones ambientales.
Comparación entre matrices Correlación (r) Pvalue
d.ambiental total – d.genéticas - 0,00039 0,9990 > 0,05
d.amb_altitud – d.genéticas 0,02182 0,8412 > 0,05
d.amb_temperatura – d.genéticas - 0,18577 0,1138 > 0,05
d.amb_precipitación – d.genéticas 0,00321 0,9610 > 0,05
Correlaciones entre distancias genéticas, geográficas y ambientalesCorrelaciones entre distancias genéticas, geográficas y ambientales
22 / 29
23. Nei (1973)Nei (1973)
para el total de poblacionespara el total de poblaciones
Bandas totales (M+P) (h) 0,20090,2009
Bandas polimórficas (P) (hp) 0,31050,3105
por provincias biogeográficaspor provincias biogeográficas
Bandas totales (M+P) (h) 0,0081 – 0,14290,0081 – 0,1429
Bandas polimórficas (P) (hp) 0,0126 – 0,22080,0126 – 0,2208
Provincias biogeográficasProvincias biogeográficas PoblacionesPoblaciones
Bandas totales (h)Bandas totales (h) Bandas polimórficas (hBandas polimórficas (hpp))
MediaMedia d.e.d.e. MediaMedia d.e.d.e.
prov I [Pirenaica] R10 0,0975 0,1775 0,1506 0,2023
prov IV [Aragonesa]prov IV [Aragonesa] R11R11 0,0081 0,0580 0,0126 0,0721
prov V [Catalana – Valenciano - Provenzal] R07 R08 0,1058 0,1875 0,1635 0,2126
prov VII [Castellano – Mestrazgo - Manchega] R04 R05 0,0913 0,1661 0,1411 0,1893
prov VIII [Murciano - Almeriense] R1 R19 0,1016 0,1788 0,1570 0,2024
prov IX [Carpetano – Ibérico - Leonesa]prov IX [Carpetano – Ibérico - Leonesa] R09 R12R09 R12 0,1429 0,2125 0,2208 0,2298
prov X [Luso - Extremadurense] R15 0,0244 0,0984 0,0377 0,1209
prov XI [Gaditano – Onubo - Algarviense] R21R21 0,0081 0,0580 0,0126 0,0721
prov XII [Bética] R06 0,0569 0,1440 0,0879 0,1720
Diversidad genéticaDiversidad genética
23 / 29
25. Análisis de varianza molecular (AMOVA)Análisis de varianza molecular (AMOVA)
Componente variaciónComponente variación % total de la variación% total de la variación
ANÁLISIS GLOBALANÁLISIS GLOBAL
Variación entre grupos V (A): 1,03688679250 12,59 %
Variación entre poblaciones dentro de grupos V (B): 3,1261363620 37,96 %
Variación dentro de poblaciones V (C): 4,0727272720 49,45 %
ANÁLISIS DE PROVINCIASANÁLISIS DE PROVINCIAS
Variación entre provinciasVariación entre provincias V (A):V (A): 3,23289550070 39,10 %39,10 %
Variación dentro de provinciasVariación dentro de provincias V (B):V (B): 5,03461538460 60,90 %60,90 %
ANÁLISIS DE POBLACIONESANÁLISIS DE POBLACIONES
Variación entre poblaciones V (A): 4,12531818180 50,32 %
Variación dentro de poblaciones V (B): 4,07272727270 49,68 %
Resultado del AMOVA de poblaciones de romero a distintos niveles.
Diversidad genéticaDiversidad genética
25 / 29
27. (1) Establecimiento de metodología para uso de RAPDs para estudio de diversidad genética
presente en poblaciones de Rosmarinus officinalis L.
(2) Los marcadores RAPDs han permitido establecer la singularidad de las poblaciones de las que
proceden las muestras de semillas conservadas en el Banco de Germoplasma de la UPM.
(3) El tipo de muestra (mezcla de individuos) permite analizar un mayor número de poblaciones
al mismo tiempo sin que cada población quede reducida a un único genotipo.
(4) Elevada diversidad entre las poblaciones y también, en la mayoría de los casos, entre las
muestras de romero de una misma población.
(5) Pese a las diferencias interpoblacionales encontradas, estos resultados deben ser
considerados como preliminares.
27 / 29
28. (6) La falta de correlación entre la matriz de distancias genéticas y las matrices de distancias
geográficas y ambientales refuerza la hipótesis de la ausencia de diferenciación entre distintas
provincias biogeográficas.
(7) Alto grado de diversidad - Alto grado de flujo génico entre las distintas poblaciones.
(8) Población R19 (Rosmarinus eriocalyx): ¿posible error en la determinación o híbrido?
(9) Importancia de la caracterización de recursos fitogenéticos destinados a procesos de
conservación..
28 / 29
Gracias. A continuación paso a exponer el trabajo fin de carrera que lleva por título ‘Estudio de la diversidad de poblaciones de romero ( Rosmarinus sp. ) de la Península Ibérica mediante RAPDs ... trabajo que ha sido desarrollado en el Departamento de Biología Vegetal de la ETSIA.
El romero es el nombre vulgar que reciben las especies pertenecientes al género Rosmarinus , dentro de la familia de las Labiadas. La distribución geográfica del romero es preferentemente toda el área mediterránea, pero su presencia destaca (como se aprecia en la imagen) sobre todo en el norte de África y en casi toda la Península Ibérica. La importancia del romero, junto con el gran número de plantas que constituyen el grupo de las plantas aromáticas, reside en sus propiedades, derivadas de su particular composición, tanto de las partes enteras (hojas y sumidades florales) como de su extracto (el aceite esencial). Dicha composición permite al romero presentar un gran abanico de aplicaciones desde su uso como condimento hasta su uso industrial (alimentación, perfumería …), pasando también por su uso farmacológico (Font Quer cita en su publicación del El Dioscórides numerosas aplicaciones).
Rosmarinus es un género poco estudiado en cuanto a su distribución y diversidad genética, en comparación con otras aromáticas (sirva de ejemplo el orégano). Sin embargo, sí ha sido estudiado en mayor medida para la caracterización de los compuestos presentes en sus aceites esenciales, debido a su alto interés por parte de la industria. El estudio de la estructura genética de las poblaciones de romero interesa para plantear una adecuada conservación de los recursos fitogenéticos. El presente trabajo se centra en las especies del género Rosmarinus , officinalis y eriocalyx ( aunque existe una tercera Rosmarinus tomentosus que es endémica de la zona sureste de la Península Ibérica en las provincias de Granada y Málaga ). Este trabajo se ha realizado en el Departamento de Biología Vegetal de esta escuela, dentro del marco del proyecto que versa sobre ‘ recolección, conservación y caracterización de germoplasma de poblaciones de especies de los géneros Rosmarinus y Origanum ’.
Como ya se acaba de indicar, la caracterización del material conservado resulta de gran valor en los diferentes ámbitos relacionados con la conservación, y de ahí, el interés de este trabajo, que ha sido la caracterización de la diversidad existente entre las poblaciones silvestres de romero de España recolectadas y conservadas en el Banco de Semillas de la Universidad Politécnica de Madrid (UPM), en el marco de proyecto indicado.
Así, los objetivos planteados en este trabajo son: * la aplicación de marcadores moleculares tipo RAPD ( Random Amplified Polymorphic DNA ) en la caracterización de poblaciones de romero; * el estudio de la diversidad interpoblacional detectada por los marcadores empleados; y * la estimación del efecto que algunos factores geográficos y ambientales pudieran ejercer en la diversidad genética de las poblaciones estudiadas en base a los marcadores moleculares utilizados.
En cuanto al Material y Métodos utilizados, hablaré del material vegetal, la extracción de ADN, la amplificación de ADN, la separación de los productos de amplificación y los análisis estadísticos realizados.
En el mapa de esta diapositiva se muestra la localización de las poblaciones objeto de estudio y en la tabla se detalla la especie, el término y la provincia correspondientes a cada uno de ellos. Estas poblaciones aparecen determinadas como Rosmarinus officinalis , excepto la población R19 de Tabernas (Almería) que según la bibliografía está determinada como Rosmarinus eriocalyx .
En esta otra diapositiva se recogen las provincias biogeográficas en que está dividida la Península Ibérica y a cuáles de ellas pertenecen las poblaciones muestreadas. Cabe indicar que 4 de las provincias (V, VII, VIII y IX) cuentan con 2 poblaciones, mientras que el resto de provincias contienen 1 población.
El material vegetal que se ha utilizado son las hojas. Así, de cada población se tomaron muestras de hoja de 6 individuos diferentes y es a partir de este material con el que se comenzó a trabajar en laboratorio, con el objeto de extraer ADN de las mismas. Las muestras tomadas fueron limpiadas y conservadas a una temperatura de -80ºC. En cuanto al protocolo de extracción de ADN se siguió el método de Gawel & Jarret (1991) ligeramente modificado. Con este método se prepararon 2 muestras de ADN por población, excepto para las poblaciones R07 (Villena) y R19 (Tabernas), que sólo se cuenta con una muestra por población. Cada una de las muestras de ADN eran mezclas de 3 individuos.
Para las amplificaciones, inicialmente se probaron 13 primers de secuencia arbitraria, de los que finalmente fueron seleccionados 5 … porque fueron los que presentaron una mayor calidad de información, en cuanto a número de bandas y nivel de polimorfismo alcanzado. Los ciclos programados para la amplificación del ADN mediante PCR figuran en la tabla que aquí se muestra.
La separación de los productos de amplificación se llevó a cabo mediante electroforesis en gel de agarosa al 1,5% en TBE. En todos los geles se incluyó un “marcador en escalera” de 100 pares de bases para determinar el tamaño de los productos de amplificación. Para la adquisición de imágenes, los geles se sometieron a tinción mediante inmersión en bromuro de etidio (a una conentración de 0,5 μg·μL-1) y un posterior lavado en agua destilada. Los geles se visualizaron y fotografiaron bajo luz ultravioleta con cámara digital y fotos Polaroid.
Los datos obtenidos en los geles fueron puestos en una matriz de datos, que refleja la presencia o ausencia de las bandas aportadas por los RAPDs. A partir de estos datos, las principales tareas acometidas en este trabajo son las que figuran en la siguiente relación: Se cálculo la matriz de similitud (mediante los índices de Jaccard y Dice). Estas matrices representan las relaciones de similitud entre muestras. Se realizó un análisis de agrupamiento mediante el método UPGMA y una posterior representación gráfica según el método SAHN. Se elaboró un diagrama de coordenadas principales , mediante el cual se buscaron resultados complementarios a las conclusiones obtenidas a partir del dendrograma. Se calcularon las correlaciones entre las distancias genéticas, geográficas y ambientales (mediante el Test de Mantel). Estos cálculos permitieron estimar el grado de influencia que los factores geográficos y ambientales pudieran ejercer sobre la diversidad genética de las poblaciones muestreadas. Por último, se calculó la diversidad genética mediante dos procedimientos: según la expresión de Nei de 1973 y a través de un análisis de varianza molecular (AMOVA). En ambos se calculó el reparto de la diversidad genética en las poblaciones muestreadas. Cada una de las tareas que he mencionado, fue realizada con alguno de los programas que figuran en la diapositiva: NTSYS, PopGene y WinAmova.
A continuación comentaré los resultados que se han obtenido, siguiendo este esquema.
En esta diapositiva se muestran algunas de las imágenes obtenidas con cada uno de los primers . En ellas se pueden apreciar el grado de información aportado por cada primer , en cuanto al número de bandas generado y la tipología de las mismas (es decir, si son mono o polimórficas).
El análisis de las amplificaciones supone la caracterización mediante RAPDs de 24 muestras de 13 poblaciones distintas. En la tabla figuran los primers utilizados, el número de bandas generadas (mono y polimórficas), porcentaje de polimorfismo alcanzado y el rango de tamaño de bandas obtenido con cada uno de ellos. El análisis de las muestras con los 5 primers seleccionados dio lugar a 51 bandas o marcadores, que permitieron identificar 33 bandas polimórficas y 18 monomórficas. En la revisión de las bandas de tipo polimórfico no se encontraron marcadores específicos de población. Los resultados mostrados en la tabla reflejan grandes diferencias en el porcentaje de polimorfismos detectados por cada uno de los primers empleados. Así, mientras en el primer OPO-20 todos los marcadores analizados resultaron ser polimórficos, en el primer OPF-13 sólo el 28,57% son polimórficos. El valor medio de marcadores polimórficos detectados , considerando conjuntamente los 5 primers empleados, resultó ser del 64,70% . Los resultados que hemos obtenido con estas poblaciones de romero pueden considerarse como una primera aproximación a la estimación de la diversidad existente entre las poblaciones muestreadas, ya que hay que tener en cuenta el limitado número de primers que finalmente se pudieron utilizar y la tipología de las muestras manejadas (mezcla de individuos).
A partir de la matriz de la matriz de datos de presencias / ausencias, se calcularon las matrices de similitud mediante los coeficientes de similitud de Jaccard y Dice. Estas matrices recogen las relaciones de similitud entre todas las muestras. Con el índice de Jaccard, la matriz de similitud obtenida presentó valores que van de 0,568 a 0,971. Debido a la tipología de las muestras, los valores de similitud entre muestras de la misma población fueron más bajos de lo esperado . Sin embargo, aunque se han obtenido valores de similitud bastante altos (entre 0,681 – población R09 [San Martín de la Virgen del Moncayo] y 0,971 – población R21 [Conil de la Fronera / Chiclana]) no son los valores más altos encontrados, ya que ha habido índices de igual valor o incluso mayor entre muestras de distintas poblaciones . Los resultados del análisis de similitud se muestran gráficamente en el dendrograma aquí expuesto, que fue obtenido mediante el método de agrupamiento UPGMA y el método gráfico SHAN. En este dendrograma se observa que el nivel de similitud mínimo es de 0,68, donde se separan las muestras de la población R09 [San Martín de la Virgen del Moncayo] del resto, mientras que el máximo (0,971) es alcanzado por las muestras de la población R11 [Leciñena]. Al nivel de similitud del 69% se separa el grupo que contiene a las muestras de la población R06 (Alcaraz) y la muestra R8.4 del resto de muestras. // El grupo que contiene las 19 muestran restantes se divide en otros 2 subgrupos al nivel 0,73 de similitud, separándose a su vez el mayor de ellos en otros 2 grupos a un nivel muy cercano al anterior (aproximadamente 0,74). ** El primer subgrupo ( grupo A ), contiene las muestras de las poblaciones R04 (Valdeconcha), R05 (Argamasilla de Alba) y R11 (Leciñena). Mientras las muestras de la población R11 se agrupan juntas, presentando entre ellas una similitud de 0,97 entre ellas (de las más altas observadas), las muestras de las poblaciones R04 y R05 no se agrupan por población y presentan subgrupos con muestras mezcladas de ambas. ** El grupo B contiene las muestras de las poblaciones R12 (Soto del Real), R15 (Torrejón el Rubio), R21 (Conil de la Frontera / Chiclana) y la muestra R19.4 (población de Tabernas). Al igual que ocurría en el grupo A, se observa que sólo una de las poblaciones que forman este grupo muestra un subgrupo formado únicamente con las muestras de la población (R21 en este caso), mientras que las muestras de las otras dos poblaciones del grupo (R12 y R15) aparecen mezcladas entre sí. ** Por último, el grupo C contiene las muestras de las poblaciones R01 (Turre), R10 (Loporzano) y las muestras R7.1 (Villena) y R8.1 (Algimia de Almoacid). Estas muestras se escinden en dos nuevos grupos: por un parte, se encuentran mezcladas las muestras R7.1, R8.1 y R10.1, y por otro las dos muestras de la población R01, agrupadas entre sí, junto con la muestra R10.4. El dendrograma obtenido a partir de la matriz de similitud usando el índice de Jaccard refleja una gran diversidad entre las muestras analizadas , tanto entre poblaciones distintas como incluso entre las muestras de una misma población , habiendo casos en que las dos muestras de una población aparecen agrupadas en grupos distintos, como es el caso de las muestras de la población R08. Sólo dos poblaciones, R11 y R21 presentan un alto grado de similitud entre sus muestras. Otro de los resultados más significativos mostrado en este dendrograma es que la muestra R19.4 (población de Tabernas) aparece agrupada en el grupo B junto con las muestras de las poblaciones R12, R15 y R21 , ya que esta población fue determinada en el momento de la recolección como Rosmarinus eriocalyx . Los resultados obtenidos de esta muestra no respaldan dicha determinación, ya que la muestra R19.4 aparece agrupada junto con muestras de R. officinalis a un nivel de similitud bastante alto . Existe la posibilidad de que la posición de esta muestra dentro del dendrograma se deba a un error en la determinación durante la recogida de la muestra o a la existencia de procesos de hibridación en esta población, sin embargo, tampoco se puede asegurar que se trate de un híbrido entre R. officinalis y R. eriocalyx ya que no se han incluido en el análisis muestras de otras poblaciones de R. eriocalyx que pudieran confirmar este hecho. Mediante la realización de un Test de Mantel (hecho con el programa NTSYS), se quiso comprobar el ajuste de los dendrogramas , comparando la matriz cofenética obtenida a partir de la matriz de similitud y esta última. Los niveles de correlación que se obtuvieron fueron de 0,75396 ( P < 0,05 ) para el indice de Jaccard. Este valor, de acuerdo con la clasificación hecha por Rohlf (2005), está incluido dentro del rango de correlaciones consideradas como pobres estadísticamente (0,7 ≤ r < 0,8), pero sí es estadísticamente significativo .
Con el objeto de contrastar y complementar la información extraída a partir de los dendrogramas de Jaccard y Dice, en lo relativo a la evaluación del grado de diferencia entre poblaciones y a su posible agrupación , se realizó un diagrama de coordenadas principales . En ambas figuras, los tres primeros ejes explican el 18,0%, 12,1% y 10,4% de la varianza total. La distribución de las muestras aportada en la vista 2D se asemeja a la obtenida en el dendrograma anterior , pero hay que reseñar que ciertas muestras o poblaciones aparecen conjuntamente con otras que antes no lo hacían. En este diagrama, las muestras de las poblaciones R09 y R21 siguen permaneciendo juntas y en menor grado lo hacen el resto de las poblaciones. A la vista de esta disposición de las muestras se observa que éstas se hallan muy dispersas, sin terminarse de constituir algún subgrupo bien definido, hasta el punto de que algunas de ellas se separan mucho una de la otra ( casos de las poblaciones R01 y R08 ). [ Todo ello refuerza los resultados obtenidos inicialmente en el dendrograma, sobre la singularidad de las muestras debido a la alta diversidad de las mismas – ¿ la singularidad ha de ser entendida como que ninguna población ha alcanzado el 100% de similitud y todas presentan coeficientes distintos, tanto las muestras de una misma población, como entre muestras de distintas poblaciones ? ].
Mediante el programa PopGene, a partir de la matriz de similitud y de acuerdo con la expresión de Nei de 1978, se calculó la matriz de distancias genéticas . A partir de ella, el mismo programa, también permitió obtener un dendrograma que aquí se muestra. Este dendrograma, ya no por muestras sino por poblaciones . Ofrece una disposición y agrupamiento bastante similar al dendrograma previo (el dendrograma está igualmente obtenido a partir de la matriz de similitud mediante el método UPGMA). En este dendrograma se mantienen separadas: la población R09 ( San Martín de la Virgen del Mocayo ) sigue apareciendo igual que en el dendrograma que se ha mostrado antes. Esta población, junto con la R12 ( Soto del Real ), pertenece a la misma provincia biogeográfica y a la cual no se agrupa . Podría tratarse de un error en la determinación de la muestra o de una población resultante de un proceso de hibridación, pero la falta de muestras de otras especies de Rosmarinus en este análisis no permite confirmarlo . las otras dos poblaciones que aún perteneciendo a la misma provincia biogeográfica ( pb VIII ) no se han agrupado son la R01 ( Turre ) y la R19. En principio no sería de esperar este agrupamiento ya que según la clasificación de partida se trata de dos poblaciones de distintas especies, sin embargo los resultados obtenidos en este análisis cuestionan este hecho. Por el otro lado, las poblaciones que se mantienen juntas son: la R07 [ Villena ] y la R08 [ Algimia de Almoacid ] , que constituyen la provincia biogeográfica V y aparecen agrupadas junto con las poblaciones R01 y R10 (ambas correspondientes a otras provincias distintas). la R04 [ Valdeconcha ] y R05 [ Argamasilla de Alba ] , que constituyen la provincia biogeográfica VII y aparecen agrupadas solas. El resultado observado en el dendrograma anteriormente proyectado confirma estos resultados. [ En ese dendrograma las 4 muestras de las poblaciones R04 y R05 se agrupaban juntas en un mismo cluster, mientras que las dos muestras de la provincia R08 aparecían en grupos muy separados entre sí. En este dendrograma por poblaciones este hecho se refleja en un menor grado de relación entre las poblaciones de la provincia V que las de la VII ]. Finalmente, también se aprecia que las relaciones genéticas más estrechas aparecen entre las poblaciones R12 ( Soto del Real ) y R15 ( Torrejón el Rubio ), que también aparecían agrupadas juntas en el dendrograma por individuos . [ Aunque ambas poblaciones pertenecen a provincias biogeográficas distintas (IX y X, respectivamente), los lugares geográficos de recogida de muestra se encuentran a una distancia de unos 300 km, lo cual puede ser considerado como una distancia relativamente pequeña si se tienen en cuenta las distancias medias de las poblaciones incluidas en este trabajo ].
* Correlación entre las distancias geográficas y genéticas La estimación de la correlación entre las distancias geográficas y genéticas, busca analizar el efecto de la distancia geográfica sobre la diversidad de las poblaciones estudiadas. Para ello, primero se calculó la matriz de distancias geográficas, a partir de la estimación lineal de las distancias geográficas sobre un mapa de la Península Ibérica. Hay que tener en cuenta que entre dichos puntos se suceden diversos accidentes geográficos (cordilleras, sierras, ríos, etc.) y ello afecta a las conclusiones que podamos sacar del análisis de su correlación con la matriz de distancias genéticas. A continuación, mediante la realización de un test de Mantel se calculó el grado de correlación presente entre la matriz de distancias genéticas y la matriz de distancias geográficas. El grado de correlación obtenido entre ambas matrices fue de 0.2211 ( P = 0,074 ) , valor que resulta no ser significativo y además bastante escaso/bajo, lo que pudiera estar justificado por los distintos accidentes geográficos, que impiden el flujo genético entre poblaciones . El hecho de que no haya una correlación entre la matriz de distancias genéticas y geográficas, junto con el alto grado de diversidad de las muestras de romero analizadas hasta el momento en este trabajo, ponen de manifiesto el alto grado de relación entre las distintas poblaciones de romero de la Península, no detectándose un proceso de aislamiento geográfico que reduzca el flujo génico . [Cuando esto ocurre, lo cual se ha detectado en diversos trabajos de análisis de estructura poblacional de especies endémicas, las cuales suelen presentar una reducida distribución geográfica, suele establecerse una alta correlación entre la matriz de distancias genéticas y geográficas como un reflejo del aislamiento geográfico de las poblaciones que conduce a una mayor diferenciación entre poblaciones (Cardoso et al., 1998; Martín et al., 1999; Martín y Hernández-Bermejo, 2000)].
* Correlaciones entre las distancias ambientales y genéticas La estimación de la correlación entre las distancias ambientales y genéticas, busca analizar el efecto que algunos factores ambientales pudieran tener relación con la diversidad de las poblaciones estudiadas. Se propusieron 3 variables a considerar : altitud, temperatura y precipitación anual. Primeramente, a partir de los datos de cada una de las variables consideradas en cada uno de los lugares de toma de muestra, se calculó la matriz de distancia ambiental conjunta (distancia euclídea ponderada para la temperatura para tener el mismo rango de datos) y las matrices de distancias ambientales parciales para cada uno de los factores. A continuación, mediante un test de Mantel se calculó el grado de correlación presente entre la matriz de distancias genéticas y cada una de las matrices ambientales calculadas. Los resultados que figuran en la tabla, son bajos para todos los casos por lo que no parece existir una relación clara entre los parámetros ambientales considerados y las diferencias genéticas encontradas en las poblaciones estudiadas en este trabajo. Hay que tener en cuenta que el grado de diversidad genética reflejada en los análisis realizados hasta el momento en estas muestras de romero es bastante alto y que se trata de una especie con una amplia distribución geográfica, capaz de adaptarse a un amplio rango de condiciones ambientales .
En este trabajo, la diversidad genética de las muestras se ha estimado mediante dos análisis: según la expresión de Nei de 1973 y el análisis de la varianza molecular (AMOVA). En ambos la diversidad genética se analizó para el total de poblaciones, por provincias biogeográficas y para cada población. Para el cálculo de la diversidad genética según Nei (1973) – se utilizó el programa PopGene. Con él se analizaron las bandas generadas por los RAPDs, por un lado las bandas totales (mono y polimórficas) y, por otro lado, las exclusivamente polimórficas. ** En el análisis de la diversidad para el total de poblaciones , encontramos que el valor medio que toman las poblaciones es de 0,2009 (d.e.: 0,1966) para las bandas totales (h), mientras que para toman un valor de 0,3105 (d.e.: 0,1590) para las bandas únicamente polimórficas (h p ). Ambos valores son bajos, aunque era esperado un valor mayor asociado a las bandas exclusivamente polimórfica y sería de esperar un valor más alto para una especie de distribución tan amplia . Sin embargo , no hay que olvidar que todos los valores de diversidad genética calculados en este trabajo se han obtenido a partir de muestras que son mezcla de varios individuos, lo cual reduce los valores de diversidad . ** Para este segundo caso , en el cálculo de la diversidad genética por provincias biogeográficas , hay que tener en cuenta es que no es lo mismo considerar provincias biogeográficas con una o con dos poblaciones, y que siempre hay sólo 2 muestras de mezcla de individuos por población. Por tanto , estos valores que se ofrecen son meramente indicativos y sirven para comparar provincias con la misma representación . Son las provincias V (Catalana – Valenciano – Provenzal) , VII (Castellano – Mestrazgo – Manchega) , VIII (Murciano – Almeriense) y IX (Carpetano – Ibérico – Leonesa) , las que cuentan con al menos dos poblaciones por provincia, pero sólo dos de éstas provincias (la VII y IX) habrán de considerarse que cuenta con 2 poblaciones, porque de las otras dos provincias (V y VIII) hubo que eliminar la poblaciones R07 y R19, respectivamente, debido a que ambas cuentan con una única muestra por población y dificultan tanto los cálculos como las conclusiones que se puedan sacar. Como se puede apreciar, los valores medios de la diversidad varían dentro del rango de 0,0081 (d .e.: 0,0580) a 0,1429 (d .e.: 0,2125) en el caso de bandas totales (h) y de 0,0126 (d .e.: 0,0721) a 0,2208 (d .e.: 0,2298) para el caso de bandas polimórficas (h p ). Por un lado , tanto en el primer caso como en el segundo, el resultado menor corresponde a la provincia XI (Gaditano – Onubo – Algarviense) que está constituida únicamente por las 2 muestras de la población R21 ( Conil de la Frontera / Chiclana ); esta población presentó en el dendrogama uno de los coeficientes de similitud más altos entre muestras. En contraposición , tanto en el primer caso como en el segundo, el resultado mayor corresponde a la provincia IX (Carpetano – Ibérico – Leonesa) que está constituida por las poblaciones R09 [ San Martín de la Virgen del Moncayo ] y R12 [ Soto del Real ].
** Para el último caso, en el análisis de la diversidad genética para cada población , como se aprecia en la tabla , los valores de las poblaciones que corresponden a provincias biogeográfica en las que sólo se ha considerado una población siguen siendo los mismos. A este nivel de estudio, no se pudo estimar ni la diversidad genética total (h), ni por bandas polimórficas (hp) de las poblaciones R07 [ Villena ] y R19 [ Tabernas ], debido a que sólo se cuenta con una muestra para tales poblaciones. Para el resto, los valores de la diversidad varían dentro del rango de 0,0081 ( d.e.: 0,0580 ) a 0,0975 ( d.e.: 0,1775 ) para el caso de bandas totales (h) y de 0,0126 (d.e.: 0,0721) a 0,1506 (d.e.: 0,2023) para el caso de bandas polimórficas (hp). Los valores más bajos son los alcanzados por las poblaciones R11 [ Leciñena ] y R21 [ Conil de la Frontera / Chiclana ], mientras que el más alto por la población R10 [ Loporzano ]. El resultado de este análisis no ha de ser considerado como representativo, debido a que el estudio por poblaciones está limitado por la condición de las muestras manejadas en este trabajo, que son mezclas de varios individuos. Por ello, los valores obtenidos son en general muy bajos. Para contar con resultados de mayor significación se habrán de realizar estudios posteriores con muestras únicas de individuos y aumentando el tamaño de muestra recogido por población .
Los resultados aportados por el AMOVA, como se aprecia en la tabla, permiten hacer un reparto de la variabilidad total detectada en los análisis de los marcadores moleculares. Ello se hizo a tres niveles distintos de análisis: global, por regiones y por poblaciones, como ya he indicado antes. Pese a que este tipo de análisis permite el reparto de la varianza en los tres niveles mencionados , la discusión de los resultados en este trabajo se ha centrado en la partición de la variación entre y dentro de regiones , ya que es el caso que mejor se ajusta al tipo de datos manejados. El reparto de la variación en este nivel de análisis muestra una variación del 39% atribuible a las diferencias entre regiones y del 61% a las encontradas dentro de las regiones . En estudios similares de especies con polinización cruzada los valores de la variación dentro de regiones suelen ser ligeramente superiores (p.e. Martín et al., 1999; Martín y Hernández Bermejo, 2000), pero en este caso hay que tener en cuenta que los valores son más bajos porque se están considerando regiones en las que realmente sólo hay una población … y las muestras son mezclas de individuos. Para poder abordar en profundidad este análisis sería necesario poder estudiar un mayor número de muestras de cada población, o al menos tener representadas todas las provincias biogeográficas con más de una población .
Como conclusiones tenemos: Se ha establecido una metodología para el uso de RAPDs para estudio de la diversidad genética presente en poblaciones de Rosmarinus officinalis L. Los marcadores RAPDs han permitido establecer la singularidad de las poblaciones de las que proceden las muestras de semillas conservadas en el Banco de Germoplasma de la UPM. El tipo de muestra (mezcla de individuos) permite analizar un mayor número de poblaciones al mismo tiempo sin que cada población quede reducida a un único genotipo. Se ha puesto de manifiesto la elevada diversidad existente entre las poblaciones y también, en la mayoría de los casos, entre las muestras de romero de una misma población. Pese a las diferencias interpoblacionales encontradas, estos resultados deben ser considerados como preliminares.
La falta de correlación entre la matriz de distancias genéticas y las matrices de distancias geográficas y ambientales refuerza la hipótesis de la ausencia de diferenciación entre distintas provincias biogeográficas. El alto grado de diversidad observada, pudiera ser debido a un alto flujo genético entre las distintas poblaciones (teniendo en cuenta que en los cálculos no se han tenido presentes los accidentes geográficos). La población R19 ( Rosmarinus eriocalyx ): ¿ posible error en la determinación o híbrido ? Con los resultados obtenidos en el dendrograma y resto de análisis, todo parece indicar que se deba a un error en al determinación durante la recogida de muestra. Por último, en este trabajo se avala la importancia de la caracterización de recursos fitogenéticos destinados a procesos de conservación.