Los patrones de las corrientes oceánicas impulsan la colonización mundial de la hierba marina (Zostera marina)
Naturaleza Plantas (2023)Citar este artículo
1860 Accesos
93 altmétrico
Detalles de métricas
Las corrientes son impulsoras únicas de la filogeografía oceánica y, por lo tanto, determinan la distribución de las especies marinas costeras, junto con las glaciaciones pasadas y los cambios en el nivel del mar. Aquí reconstruimos la historia de la colonización mundial del pasto marino (Zostera marina L.), la planta con flores marinas o pasto marino de mayor distribución desde su origen en el Pacífico Noroccidental, basada en genomas nucleares y de cloroplastos. Identificamos dos clados divergentes del Pacífico con evidencia de mezcla a lo largo de la costa del Pacífico este. Dos eventos de colonización de oeste a este (transpacífico) respaldan el papel clave de la corriente del Pacífico Norte. Las filogenias nucleares y de cloroplastos calibradas en el tiempo arrojaron estimaciones concordantes de la llegada de Z. marina al Atlántico a través del Ártico canadiense, lo que sugiere que los ecosistemas basados en pastos marinos, puntos críticos de biodiversidad y secuestro de carbono, sólo han estado presentes allí durante ~243 ky (miles de años). años). Las poblaciones mediterráneas se fundaron hace aproximadamente 44 kya, mientras que las distribuciones existentes a lo largo de las costas del Atlántico occidental y oriental se fundaron al final del Último Máximo Glacial (~19 kya), siendo al menos un refugio importante la región de Carolina del Norte. La reciente colonización y la diversidad genómica del Atlántico entre cinco y siete veces menor en comparación con las poblaciones del Pacífico genera preocupación y oportunidades sobre cómo la hierba marina del Atlántico podría responder al rápido calentamiento de los océanos costeros.
Las praderas marinas son las únicas plantas con flores que regresaron al mar hace aproximadamente 67 millones de años. Tres linajes independientes descendieron de ancestros de agua dulce que vivieron ~ 114 millones de años (ref. 1). Las praderas marinas son especies fundamentales de ecosistemas enteros que prosperan en todas las zonas costeras poco profundas del océano mundial, excepto en la Antártida2. Con diferencia, la especie más extendida geográficamente es la hierba marina (Zostera marina), que se encuentra en las zonas del Pacífico y el Atlántico del hemisferio norte, desde ambientes templados cálidos hasta ambientes árticos3, abarcando 40° de latitud y un rango de ~18 °C en temperaturas medias anuales (Fig. .1a). El pasto anguila es una especie fundamental única en el sentido de que ningún otro pasto marino actual puede llenar su nicho ecológico en el hemisferio norte templado frío al Ártico3 (Nota complementaria 1). Al mismo tiempo, las praderas de pastos marinos proporcionan funciones críticas de vivero y servicios ecosistémicos, incluida la protección contra la erosión, el ciclo de nutrientes y un considerable secuestro de carbono4.
a, Las áreas verdes indican la presencia de Z. marina. Las ubicaciones del Ártico de Canadá se agregaron a partir de la ref. 76. La línea naranja a lo largo de la costa siberiana representa la ausencia de Z. marina según estudios superficiales de Alismatales, incluida Z. marina, realizados por colegas rusos. Estas últimas zonas se caracterizan por costas de grava, desembocaduras de ríos y aguas turbias. Los metadatos de ubicación detallados se pueden encontrar en la Tabla complementaria 1. b, Diversidad genética: diagramas de caja (mediana, percentil 25/75%, rango de bigotes dentro de 1,5 × del rango intercuartil, valores atípicos >1,5 × del rango intercuartil) de nucleótidos diversidad (π), calculada para cada uno de los seis cromosomas en base a 44,865 SNP (Figura complementaria 1). Cada punto de datos indica un cromosoma. c, Gráficos de caja de Hobs con heterocigosidad de todo el genoma individual basados en 144,773 SNP (conjunto de datos ZM_neutral_SNPs; Figura complementaria 1), como (número de sitios heterocigotos)/(número total de sitios con llamadas de genotipo). Cada punto de datos corresponde a un individuo (N = 2–14 individuos; para conocer los valores exactos, consulte los datos de origen en la figura 1). Las pruebas estadísticas para las diferencias en la media π o Hobs se dan en la Tabla complementaria 4. WN, Gales-Norte; FR, Francia mediterránea; República Checa, Croacia.
Datos fuente
Dado su amplio rango de distribución natural que excede a la mayoría de las especies de plantas terrestres, nuestro objetivo fue reconstruir las principales vías de colonización de la hierba marina a partir del origen putativo de Z. marina en el Pacífico occidental a lo largo del archipiélago japonés5,6. Las corrientes son impulsoras únicas de los procesos filogeográficos en el océano, y planteamos la hipótesis de que la corriente del Pacífico Norte, las corrientes de Alaska y California en el Pacífico, y la corriente del Labrador, la corriente del Golfo y la deriva del Atlántico Norte en el Atlántico impulsaron su colonización mundial. Al ser una planta con flores, los brotes de pasto marino que transportan semillas permanecen vivos durante semanas y se ha demostrado que pueden viajar de decenas a cientos de kilómetros, lo que proporciona un mecanismo biológico para la dispersión a larga distancia7 (Nota complementaria 1).
Uno de los principales objetivos del presente estudio fue proporcionar estimaciones temporales de los principales eventos de colonización. Preguntamos cómo la contingencia evolutiva (específicamente el momento de los eventos de dispersión a gran escala) puede haber afectado el momento de la llegada de la hierba marina a las costas del Pacífico oriental y del Atlántico norte8. Para hacerlo, aprovechamos las extensiones recientes del coalescente multiespecífico (MSC) aplicado a nivel de población9,10, lo que hizo posible construir un árbol filogenético calibrado en el tiempo a partir de datos de SNP (polimorfismo de un solo nucleótido)11. Nuestro conjunto de datos comprendía 190 individuos de 16 ubicaciones en todo el mundo que fueron sometidos a una resecuenciación integral del genoma completo (nuclear y cloroplasto).
A la colonización general hacia el este se superponen los ciclos pleistoceno de períodos glaciales e interglaciares que resultaron en frecuentes expansiones latitudinales y contracciones del hábitat disponible para la biota terrestre y marina12. Se espera que tales extinciones locales y recolonizaciones posteriores de poblaciones de refugio dejen su huella genómica en las poblaciones marinas existentes13,14,15 y puedan restringir su potencial para adaptarse rápidamente al cambio ambiental actual16,17. Por lo tanto, también estábamos interesados en cómo las glaciaciones, en particular el Último Máximo Glacial (LGM; 20 kya (hace mil años); ref. 18), han afectado la diversidad genómica de toda la población de Z. marina y qué refugios glaciales permitieron la hierba marina. para sobrevivir este período.
Entre 190 especímenes de Z. marina recolectados en 16 ubicaciones geográficas (Fig. 1a y Tabla complementaria 1), la secuenciación completa del genoma arrojó una cobertura de lectura promedio de 53,73x. Después del filtrado de calidad (Tabla de datos complementarios 1), los SNP se mapearon y denominaron (Figuras complementarias 1 y 2) en función de un ensamblaje a nivel cromosómico v.3.1 (ref. 19). Para evitar sesgos relacionados con las referencias, debido a la gran divergencia genómica entre el Pacífico y el Atlántico, y para facilitar la reconstrucción filogenética dentro de un conjunto conservado de genes20, nos centramos en los genes centrales: el conjunto de genes compartidos por la mayoría de los individuos. De un total de 21,483 genes, identificamos 18,717 genes centrales que se observaron en promedio en el 97% de las muestras y que contenían 763,580 SNP (en adelante, 'ZM_HQ_SNP'; Nota complementaria 2).
Después de la exclusión de 37 muestras debido a datos faltantes, autofecundación o clonalidad duplicada, se dejaron 153 para análisis adicionales (Tablas complementarias 2 y 3 y Figuras complementarias 3 y 4). También extrajimos dos conjuntos de datos de SNP filtrados adicionalmente: uno basado en SNP sinónimos ('ZM_neutral_SNPs', que comprende 144,773 sitios) y el otro basado en un subconjunto adicional en el que solo se retuvieron sitios con una distancia física de> 3 kbp ('ZM_Core_SNPs' , 11,705 SNP; Figuras complementarias 1 y 2; consulte Métodos para obtener más explicaciones).
Se reconstruyó un genoma de cloroplasto completo de 143.968 pb a partir de la muestra de referencia21. La cobertura media de secuenciación de cloroplastos para las muestras del conjunto de datos mundial fue de 6273x. Se detectaron un total de 151 SNP a lo largo de todo el genoma del cloroplasto, excluyendo las regiones de los genes de ARN ribosómico 23S y 16S debido a una posible contaminación en algunas muestras y llamadas ambiguas junto a las regiones de microsatélites (132,438 pb), que comprenden 54 haplotipos.
Como medidas de diversidad genética, evaluamos la diversidad de nucleótidos (π) y la heterocigosidad de todo el genoma (Hobs) (Fig. 1b, c). De acuerdo con el origen de la especie en el Pacífico (Nota complementaria 3), las ubicaciones del Pacífico mostraron una diversidad genética de 5,5 (π) a 6,6 (Hobs) veces mayor en comparación con las del Atlántico (Tabla complementaria 4). Los valores más altos de π y Hobs se observaron en Japón-Sur (JS), seguido de Japón-Norte (JN). Alaska-Izembek (ALI) y Alaska-Safety Lagoon (ASL) mostraron aproximadamente un tercio (28% para π; 34% para Hobs) de la diversidad en los sitios del Pacífico más meridional (promedio de San Diego (SD), Bodega Bay, California (BB) y el estado de Washington (WAS)). En el Atlántico se observó una pérdida comparable de diversidad a lo largo de un gradiente sur-norte. Quebec (QU) mostró el 42% (π) y el 47% (Hobs) de la diversidad de Carolina del Norte (NC) y Massachusetts (MA), mientras que los valores de diversidad en el Norte de Noruega (NN) fueron el 31% y el 43% de los valores promedio. de Suecia (SW) y Gales, respectivamente.
Para revelar la estructura genética de la población a gran escala, realizamos un análisis de componentes principales (PCA) basado en la selección de SNP más completa (Figura 1 complementaria; 782,652 SNP, Figura 2a). La diferenciación genética dentro del océano en el Pacífico fue tan grande como la división Pacífico-Atlántico, mientras que hubo mucha menos variación dentro del Atlántico. Los PCA separados para cada océano revelaron una estructura adicional (Fig. 2c, e), incluida la separación de las poblaciones del Atlántico y el Mar Mediterráneo (componente principal 1, 24,47%, Fig. 2e).
a,b, Estructura genética de la población global. a, PCA global basado en el conjunto de datos ZM_HQ_SNP (763.580 sitios); las poblaciones atlánticas y mediterráneas están colapsadas. Los océanos Pacífico y Atlántico estuvieron separados por el componente principal 1 (PC1) que explicó el 41,75% de la variación. b, análisis de ESTRUCTURA global (número de conglomerados, K = 2; basado en 2353 SNP). Cada individuo está representado por una barra vertical dividida en colores según su afiliación a un grupo genético (Métodos). c,d, Estructura genética de la población dentro del Pacífico. c, PCA dentro del Pacífico basado en 12.514 SNP. d, análisis de ESTRUCTURA dentro del Pacífico (K = 3; 6,168 SNP). e,f, Estructura genética de poblaciones para el Atlántico y el Mar Mediterráneo. e, PCA para el Atlántico y el Mar Mediterráneo basado en 8.552 SNP. f, análisis de ESTRUCTURA para el Atlántico y el Mar Mediterráneo (K = 2; 8.552 SNP). Consulte las figuras complementarias. 5-7 para obtener resultados y discusión suponiendo un mayor número de grupos y en la Fig. 1 complementaria para obtener más detalles sobre los conjuntos de SNP utilizados. g, red de haplotipos de cpDNA. Los números representan pasos de mutación >1. Los colores corresponden a la población. Los círculos de colores divididos indican que un haplotipo particular se comparte entre poblaciones; el tamaño del círculo es proporcional a la frecuencia. PC2, componente principal 2.
Luego utilizamos STRUCTURE22, un enfoque de agrupación bayesiano, en 2353 SNP (20%) seleccionados aleatoriamente de ZM_Core_SNP. El número más probable de grupos genéticos se determinó utilizando una combinación del método Delta-K23 y otras métricas introducidas por la ref. 24 (Fig. 2b, d, f), con una inspección cualitativa de valores de K adicionales generados a partir de StructureSelector25 en las Figs complementarias. 5–7. En el análisis global (Fig. 2b), se identificaron dos grupos que representan ubicaciones del Atlántico y el Pacífico. JN contenía componentes de mezcla con el Atlántico, lo que es consistente con una colonización de oeste a este a través del norte de Japón a través de la corriente del Pacífico Norte y luego al norte hacia el mar de Bering. Dada la pronunciada estructura de la población anidada (Fig. 2a), procedimos con análisis separados para el Pacífico y el Atlántico, como se recomienda en la ref. 25. Un análisis restringido a sitios del Pacífico apoyó el papel de JN como centro de dispersión, con componentes de mezcla de JS y Alaska, lo que sugiere que este sitio ha sido una puerta de entrada entre ambos lugares (Fig. 2c). En K = 3, WAS y BB, ubicados centralmente a lo largo de la costa este del Pacífico, se mezclaron entre los sitios de Alaska y SD. WAS mostró componentes norte y sur aproximadamente iguales, mientras que BB estuvo dominado por el componente genético SD sur adyacente. Curiosamente, bajo K = 4 (Figura complementaria 6), que fue respaldado por las métricas medmeak y maxmeak24, se hace evidente una conexión presumiblemente antigua entre JN y SD, mientras que con valores de K aún mayores, el patrón permanece estable para el lado del Pacífico.
En el Atlántico y el Mediterráneo (Fig. 2f), estaba presente una estructura poblacional menos pronunciada, con solo dos grupos claramente separados que representan el Mediterráneo (más Portugal (PO)) y todos los demás sitios del Océano Atlántico (tanto al este como al oeste), en consonancia con los resultados de PCA (Fig. 2e). Una exploración adicional de un grupo genético adicional reveló una conexión entre el PO más cercano al Estrecho de Gibraltar y el Atlántico este en K = 4 (NC, Figura complementaria 7, respaldada por medmeak y maxmeak). Se hace evidente una clara división entre el Atlántico occidental y oriental con grupos K = 4 y 5, de los cuales podría ser responsable el tiempo de separación desde el LGM o algunos refugios del Atlántico este no muestreados.
Una red de haplotipos (Fig. 2g) reveló tres clados marcadamente divergentes, que además estaban respaldados por valores de arranque de 98 a 100% basados en una filogenia de máxima probabilidad (Datos ampliados, Fig. 1). En el Pacífico, WAS mostró haplotipos similares a los de Alaska (ALI y ASL) y JN, mientras que BB mostró haplotipos de un clado divergente que también comprende todos los haplotipos de SD. ASL y JN comparten el mismo haplotipo dominante, lo que sugiere que JN es un centro entre el Pacífico occidental y oriental. En JS, dos haplotipos privados divergentes (separados por nueve mutaciones de otros haplotipos) sugieren una persistencia a largo plazo de pasto marino en ese lugar.
En el lado del Atlántico, sólo de cuatro a seis mutaciones separan los haplotipos del Atlántico nororiental y del Mediterráneo, lo que coincide con una separación mucho más reciente. El haplotipo central (supuestamente ancestral) es compartido tanto por MA como por NC, con nueve haplotipos NC privados. Una sola mutación separa tanto a MA como a QU, así como a MA y Wales-North. También se extendieron desde el haplotipo central SW y NN (Fig. 2g). Junto con las medidas de diversidad (Fig. 1b, c), este patrón sugiere una residencia a largo plazo de pastos marinos en la costa del Atlántico occidental y transporte al Atlántico nororiental a través de la deriva del Atlántico norte. En particular, no hubo haplotipos de ADN de cloroplasto (cpDNA) compartidos entre el Pacífico y el Atlántico, lo que sugiere que el Atlántico fue colonizado solo una vez.
Para explorar más a fondo el grado de mezcla y contacto secundario, construimos una red dividida26 utilizando todos los ZM_Core_SNP. Las poblaciones del Pacífico estaban conectadas en forma de red (Fig. 3a). WAS y BB participaron en bordes de red alternativos (Fig. 3b), ya sea agrupados con SD o con JS y JN. La topología coloca a WAS y BB en una zona de mezcla con un componente del norte de Alaska (ALI y ASL) y un componente del sur más divergente de SD, de acuerdo con los resultados de la ESTRUCTURA (Fig. 2c). Debido al modo de herencia uniparental, se esperaba que las relaciones poblacionales inferidas de los datos de cloroplastos reflejaran solo una de las dos topologías. Según estos datos, WAS se agrupa con el componente de Alaska (Fig. 2g y Fig. 6 complementaria), lo que indica una divergencia temprana de los haplotipos de ADNcp SD y BB. En el Atlántico (Fig. 3c), los bordes entre las ubicaciones eran más cortos que los del lado del Pacífico, lo que indica una divergencia más reciente entre las poblaciones del Atlántico. Una topología bifurcada conectaba las poblaciones mediterráneas más antiguas, mientras que tanto el noreste como el noroeste del Atlántico estaban conectados por bordes no resueltos en forma de red, lo que indica una mezcla de clasificación de linaje incompleta y probable flujo genético reciente.
a, Red dividida basada en el conjunto de datos ZM_Core_SNP (11,705 sitios; Figura complementaria 1). Cada rama terminal indica una muestra individual. Las divisiones coloreadas en cian son particularmente apoyadas entre un grupo de WAS, BB y SD y el resto del Pacífico. b, Señales principales en la estructura de red observada. La estructura de la red dividida indica que el conjunto de datos SNP admite historias de evolución alternativas, que son particularmente fuertes con respecto a BB, WAS y SD. La principal división representada en b está respaldada por el 56,8% de todas las divisiones. c, Red Splits reconstruida únicamente para poblaciones del Atlántico.
Utilizamos el estadístico D de Patterson27 para realizar pruebas adicionales de mezcla28 (Datos ampliados, figura 2). Para el lado del Pacífico, los pares WAS/SD, BB/ALI y BB/ASL además de JN/ALI y JN/ASL mostraron los valores D más altos junto con significancia estadística (D = 0,67; P < 0,001), lo que sugiere una mezcla sustancial. . Para el lado del Atlántico, los valores de D indicaron una conexión reciente o en curso entre el Atlántico y el Mar Mediterráneo, consistente con la señal de mezcla detectada por ESTRUCTURA (SW, Fig. 2f) y con dos haplotipos de cpDNA del Atlántico (SW) que se agrupan con los del Mediterráneo ( Figura 2g).
La aplicación del MSC11 (Fig. 4) supone que las poblaciones divergen bajo un modelo de bifurcación. Por lo tanto, se excluyeron tres ubicaciones (WAS, BB, JN) que mostraron una mezcla pronunciada (compárese con la Figura 2; Datos ampliados, Figura 2), mientras exploramos los efectos de incluir o excluir poblaciones mezcladas en la Figura complementaria 9.
Las barras azules indican períodos glaciales con etapas de isótopos marinos (MIS) que se alternan con períodos interglaciares cálidos a fríos (blanco). La intensidad del color azul representa la intensidad de las glaciaciones. El LGM (MIS2 = LGM) se representa entre 26,5 y 19 kya. Se proporcionan los tiempos de divergencia absoluta estimados de los nodos junto con intervalos de confianza del 95% (densidades posteriores más altas, barras moradas). Se excluyeron las tres poblaciones más mezcladas: WAS, BB y JN (Figs. 2 y 3). El borde naranja conecta al hipotético fundador en el área de Japón con el actual JS. Los escenarios de colonización inferidos (puntos negros numerados en los nodos) se presentan en la Fig. 6. Las estimaciones del tiempo de divergencia basadas en ASTRAL y StarBEAST2 se presentan en la Fig. 12 complementaria.
Como no hay evidencia fósil directa disponible dentro del género Zostera, el tiempo de divergencia entre Z. marina y Zostera japonica se estimó a partir de un punto de calibración que aprovecha un evento de duplicación de todo el genoma previamente identificado y fechado en ~ 67 millones de años (ref. 21). . La frecuencia de reloj resultante para transversiones degenerativas cuádruples de secuencias de genes parálogos arrojó una estimación del tiempo de divergencia de 9,86 a 12,67 millones de años entre Z. marina y Z. japonica (Nota complementaria 4). Luego repetimos el análisis basado en 13,732 sitios SNP polimórficos dentro de nuestra especie objetivo (Figura 2 complementaria) después de establecer un nuevo punto de calibración específico de Z. marina.
Suponiendo que JS sea generalmente representativo del origen de la especie5 (Nota complementaria 3), encontramos evidencia de dos eventos de dispersión transpacíficos (Fig. 4). El primer evento de dispersión transpacífico a ~352 kya (95% de la densidad posterior (HPD) más alta, 422,10–284,9 kya) fundó poblaciones cercanas a SD que permanecieron aisladas pero se mezclaron con el norte (Nota complementaria 5), como también se apoyó por estructura poblacional basada en cloroplastos. Un segundo evento de dispersión transpacífico desde JS hacia el Pacífico nororiental sembró las poblaciones de Alaska durante unos 270 kya (95% HDP, 327,50–221,8 kya), probablemente con JN como trampolín. Poco después, el Atlántico fue colonizado ~ 243 kya (95% HPD, 294,9–199,6 kya) de poblaciones en o cerca de Alaska. Esta estimación es sorprendente dado que el Estrecho de Bering se abrió hace entre 4,8 y 5,5 millones de años (ref. 29). Un apoyo adicional para que JN sea un centro de dispersión es su FST por pares más pequeño con todas las poblaciones del Atlántico (Tabla complementaria 5). Además, JN fue la única población del Pacífico que mostró un componente genético compartido con el Atlántico (Fig. 2b).
En el Atlántico, las estimaciones del tiempo de divergencia fueron mucho más recientes que en el Pacífico. El clado del Mar Mediterráneo surgió ~43,8 kya (95% HPD, 52,8–35,5 kya). Las poblaciones del Atlántico noroccidental y nororiental también divergieron entre sí muy recientemente a aproximadamente 18,8 kya (95% HPD, 22,9–15,1 kya) y compartieron un ancestro común durante el LGM, lo que indica que se derivaron parcialmente del mismo refugio glacial en el noroeste. Atlántico (probablemente en Carolina del Norte o cerca de ella). Alguna mezcla encontrada en la población SW proveniente del acervo genético mediterráneo (Fig. 2f, g) probablemente explica una mayor diversidad genética en esa ubicación (Fig. 1b, c). Algunas ejecuciones de coalescencia del conjunto de datos de población con WAS, BB y JN excluidos mostraron una topología diferente para la división JS-Alaska-Atlántico, lo que requirió la presencia de un tercer evento de colonización transpacífico anterior a la colonización del Atlántico (Figura complementaria 9a). , junto con una dispersión más reciente a Alaska. Tenga en cuenta que las estimaciones del tiempo de divergencia para todas las demás divisiones, en particular la fundación del linaje SD y la colonización del Atlántico y el Mediterráneo, fueron muy similares.
En un segundo enfoque coalescente10, utilizamos alineamientos de 617 genes centrales en todas las muestras (Nota complementaria 2). Basándose en la misma calibración inicial que en el MSC, se examinó la topología del árbol utilizando ASTRAL. A pesar de una clasificación de linaje alta e incompleta (puntuación del cuarteto normalizado ASTRAL = 0,48), el árbol de especies sigue patrones geográficos y solo 2 de 107 individuos muestran una topología incongruente basada en los sitios de recolección geográfica30 (Figura complementaria 11). La estimación posterior del tiempo de divergencia se realizó con StarBEAST2 (ref. 31). Este enfoque dio como resultado una topología consistente con la representada en la Fig. 4, mientras que las estimaciones del tiempo de divergencia para los nodos más profundos fueron aún más recientes (por ejemplo, la división Pacífico-Atlántico en 162 kya). Las estimaciones para los eventos de divergencia más recientes fueron casi idénticas (Figura complementaria 12). La topología basada en StarBEAST2 admite la topología SNAPP presentada en la Fig. 4.
Finalmente, utilizamos los pasos mutacionales entre haplotipos de cloroplastos (cpDNA) como método de datación alternativo. SD y BB a lo largo de la costa este del Pacífico mostraron haplotipos muy diferentes, separados por unas 30 mutaciones de los otros clados del Pacífico y del Atlántico. Suponiendo una tasa de mutación sinónimo de cpDNA de 2 × 10−9 por sitio por año, esta distancia genética corresponde a un tiempo de divergencia de 392 kya (Nota complementaria 6), comparable a la estimación de 352 kya en el análisis coalescente. Por el contrario, pocas mutaciones (4 a 7) distinguieron los principales haplotipos del Atlántico del Mar Mediterráneo, lo que coincide con una estimación de divergencia mucho más reciente basada en genomas nucleares (Fig. 4). La topología tenía un alto soporte de arranque en un árbol filogenético basado en máxima verosimilitud (Datos ampliados, figura 1).
Utilizamos el coalescente markoviano múltiple secuencial (MSMC) 33 para inferir el tamaño efectivo de la población anterior Ne (Fig. 5). Aquí nos centramos en los intervalos de tiempo en los que convergieron diferentes ejecuciones de réplicas por población, reconociendo que MSMC crea estimaciones poco confiables en los últimos tiempos34. Casi todas las poblaciones de pastos marinos revelaron una expansión reciente hace 1000 a 100 generaciones, mientras que la magnitud del valor mínimo de Ne (alrededor de 10 000 a 1000 generaciones) varió. Dado un rango de tiempos de generación plausibles bajo una combinación de reproducción clonal y sexual, es probable que un mínimo de Ne mostrado en varias ubicaciones coincida con el LGM, que a su vez puede usarse para estimar el tiempo de generación a largo plazo. Por ejemplo, un Ne mínimo local hace 5.000 generaciones, en las ubicaciones JS, WAS, BB, SD y MA se traduciría en 3 años × generación − 1 × 5.000 generaciones = 15 kya, justo después del LGM. En general, los valores más bajos de Ne se relacionaron con una menor diversidad clonal en sitios del norte (NN) y sur de Europa (PO; Tabla complementaria 3). Dentro del Pacífico, la población más austral (SD) no mostró ninguna caída en Ne, mientras que todas las demás mostraron cuellos de botella que se volvieron más pronunciados de sur a norte (en el orden BB, WAS y ALI/ASL). En cuanto al lado atlántico, las poblaciones del Atlántico noroeste NC y MA y las poblaciones del sur de Europa PO y CZ (y en menor medida el Mediterráneo FR) mostraron poca evidencia de cuellos de botella (como Ne mínimos locales), lo que sugiere que estas localidades fueron refugios durante el LGM (Figura 5). Lo contrario se aplica a QU en el noroeste y a NN y SW en el Atlántico nororiental, donde vemos un Ne mínimo pronunciado hace unas 3.000 generaciones.
El MSMC infirió los tamaños históricos efectivos de la población (Ne). Se realizaron réplicas con todos los genotipos únicos en cada ubicación, representados como líneas separadas. El eje x representa generaciones en lugar del tiempo absoluto, ya que el tiempo de generación de Z. marina varía según el nivel de clonalidad local. Los valores de Ne tienen un límite de 1 millón. Muchas poblaciones revelan un Ne mínimo (por lo tanto, probablemente un cuello de botella) hace ~5.000 generaciones (líneas verticales discontinuas), lo que probablemente refleja el impacto del LGM si estimamos un tiempo medio de generación de ~3 años. Tenga en cuenta que las estimaciones demográficas de <1000 generaciones se consideran poco confiables y, por lo tanto, no se interpretan. Las líneas horizontales discontinuas en Ne = 5000 son solo para orientación.
Para el Atlántico, determinamos la recolonización post-LGM más probable a través de cálculos bayesianos aproximados (Hágalo usted mismo: Computación bayesiana aproximada - DIY-ABC; Figura complementaria 10) y descubrimos que la región al norte de NC a QU era la más probable. probable fuente donante (Nota complementaria 7).
Con el rápido cambio climático, la información sobre los cambios climáticos pasados y sus efectos heredados sobre la estructura genética y la diversidad de las poblaciones existentes puede ayudar a guiar los esfuerzos de restauración para garantizar la persistencia y la resiliencia16,17,35. Z. marina tiene una distribución circunglobal que nos brindó la oportunidad única de reconstruir la expansión natural de una planta marina en todo el hemisferio norte a partir del origen de la especie en el Pacífico noroeste durante un período de fuertes cambios climáticos recurrentes (Fig. 6a, b ).
a, Océano Pacífico. Z. marina surgió en la región del archipiélago japonés (Nota complementaria 3). Los sucesos conocidos en el Ártico ruso se representan con puntos de color verde claro. Los eventos de dispersión hipotéticos son los siguientes: evento 1, primera dispersión transpacífica a través de la corriente del Pacífico Norte, llegando a la 'puerta de entrada' de la corriente del Pacífico Norte, donde se divide hacia el sur siguiendo la corriente de California y hacia el norte a través de la corriente de Alaska, en este caso. tomando la ruta sur (Nota complementaria 5); evento 2, dispersiones transpacíficas posteriores hacia la 'puerta de entrada' van hacia el sur o el norte y, si siguen la ruta del norte, luego hasta Alaska y posiblemente más allá; evento 3, colonización del Atlántico desde Alaska recientemente colonizada. Zona de mezcla a lo largo de la costa este del Pacífico (evento 6): los ancestros de SD pueden haberse dispersado posteriormente hacia el norte a través de la corriente de Davidson cercana a la costa, que se invierte estacionalmente, formando mezclas secuenciales con BB y WAS. b, Océano Atlántico. La dispersión hacia el Atlántico probablemente fue impulsada por la corriente de Labrador hacia el sur (evento 3), que proporcionó la base original y la posterior propagación al Mediterráneo (incluido el sur de Portugal) y la dispersión a lo largo de ambas costas atlánticas entre MIS4 y el LGM (Nota complementaria 7) en cuyas expansiones y contracciones de poblaciones se movían con el borde del hielo y el cambio del nivel del mar. El evento 4 describe la colonización temprana del Mar Mediterráneo antes de la LGM. El evento 5 representa la recolonización posterior al LGM en la que los refugios del Atlántico occidental cercanos a Carolina del Norte (junto con un hipotético refugio del sur de Europa) crearon la distribución que vemos hoy46,77. Para ambos mapas: negro, costa actual; gris oscuro, costa a nivel del mar LGM; blanco, glaciares; hielo marino perenne y moteado de blanco; como se muestra, vías actuales. Puntos rosados con etiquetas a continuación de la Fig. 1, ubicaciones muestreadas; óvalos de color verde oscuro, hipotéticos refugios; flechas de gradiente amarillo-naranja-rojo, vías de dispersión y sincronización, incluida la 'puerta de entrada' de la corriente del Pacífico Norte (flechas moradas emparejadas) y la corriente de Davidson (blanca). Los números en las vías actuales corresponden a los puntos de ramificación (nodos) filogenéticos en la Fig. 4.
La presencia de pasto marino en el Atlántico es sorprendentemente reciente y data de sólo ~ 243 kya. Como ninguna otra especie de pastos marinos es capaz de llenar este nicho ecológico o formar praderas densas en las regiones boreales a árticas (>50° N, Nota complementaria 1), la contingencia histórica8 ha desempeñado un papel previamente subestimado en el establecimiento de este ecosistema único y productivo. La reciente llegada de la pasto marino al Atlántico también puede explicar por qué relativamente pocos animales son endémicos de los lechos de pasto marino o han evolucionado para consumir su tejido vegetal directamente (Tabla complementaria 6). Se ha descubierto que un mayor número de especies están íntimamente asociadas con Z. marina en el Pacífico que en el Atlántico, incluidas especies que se alimentan de forma especializada, facultativas que se alimentan de tejido verde y especialistas en hábitat.
La primera filogenia fechada a nivel de población en cualquier especie de pastos marinos también podría explicar por qué parece haber poca diferenciación de nicho entre la epifauna asociada a pastos marinos en el Atlántico en comparación con la del Pacífico36. Nuestro estudio muestra cómo la macroecología, en este caso la presencia de un ecosistema completo, puede estar fuertemente determinada por la historia de la colonización, específicamente el período de tiempo en el que la hierba marina llegó al Atlántico Norte8, y no por las condiciones ambientales adecuadas.
Identificamos la Corriente del Pacífico Norte, que comenzó a intensificarse aproximadamente 1 millón de años (ref. 37), como la principal puerta de dispersión. Se bifurca al norte en la corriente de Alaska y al sur en la corriente de California (Fig. 6a), aproximadamente en la latitud media de la isla de Vancouver (Nota complementaria 5). Según este escenario, SD fue colonizada por el primer evento de colonización detectable aproximadamente hace 352 kya (Fig. 6a, evento 1) y ha conservado la antigua variación genética desde entonces, probablemente debido a la rareza del intercambio genético hacia el sur a través del límite biogeográfico de Point Conception38 y la variable Corriente Davidson Norte-Sur (revisada en la ref. 39). Los eventos transpacíficos posteriores que se dirigieron hacia el sur en la entrada finalmente resultaron en una zona de mezcla que involucraba a WAS y BB.
Otra dispersión transpacífica (Fig. 6a, evento 2) a los 270 kya se movió hacia el norte a través de la puerta de entrada, colonizó Alaska y se convirtió en el trampolín para una dispersión interoceánica hacia el Atlántico a través del Océano Ártico unos 243 kya (evento 3). Otro apoyo para la bifurcación de la puerta de enlace proviene de dos haplotipos mat-K de cloroplasto presentes en el norte de Hokkaido, Japón40, con una división en el lado del Pacífico este: el haplotipo mat-K2 se dirigió hacia el norte y se encontró en 12 sitios en Bering y el Golfo de Alaska. Grandes Ecosistemas Marinos, mientras que el haplotipo mat-K4 se encontró al sur de la puerta de entrada en seis sitios en el Gran Ecosistema Marino de la Corriente de California hasta Baja (Nota complementaria 5).
Aunque el Estrecho de Bering puede haberse abierto hace 5,5 a 4,8 millones de años (ref. 29), nuestros análisis solo respaldan un único evento de colonización en el Atlántico, en contraste con los hallazgos de otros invertebrados marinos anfiárticos y boreales41 y algas42. La variación genómica característica de las poblaciones existentes de Alaska no se detectó en ninguna población del Atlántico norte, de acuerdo con datos de microsatélites anteriores40, lo que corrobora que el Atlántico solo fue colonizado una vez. Si bien no podemos descartar una colonización anterior, esto requeriría que Z. marina se extinguiera sin dejar ningún rastro en los genomas nucleares o haplotipos de cpDNA, lo que consideramos poco probable.
La división genética Pacífico-Atlántico ha sido identificada recientemente como un "legado del Pleistoceno" basándose en un estudio de genotipado basado en microsatélites17. Aquí confirmamos además la presencia de dos clados profundamente divergentes en el Pacífico que comparten un patrón complejo de contacto secundario en el lado del Pacífico Oriental (Nota complementaria 8). Por el contrario, la separación genética entre las poblaciones del Atlántico occidental y oriental está presente pero es débil, lo que sugiere contracciones y expansiones poblacionales recientes impulsadas por el LGM, con la deriva del Atlántico norte impulsando repetidos eventos de colonización oeste-este (Fig. 6b).
Si bien nuestra filogenia (Fig. 4) también es consistente con un escenario en el que la población SD de ramificación profunda representaría el origen de la especie de Z. marina, consideramos que esto es extremadamente improbable dadas las corrientes oceánicas predominantes a largo plazo (Fig. 6a). , la distribución de la diversidad genética (Fig. 1b, c) y nuestra comprensión actual de la aparición del género Zostera (~ 15 millones de años), incluida la especie Z. marina entre 5 y 1,62 millones de años (ref. 5) en el Pacífico noroeste. (Nota complementaria 3). Por lo tanto, considerando toda la evidencia en conjunto, concluimos que la región de Japón, y no el Pacífico Oriental (SD), es el origen geográfico más probable de la hierba marina y la fuente de múltiples eventos de dispersión con las corrientes oceánicas.
La región de Carolina del Norte y la Bahía de Chesapeake hacia el norte hasta Long Island sirvió como un refugio importante y fue al menos una población de origen posterior para el Atlántico Noreste (Fig. 6b, evento 5). Las áreas costeras más al norte de Cape Cod, Nueva Escocia, Quebec y Terranova también son conocidas como refugios43 y están conectadas por Quebec en nuestro muestreo. La inclusión adicional de poblaciones de Terranova y el sur de Groenlandia puede modificar esta opinión, como puede ser el caso de los refugios alrededor del suroeste de Irlanda y la península de Bretaña44,45 (Nota complementaria 7). De hecho, hay cierta evidencia en nuestros datos del análisis de ESTRUCTURA de modos K superiores (Figuras complementarias 5 a 7) y señales de mezcla en el suroeste de que los refugios adicionales del Atlántico este dieron como resultado una composición genética post-LGM más compleja de las poblaciones existentes del norte de Europa. como se sugirió anteriormente46 (Nota complementaria 7).
Junto con el modelado demográfico, identificamos la contracción de la población y la posterior expansión latitudinal a lo largo de tres líneas costeras después del LGM (26-19 kya). Estos son patrones comunes de muchas especies terrestres12 e intermareales15,46, siendo la costa del Atlántico nororiental/Mar del Norte y Beringia las más afectadas. Curiosamente, para Z. marina, la región del Atlántico no estuvo más influenciada por las últimas glaciaciones y cambios en el nivel del mar que el Pacífico Oriental (Fig. 5 y 6b), incluso cuando se consideran sus diversidades de referencia relativas (Tabla complementaria 4). En ambos océanos, hubo pérdidas dramáticas de diversidad genómica. La diversidad genética general de 5 a 7 veces menor en el Atlántico simplemente amplificó los efectos de LGM y resultó en diferencias >30 veces entre las poblaciones con la diversidad más alta (JS) versus la más baja (NN). Esta observación puede tener consecuencias significativas, aunque aún desconocidas, para el potencial adaptativo y el rescate genético del pasto marino en el Antropoceno.
En conclusión, el número relativamente bajo de especies de pastos marinos existentes (~65 especies en seis familias47) se ha atribuido a frecuentes extinciones intermedias6. Nuestros datos sugieren un segundo proceso plausible, a saber, múltiples intercambios genéticos a larga distancia dentro y entre cuencas oceánicas que pueden haber impedido la especiación alopátrica (ver también ref. 48). Nuestro muestreo de toda la gama ha permitido una visión general de la historia evolutiva de este linaje de pastos marinos y abre la puerta a la exploración de estudios funcionales en cuencas y costas oceánicas. El trabajo futuro explorará el pangenoma de Z. marina teniendo en cuenta cómo la alta diversidad y robustez de las poblaciones del Pacífico pueden contribuir a la gestión y el rescate de poblaciones a lo largo de las costas atlánticas que se calientan rápidamente.
La pasto marino (Z. marina L.) es la especie de pasto marino más extendida del hemisferio norte templado al ártico3. Se está desarrollando como modelo para estudiar la evolución y la genómica de las praderas marinas17,19,21,49. Z. marina es una especie fundamental de los ecosistemas de aguas poco profundas17 con una serie de funciones ecológicas críticas que incluyen la mejora del reclutamiento de peces y crustáceos50, la mejora de la calidad del agua51 y el secuestro de 'carbono azul'52,53.
Eelgrass presenta una mezcla de reproducción clonal (= propagación vegetativa del sistema de rizomas) y sexual a través de semillas, con proporciones variables según la ubicación46. El sistema de apareamiento es monoico. Si bien existe la posibilidad de autofecundación, es decir, autocompatibilidad54, la mayoría de las poblaciones se cruzan55. Excepto en los casos más extremos de monoclonalidad56,57, las unidades modulares replicadas (brotes de hojas = ramets) que surgen de un individuo producido sexualmente (=genet o clon) se entremezclan para formar la pradera de pastos marinos. Esto también implica que los tiempos de generación son difíciles de estimar o promediar entre poblaciones. Sin embargo, asumimos aquí, basándonos en observaciones personales, que en las poblaciones de pasto marino perenne, los individuos se vuelven reproductivos en el año 2 después de la germinación, mientras que alcanzan su producción reproductiva máxima en el año 3. La longevidad extendida de los clones da como resultado generaciones superpuestas, pero no en tiempos generacionales más largos. La evidencia adicional de un tiempo de generación promedio de 3 años utilizado aquí para el modelado posterior proviene del análisis demográfico histórico (Fig. 5), específicamente los mínimos Ne locales que son indicativos del cuello de botella de la población durante la LGM.
Realizamos una recolección de muestreo de amplio rango de 190 especímenes de Z. marina de 16 ubicaciones geográficas (Fig. 1a y Tabla complementaria 1). Las poblaciones elegidas presentan una mezcla de reproducción sexual y vegetativa con la excepción de una reproducción mayoritariamente vegetativa en los sitios PO y NN, evidente a través de clones extendidos. Las ubicaciones elegidas fueron un subconjunto de los sitios de la Red Experimental Zostera que se analizaron previamente utilizando 24 loci de microsatélites17. Aunque se mantuvo una distancia de muestreo de >2 m para reducir la probabilidad de recolectar la misma gineta/clon dos veces, esto no siempre fue exitoso (compárese con la Tabla complementaria 3) y, por lo tanto, proporcionó una estimación de la diversidad clonal local.
El tejido vegetal se seleccionó de la parte meristemática basal del brote después de pelar la vaina de la hoja para minimizar las epífitas (bacterias y diatomeas), se congeló en nitrógeno líquido y se almacenó a -80 °C hasta la extracción del ADN.
Se molieron en N2 líquido alrededor de 100 a 200 mg de peso fresco de tejido basal de la hoja, que contenía la región meristemática. El ADN genómico se extrajo utilizando el kit Macherey-Nagel NucleoSpin plant II siguiendo las instrucciones del fabricante. Las concentraciones de ADN estuvieron en el rango de 50 a 200 ng µl-1. El control de calidad se realizó siguiendo las pautas del Joint Genome Institute (https://jgi.doe.gov/wp-content/uploads/2013/11/Genomic-DNA-Sample-QC.pdf). La preparación de la biblioteca de ADN basada en placas para la secuenciación de Illumina se realizó en el sistema robótico de manipulación de líquidos PerkinElmer Sciclone NGS utilizando el kit de preparación de bibliotecas de Kapa Biosystems. Se cortaron alrededor de 200 ng de muestra de ADN a una longitud de alrededor de 600 pb utilizando un ultrasonido enfocado Covaris LE220. Los fragmentos seleccionados fueron reparados en sus extremos, con cola en A y ligados con adaptadores de secuenciación que contenían un código de barras de índice molecular único. Las bibliotecas se cuantificaron utilizando el kit qPCR de la biblioteca de secuenciación de próxima generación de KAPA Biosystems en un instrumento de PCR en tiempo real Roche LightCycler 480. Luego, las bibliotecas cuantificadas se agruparon y se prepararon para la secuenciación en el secuenciador Illumina HiSeq2500 utilizando los kits de secuenciación TruSeq SBS (v4) siguiendo una receta de ejecución indexada de 2 × 150 pb hasta una profundidad objetivo de aproximadamente 40 veces de cobertura. FastQC (https://www.bioinformatics.babraham.ac.uk/projects/fastqc/) evaluó la calidad de las lecturas sin procesar y las visualizó MultiQC58. Se utilizó BBDuk (https://jgi.doe.gov/data-and-tools/bbtools/bb-tools-user-guide/bbduk-guide/) para eliminar adaptadores y para el filtrado de calidad, descartando lecturas de secuencia (1) con más de un 'N' (maxns = 1), (2) menos de 50 pb después del recorte (minlength = 50) y (3) con calidad promedio <10 después del recorte (maq = 10). FastQC y MultiQC se utilizaron para la segunda ronda de control de calidad de las lecturas limpias. La cobertura de secuenciación y la tasa de mapeo se calcularon para cada muestra (Tablas de datos complementarios 1 y 2).
Para analizar los loci genéticos presentes en todo el rango de distribución global del pasto marino, nos centramos en identificar genes centrales que están presentes en los genomas de todos los individuos. Para ello, cada uno de los 190 ramets se ensambló de novo utilizando HipMer (k = 51) (ref. 59). Para categorizar, extraer y comparar genes centrales y variables (shell y nube), se alinearon secuencias de transcripción primaria (21,483 modelos de genes) de la referencia de Z. marina (V3.1; ref. 19) usando BLAT utilizando parámetros predeterminados60 para cada uno de novo. asamblea. Los genes se consideraron presentes si la transcripción se alineaba con (1) >60% de identidad y >60% de cobertura de una única alineación o (2) >85% de identidad y >85% de cobertura dividida en tres o menos andamios. Las llamadas individuales de presencia, ausencia y variación se combinaron en una matriz para clasificar los genes en categorías de núcleo, nube y capa en función de su observación en toda la población. El número total de genes considerados fue de 20.100. Debido a que los genotipos idénticos y los ensamblajes fragmentados y de baja calidad pueden sesgar y sesgar los análisis de presencia-ausencia-variación, solo se mantuvieron 141 representantes únicos de clones y ramets con más de 17,500 genes para garantizar que solo se conservaran ensamblajes únicos y de alta calidad. Los genes se clasificaron mediante análisis discriminante de componentes principales61 en grupos de genes de nube, caparazón y núcleo en función de su frecuencia. Los genes centrales fueron la categoría más grande, con 18.717 genes que se observaron en promedio en el 97% de los ramets.
Las lecturas filtradas por calidad se mapearon con el genoma de referencia V3.1 de Z. marina a nivel cromosómico utilizando BWA MEM62. Las alineaciones se convirtieron al formato BAM y se ordenaron utilizando Samtools62. El módulo MarkDuplicates en GATK4 (ref. 63) se utilizó para identificar y etiquetar lecturas duplicadas en los archivos BAM. La tasa de mapeo para cada genotipo se calculó utilizando Samtools (Tabla de datos complementarios 2). Se utilizó HaplotypeCaller (GATK4) para generar un archivo de formato de llamada de variante genómica (GVCF) para cada muestra, y todos los archivos GVCF se combinaron mediante CombineGVCF (GATK4). Se utilizó el genotipo GVCF (GATK4) para denominar variantes genéticas.
Se utilizó BCFtools64 para eliminar SNP dentro de 20 pares de bases de un indel u otro tipo de variante (Figura 1 complementaria), ya que estos tipos de variantes pueden causar llamadas de SNP erróneas. Se utilizó VariantsToTable (GATK4) para extraer anotaciones INFO. Los SNP que cumplían uno o más de los siguientes criterios se marcaron mediante VariantFiltration (GATK4): MQ <40,0; FS > 60,0; QD < 10,0; MQRandSum > 2,5 o MQRandSum < −2,5; ReadPosRandSum < −2,5; ReadPosRandSum > 2,5; TAS > 3,0; DP > 10.804,0 (2 × DP promedio). Esos SNP fueron excluidos por SelectVariants (GATK4). Se retuvieron un total de 3.975.407 SNP. Se utilizó VCFtools65 para convertir genotipos individuales en datos faltantes cuando GQ <30 o DP <10. Las llamadas de referencia homocigotas individuales con una o más lecturas que respaldan el alelo variante, y las llamadas de variantes homocigotas individuales con ≥1 lectura que respaldan la referencia, se establecieron como faltantes datos. Sólo se mantuvieron los SNP bialélicos (3.892.668 SNP). Para evitar los sesgos relacionados con el genoma de referencia, debido a la gran divergencia genómica entre el Pacífico y el Atlántico, nos centramos en los 18.717 genes centrales que se observaron en promedio en el 97% de los ramets. Se utilizó Bedtools66 para encontrar superposiciones entre los SNP y los genes centrales, y solo se mantuvieron esos SNP (ZM_HQ_SNP, 763,580 SNP). Los genotipos que estaban fuera de nuestros criterios de calidad personalizados se representaron como datos faltantes.
Según el conjunto de datos ampliado ZM_HQ_SNP (763,580 SNP; Fig. 1 complementaria), se detectaron posibles pares de padres y descendientes en autofecundación (Tabla complementaria 2), así como compañeros clonados en función de la heterocigosidad compartida (ref. 67). Para garantizar que todos los genotipos evaluados se originaran mediante apareamiento aleatorio, se excluyeron diez ramets que mostraban evidencia de autofecundación. También se excluyeron diecisiete clones de muestras múltiples (Tabla complementaria 3 y Figura complementaria 3). Con base en ZM_HQ_SNP (763,580 SNP), calculamos la tasa de falta de muestra utilizando un script Python3 personalizado y trazamos los resultados como un histograma (Figura complementaria 4). Las tasas faltantes fueron en su mayoría <15%, excepto diez ramets (ALI01, ALI02, ALI03, ALI04, ALI05, ALI06, ALI10, ALI16, QU03 y SD08) que también fueron excluidos. Después de la exclusión de estas 37 muestras debido a datos faltantes, autofecundación o clonalidad, se dejaron 153 muestras para análisis adicionales.
El genoma del cloroplasto fue ensamblado de novo por NOVOplasty68. El genoma del cloroplasto de Z. marina estaba representado por una molécula circular de 143.968 pb con una estructura cuatripartita clásica: dos repeticiones invertidas idénticas (IRa e IRb) de 24.127 pb cada una, una gran región de copia única de 83.312 pb y una pequeña región única. -región de copia de 12.402 pb. Todas las regiones se incluyeron por igual en el análisis de llamadas de SNP, excepto las 9.818 pb que codifican los ARN ribosómicos 23S y 16S debido a la contaminación bacteriana en algunas muestras. Las lecturas sin procesar de Illumina de cada individuo se alinearon mediante BWA MEM con el genoma del cloroplasto ensamblado. Las alineaciones se convirtieron al formato BAM y luego se ordenaron usando Samtools62. Los sitios genómicos se denominaron posiciones variables cuando la frecuencia de lecturas variantes era> 50% (Figura complementaria 8) y la cobertura total de la posición era> 30% de la cobertura mediana (174 posiciones variables). Luego, 11 posiciones probablemente relacionadas con microsatélites y 12 posiciones que reflejan inversiones diminutas causadas por estructuras en horquilla69 se eliminaron del conjunto final de posiciones variables para la reconstrucción de haplotipos (151 SNP). Para la reconstrucción del árbol filogenético, seleccionamos además 108 SNP que representan sitios informativos de parsimonia (es decir, sin singletons).
Entre las 153 muestras únicas que se retuvieron para los análisis, se utilizó SnpEff (http://pcingola.github.io/SnpEff/) para anotar cada SNP como genético o no genético, y dentro de la primera categoría como sinónimo o no sinónimo. . Para obtener SNP supuestamente neutrales, mantuvimos solo los SNP anotados como 'variante_sinónima' (ZM_Neutral_SNP, 144,773 SNP). Para los SNP en ZM_Neutral_SNP (144,773 SNP), solo se mantuvieron los SNP sin datos faltantes, lo que resultó en 44,865 SNP, el conjunto de datos utilizado para calcular π (Figuras complementarias 1 y 2). Para obtener loci de SNP supuestamente no vinculados para las ejecuciones de coalescencia, adelgazamos los sitios utilizando VCFtools para lograr una distancia mínima por pares (distancia física en el genoma de referencia) de 3000 pb para obtener nuestro conjunto de datos central, en adelante ZM_Core_SNP, correspondiente a 11,705 SNP.
Usamos paquetes R para ejecutar una PCA global basada en ZM_HQ_SNP (= 763,580 SNP). El paquete vcfR70 se utilizó para cargar el archivo en formato VCF y la función glPca en el paquete adegenet para realizar análisis PCA, seguido de la visualización a través del paquete ggplot2.
Utilizamos la agrupación bayesiana implementada en ESTRUCTURA para estudiar la estructura de la población y la posible mezcla22. Para reducir el tiempo de ejecución, seleccionamos aleatoriamente 2353 SNP de ZM_Core_SNP (20%) para ejecutar STRUCTURE (duración del período de grabación 3 × 105; número de ejecuciones Monte Carlo de la cadena de Markov 2 × 106). Se realizaron diez corridas para los valores de K del 1 al 10. StructureSelector25 se utilizó para ayudar a determinar el número óptimo de grupos (K) según el método Delta-K original23 junto con métricas adicionales propuestas por la ref. 24 que dan un límite superior al número de conglomerados. Consideramos la estructura jerárquica de nuestro conjunto de datos debido a la marcada división Pacífico-Atlántico y siempre realizamos una inspección cualitativa de modos K mayores y menores alternativos.
Para detectar una estructura poblacional jerárquica oculta, analizamos más a fondo las poblaciones del Atlántico y el Pacífico únicamente. Los datos del Pacífico se extrajeron de ZM_Neutral_SNP (144,773 SNP), excluyendo los sitios monomórficos y aquellos con datos faltantes. Para obtener SNP supuestamente independientes, adelgazamos los sitios utilizando VCFtools, de modo que no hubiera dos sitios a una distancia de 3000 pb (distancia física en el genoma de referencia) entre sí (ZM_Pacific_SNP, 12,514 SNP). Esos 12.514 SNP se sometieron a PCA, mientras que en STRUCTURE se utilizó un conjunto de 6.168 SNP seleccionados al azar para reducir los tiempos de ejecución (duración del período de precalentamiento 3 × 105; número de ejecuciones Monte Carlo de la cadena de Markov, 2 × 106) como se describió anteriormente. , con posibles valores de K 1–7.
Los datos de polimorfismo para la hierba marina del Atlántico y el Mediterráneo también se extrajeron de ZM_Neutral_SNP (144,773 SNP). Para obtener SNP supuestamente independientes, adelgazamos los sitios utilizando herramientas VCF de acuerdo con los criterios anteriores. Los 8.552 SNP resultantes se utilizaron luego para ejecutar otro PCA y ESTRUCTURA separados utilizando los parámetros anteriores. Para el análisis de ESTRUCTURA, K se estableció de 1 a 5. Para cada K, repetimos el análisis 10 veces de forma independiente (Figuras complementarias 6 y 7).
La estructura poblacional de cpDNA se exploró utilizando una red de haplotipos, construida mediante el método Median Joining Network71 con épsilon 0 y 1 implementado por PopART72, basado en 151 sitios polimórficos. La topología se confirmó adicionalmente utilizando un árbol filogenético de máxima verosimilitud, reconstruido por IQ-TREE v1.5.5 con 1000 réplicas de arranque32 basadas en 108 sitios polimórficos informativos de parsimonia (Datos ampliados, figura 1).
Para evaluar los procesos evolutivos reticulados, utilizamos SplitsTree426, una generalización combinatoria de árboles filogenéticos diseñada para representar incompatibilidades. Se utilizó un script Python3 personalizado para generar un archivo en formato fasta que contiene secuencias de ADN concatenadas para todos los ramets basados en ZM_Core_SNP. Como la mayoría de los genotipos eran heterocigotos, se tuvo que seleccionar un alelo al azar para representar el sitio de un individuo. Verificamos la coherencia volviendo a ejecutar el análisis con diferentes conjuntos de SNP seleccionados al azar y encontramos topologías idénticas y pesos divididos similares. El archivo de formato fasta se convirtió al archivo de formato nexus usando MEGAX73, que se envió a SplitsTree4. Se utilizó el método NeighborNet para construir la red dividida.
Se utilizó VCFtools para calcular la diversidad de nucleótidos (π) para cada población en todos los sitios sinónimos utilizando cada uno de los seis cromosomas como réplicas de 44,685 SNP sin ningún dato faltante (Figura 1 complementaria). La heterocigosidad genómica para un genotipo HOBS determinado (como (número de sitios heterocigotos)/(número total de sitios con llamadas de genotipo disponibles)) se calculó utilizando un script Python3 personalizado basado en todos los SNP sinónimos (144,773).
Usamos la función stamppFst en el paquete StAMPP-R74 para calcular FST por pares en función de ZM_Core_SNP (Tabla complementaria 5). Los valores de P fueron generados por 1000 bootstraps en todos los loci.
La D de Patterson proporciona una prueba simple y poderosa para la desviación de una historia evolutiva bifurcada. La prueba se aplica a tres poblaciones, P1, P2 y P3 más un grupo externo O, siendo P1 y P2 poblaciones hermanas. Si P3 comparte más alelos derivados con P2 que con P1, la D de Patterson será positiva. Utilizamos Dsuite28 para calcular los valores de D para las poblaciones dentro de los océanos Pacífico y Atlántico (Datos ampliados, figura 2). D se calculó para tríos de poblaciones de Z. marina basándose en el conjunto de datos centrales de SNP (ZMZJ_D_SNP) (Figura complementaria 2), utilizando Z. japonica como grupo externo. El script Ruby plot_d.rb (https://github.com/mmatschiner/tutorials/blob/master/analysis_of_introgression_with_snp_data/src/plot_d.rb) se utilizó para trazar un mapa de calor que visualiza conjuntamente tanto el valor D como el valor P asociado. para cada comparación de P2 y P3. El color de la celda del mapa de calor correspondiente indica el valor D más significativo en todas las poblaciones posibles en la posición P1. Los colores rojos indican valores D más altos y los colores más saturados indican una mayor importancia.
Para estimar el tiempo de divergencia entre los grupos principales, utilizamos el MSC en combinación con un modelo de reloj molecular estricto11. Utilizamos el software SNAPP9 con un archivo de entrada preparado con el script 'snapp_prep.rb' (github.com/mmatschiner/snapp_prep). Se seleccionaron al azar dos muestras de cada una de las poblaciones incluidas y se extrajo la información del genotipo de ZMZJ_Neutral_SNP (Figuras complementarias 1 y 2). Se excluyeron los sitios monomórficos. Sólo se conservaron los SNP sin datos faltantes. Para obtener SNP supuestamente independientes, adelgazamos los sitios utilizando herramientas VCF para que no hubiera dos sitios que incluyeran SNP que estuvieran dentro de 3000 pb (distancia física en el genoma de referencia) entre sí (6169 SNP). El tiempo de divergencia estimado entre Z. japonica y Z. marina se utilizó como punto de calibración, que se implementó como una distribución previa lognormal (Nota complementaria 4, media = 11,154 millones de años, sd = 0,07).
La mayoría de los 6.169 SNP anteriores representaban las diferencias genéticas entre Z. japonica y Z. marina y eran monomórficos en Z. marina. Para obtener una mejor estimación entre las poblaciones de Z. marina, realizamos un segundo análisis SNAPP específico de Z. marina mediante submuestreo del conjunto de datos ZM_Neutral_SNPs (144,773 SNP), excluyendo sitios monomórficos y datos faltantes. Volvimos a adelgazar los sitios utilizando herramientas VCF, de modo que todos los sitios estuvieran a una distancia de ≥3000 pb entre sí (13,732 SNP). La divergencia de la copa para todas las poblaciones de Z. marina, estimada en el primer análisis SNAPP, se utilizó como punto de calibración, asumiendo una distribución previa lognormal (media = 0,3564 millones de años, sd = 0,1).
Como el modelo MSC no tiene en cuenta el intercambio genético, el análisis SNAPP se repitió después de eliminar las poblaciones que mostraban mezcla en ESTRUCTURA (Fig. 2), SplitsTree (Fig. 3) y estadística D (Datos extendidos, Fig. 2). Por lo tanto, redujimos el conjunto de datos excluyendo JN (mezclado con Alaska), así como WAS y BB (implicados en la mezcla con SD). También exploramos cómo esta exclusión de poblaciones mezcladas afectó progresivamente la topología del árbol filogenético SNAPP (Figuras complementarias 11b-d). Como método coalescente alternativo, se realizó un análisis ASTRAL basado en 617 genes centrales en combinación con una estimación del tiempo de divergencia utilizando StarBEAST2 (Nota complementaria 2). La clasificación de linaje incompleta se examinó mediante el análisis del cuarteto ASTRAL30 (Figura complementaria 11), y la datación alternativa de los eventos de divergencia se presenta en la Figura complementaria 12.
El MSMC33 se ejecutó para cada genotipo por población. Nos centramos en los intervalos de tiempo en los que convergieron diferentes ejecuciones replicadas por población, porque MSMC crea estimaciones poco confiables en los últimos tiempos34. Debido a las diferencias en la cantidad relativa de reproducción sexual versus clonal o vegetativa, el tiempo de generación de Z. marina varía entre las poblaciones. Por tanto, nos abstuvimos de representar el eje x en tiempo absoluto. Primero generamos un archivo de máscara de mapeabilidad para cada uno de los seis cromosomas principales usando SNPable (http://lh3lh3.users.sourceforge.net/snpable.shtml). Sólo se consideraron las regiones cromosómicas que permitieron un mapeo único de lecturas de secuenciación. Generamos un archivo de máscara para todos los genes centrales a lo largo de cada uno de los seis cromosomas principales. Generamos un archivo de máscara específico de ramet basado en el archivo de formato BAM usando bamCaller.py (https://github.com/stschiff/msmc-tools), que contiene las regiones cromosómicas con suficiente cobertura de cualquier genotipo, con minDepth = 10. También generamos un archivo VCF específico de ramet para cada uno de los seis cromosomas principales basado en ZM_HQ_SNP utilizando un script Python3 personalizado.
Se realizaron simulaciones utilizando DIYABC-RF75 para distinguir entre modelos alternativos de la historia de recolonización de Z. marina después del LGM. Teniendo en cuenta que el Mar Mediterráneo tenía su propio refugio glaciar, el modelo ABC se realizó únicamente para el Atlántico. Construimos tres escenarios de recolonización (Figura 10 complementaria): (1) NC y MA eran refugios glaciares en el Atlántico, que primero recolonizaron QU como un trampolín y luego el Atlántico nororiental. (2) NC y MA representan los únicos refugios glaciares del Atlántico. Tanto QU como el Atlántico nororiental fueron recolonizados directamente por los refugios glaciales. (3) NC y MA representan los refugios glaciales del sur del Atlántico noroeste únicamente. Tenga en cuenta que este análisis no puede cubrir ningún refugio adicional del Atlántico este que no haya sido muestreado (Nota complementaria 7).
Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.
Los datos del genoma se han depositado en Genbank (archivo de lectura breve, Tabla de datos complementarios 3). Las secuencias codificantes de Z. japonica y Z. marina para el análisis ASTRAL se pueden encontrar en figshare (https://doi.org/10.6084/m9.figshare.21626327.v1). Se puede acceder a los archivos VCF de los 11.705 SNP principales en https://doi.org/10.6084/m9.figshare.21629471.v1. Se proporcionan los datos de origen para la Fig. 1b, c, así como estadísticas de cobertura de secuenciación, tasa de mapeo y especificaciones adicionales de cada biblioteca secuenciada (Tablas complementarias 1 a 3). Los datos originales se proporcionan con este documento.
Los scripts personalizados se depositan en GitHub para el filtrado SNP (github.com/leiyu37/populationGenomics_ZM.git), para la detección de parejas de clones (github.com/leiyu37/Detecting-clonemates.git), para la cuantificación de heterocigotos y diversidad de nucleótidos (github. com/leiyu37/populationGenomics_ZM.git) y preparar archivos de entrada SplitsTree (https://github.com/leiyu37/populationGenomics_ZM/blob/main/10_SplitsTree/vcf2alignment.py) y archivos de entrada SNAPP (github.com/mmatschiner/snapp_prep) . Los scripts para calcular las estadísticas D están disponibles en github.com/mmatschiner/tutorials/blob/master/analysis_of_introgression_with_snp_data/src/plot_d.rb. Los scripts para preparar el análisis de presencia/ausencia de genes se depositan en https://github.com/leiyu37/populationGenomics_ZM/tree/main/gene_presense_absence_analysis. Se puede encontrar más código de software para el análisis de MSMC en http://lh3lh3.users.sourceforge.net/snpable.shtml (generación de un archivo de máscara de mapeabilidad para cada uno de los seis cromosomas usando SNPable) y en https://github.com/stschiff /msmc-tools (generación de un archivo de máscara específico de ramet basado en un archivo bam usando bamCaller.py).
Chen, L.-Y. et al. Los análisis filogenómicos de Alismatales arrojan luz sobre las adaptaciones a los ambientes acuáticos. Mol. Biol. Evolución. 39, msac079 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Unsworth, RKF, Cullen-Unsworth, LC, Jones, BLH y Lilley, RJ El papel planetario de la conservación de los pastos marinos. Ciencia 377, 609–613 (2022).
Artículo CAS PubMed Google Scholar
Green, EP y Short, FT World Atlas of Seagrasses (Univ. California Press, 2003).
Röhr, ME et al. Capacidad de almacenamiento de carbono azul en praderas templadas de pasto marino (Zostera marina). Globo. Biogeoquímica. Ciclos 32, 1457-1475 (2018).
Artículo de Google Scholar
Coyer, JA et al. Filogenia y divergencia temporal de la familia de pastos marinos Zosteraceae utilizando un loci nuclear y tres de cloroplasto. Sistema. Biodiversores. 11, 271–284 (2013).
Artículo de Google Scholar
Waycott, M., Biffin, E. & Les, DH en Seagrasses of Australia: Structure, Ecology and Conservation (eds Larkum, AWD, Kendrick, GA & Ralph, PJ) 129–154 (Springer International, 2018).
Harwell, MC y Orth, RJ Potencial de dispersión a larga distancia en una macrófita marina. Ecología 83, 3319–3330 (2002).
Artículo de Google Scholar
Marske, KA, Rahbek, C. y Nogués-Bravo, D. Filogeografía: que abarca el continuo ecología-evolución. Ecografía 36, 1169-1181.
Artículo de Google Scholar
Bryant, D., Bouckaert, R., Felsenstein, J., Rosenberg, NA y RoyChoudhury, A. Inferir árboles de especies directamente a partir de marcadores genéticos bialélicos: sin pasar por árboles genéticos en un análisis coalescente completo. Mol. Biol. Evolución. 29, 1917-1932 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Zhang, C., Rabiee, M., Sayyari, E. & Mirarab, S. ASTRAL-III: reconstrucción de árboles de especies en tiempo polinomial a partir de árboles genéticos parcialmente resueltos. Bioinformación de BMC. 19, 153 (2018).
Artículo de Google Scholar
Stange, M., Sánchez-Villagra, MR, Salzburger, W. & Matschiner, M. La estimación bayesiana del tiempo de divergencia con datos de polimorfismo de un solo nucleótido de todo el genoma de bagres marinos (Ariidae) respalda el cierre del Mioceno del istmo panameño. Sistema. Biol. 67, 681–699 (2018).
Artículo PubMed PubMed Central Google Scholar
Hewitt, G. El legado genético de las glaciaciones cuaternarias. Naturaleza 405, 907–913 (2000).
Artículo CAS PubMed Google Scholar
Bringloe, TT, Verbruggen, H. & Saunders, GW La biodiversidad única en los bosques marinos del Ártico está determinada por diversas vías de recolonización y refugios glaciares del extremo norte. Proc. Acad. Nacional. Ciencia. Estados Unidos 117, 22590–22596 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Neiva, J. et al. La vicariancia glacial impulsa la diversificación filogeográfica en el alga anfiboreal Saccharina latissima. Saber Reps. 8, 1112 (2018).
Artículo PubMed PubMed Central Google Scholar
Marko, PB y cols. El modelo de 'expansión-contracción' de la biogeografía del Pleistoceno: ¿las costas rocosas sufren un cambio radical? Mol. Ecológico. 19, 146-169 (2010).
Artículo CAS PubMed Google Scholar
Hewitt, GM y Nichols, RA en Cambio climático y biodiversidad (eds Lovejoy, TE y Hannah. L.) 176–192 (Yale Univ. Press, 2005).
Duffy, JE y cols. Un legado del Pleistoceno estructura la variación en los ecosistemas de pastos marinos modernos. Proc. Acad. Nacional. Ciencia. Estados Unidos 119, e2121425119 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Clark, PU y cols. El último máximo glacial. Ciencia 325, 710–714 (2009).
Artículo CAS PubMed Google Scholar
Ma, X. et al. Mejora del ensamblaje del genoma a nivel de cromosomas y anotación de la hierba marina Zostera marina (pasto marino). F1000Investigación 10, 289 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Danilevicz, MF, Tay Fernandez, CG, Marsh, JI, Bayer, PE y Edwards, D. Pangenómica vegetal: enfoques, aplicaciones y avances. actual. Opinión. Biol vegetal. 54, 18-25 (2020).
Artículo CAS PubMed Google Scholar
Olsen, JL y cols. El genoma de la pradera marina Zostera marina revela la adaptación de las angiospermas al mar. Naturaleza 530, 331–335 (2016).
Artículo CAS PubMed Google Scholar
Pritchard, JK, Stephens, M. & Donnelly, P. Inferencia de la estructura poblacional utilizando datos de genotipos multilocus. Genética 155, 945–959 (2000).
Artículo CAS PubMed PubMed Central Google Scholar
Evanno, G., Regnaut, S. & Goudet, J. Detección del número de grupos de individuos utilizando el software STRUCTURE: un estudio de simulación. Mol. Ecológico. 14, 2611–2620 (2005).
Artículo CAS PubMed Google Scholar
Puechmaille, SJ La estructura del programa no recupera de manera confiable la estructura poblacional correcta cuando el muestreo es desigual: el submuestreo y nuevos estimadores alivian el problema. Mol. Ecológico. Recurso. 16, 608–627 (2016).
Artículo PubMed Google Scholar
Li, Y.-L. y Liu, J.-X. StructureSelector: un software basado en web para seleccionar y visualizar el número óptimo de clusters utilizando múltiples métodos. Mol. Ecológico. Recurso. 18, 176-177 (2018).
Artículo PubMed Google Scholar
Huson, DH y Bryant, D. Aplicación de redes filogenéticas en estudios evolutivos. Mol. Biol. Evolución. 23, 254–267 (2006).
Artículo CAS PubMed Google Scholar
Patterson, N. y col. Mezcla antigua en la historia de la humanidad. Genética 192, 1065–1093 (2012).
Artículo PubMed PubMed Central Google Scholar
Malinsky, M., Matschiner, M. & Svardal, H. Dsuite: estadísticas D rápidas y evidencia de mezclas relacionadas de archivos VCF. Mol. Ecológico. Recurso. 21, 584–595 (2021).
Artículo PubMed Google Scholar
Marincovich, L. & Gladenkov, AY Evidencia de una apertura temprana del Estrecho de Bering. Naturaleza 397, 149-151 (1999).
Artículo CAS Google Scholar
Zhang, C., Scornavacca, C., Molloy, EK & Mirarab, S. ASTRAL-Pro: inferencia de árbol de especies basada en cuarteto a pesar de la paralogía. Mol. Biol. Evolución. 37, 3292–3307 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Ogilvie, HA, Bouckaert, RR y Drummond, AJ StarBEAST2 ofrece una inferencia de árboles de especies más rápida y estimaciones precisas de las tasas de sustitución. Mol. Biol. Evolución. 34, 2101-2114 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Nguyen, L.-T., Schmidt, HA, von Haeseler, A. & Minh, BQ IQ-TREE: un algoritmo estocástico rápido y eficaz para estimar filogenias de máxima verosimilitud. Mol. Biol. Evolución. 32, 268–274 (2015).
Artículo CAS PubMed Google Scholar
Schiffels, S. y Durbin, R. Inferir el tamaño de la población humana y el historial de separación a partir de múltiples secuencias del genoma. Nat. Gineta. 46, 919–925 (2014).
Artículo CAS PubMed PubMed Central Google Scholar
Schiffels, S. y Wang, K. en Statistical Population Genomics págs. 147-166 (Humana, 2020).
Cortés, AJ, López-Hernández, F. & Osorio-Rodriguez, D. Predecir la adaptación térmica analizando el pasado genómico de las poblaciones. Frente. Gineta. 11, 564515 (2020).
Artículo PubMed PubMed Central Google Scholar
Gross, CP y cols. La biogeografía de la asamblea comunitaria: la latitud y la depredación impulsan la variación en la distribución de los rasgos comunitarios en un gremio de crustáceos epifaunales. Proc. R. Soc. B 289, 20211762 (2022).
Artículo PubMed PubMed Central Google Scholar
Gallagher, SJ y cols. Del Plioceno a la historia reciente de las corrientes de Kuroshio y Tsushima: un enfoque multiproxy. Prog. Planeta Tierra. Ciencia. 2, 17 (2015).
Artículo de Google Scholar
Burton, RS Filogeografía intraespecífica a través del límite biogeográfico de Point Conception. Evolución 52, 734–745 (1998).
Artículo PubMed Google Scholar
Checkley, DM & Barth, JA Patrones y procesos en el sistema actual de California. Prog. Oceanogr. 83, 49–64 (2009).
Artículo de Google Scholar
Talbot, SL et al. La estructura de la diversidad genética en el pasto marino (Zostera marina L.) a lo largo de las costas del Pacífico Norte y del Mar de Bering en Alaska. MÁS UNO 11, e0152701 (2016).
Artículo PubMed PubMed Central Google Scholar
Laakkonen, HM, Hardman, M., Strelkov, P. & Väinölä, R. Ciclos de dispersión y vicarianza transártica y diversificación de la fauna marina anfiboreal. J.Evol. Biol. 34, 73–96 (2021).
Artículo PubMed Google Scholar
Coyer, JA, Hoarau, G., Van Schaik, J., Luijckx, P. & Olsen, JL Las vías transpacíficas y transárticas de la macroalga intermareal Fucus distichus L. revelan múltiples refugios glaciales y colonizaciones desde el Pacífico norte hasta el Atlántico Norte. J. Biogeogr. 38, 756–771 (2011).
Artículo de Google Scholar
Maggs, CA y cols. Evaluación de señales de refugios glaciares para taxones bentónicos del Atlántico norte. Ecología 89, S108 – S122 (2008).
Artículo PubMed Google Scholar
Jenkins, T., Castilho, R. & Stevens, J. El metanálisis de taxones marinos del Atlántico nororiental muestra patrones filogeográficos contrastantes después de las expansiones posteriores a LGM. PeerJ 6, e5684 (2018).
Artículo PubMed PubMed Central Google Scholar
Li, J.-J., Hu, Z.-M. y Duan, D.-L. en Filogeografía de algas marinas: adaptación y evolución de las algas marinas bajo cambio ambiental (eds Hu, Z.-M. & Fraser, C.) 309–330 (Springer, 2016).
Olsen, JL y cols. Filogeografía del Atlántico norte y diferenciación poblacional a gran escala de los pastos marinos Zostera marina L. Mol. Ecológico. 13, 1923-1941 (2004).
Artículo CAS PubMed Google Scholar
Larkum, AWD, Orth, RJ y Duarte, CM Pastos marinos: biología, ecología y conservación (Springer, 2006).
Palumbi, SR Divergencia genética, aislamiento reproductivo y especiación marina. Año. Rev. Ecológico. Sistema. 25, 547–572 (1994).
Artículo de Google Scholar
Franssen, SU et al. Resiliencia transcriptómica al calentamiento global en la pradera marina Zostera marina, una especie de fundación marina. Proc. Nacional. Acad. Ciencia. Estados Unidos 108, 19276–19281 (2011).
Artículo CAS PubMed PubMed Central Google Scholar
Bertelli, CM & Unsworth, RKF Protegiendo la mano que nos alimenta: los pastos marinos (Zostera marina) sirven como hábitat comercial para peces juveniles. Mar. Contaminación. Toro. 83, 425–429 (2014).
Artículo CAS PubMed Google Scholar
Reusch, TBH y cols. Vibrio spp. inferior. La abundancia en las marquesinas de hojas de Zostera marina sugiere una nueva función ecosistémica para los lechos de pastos marinos templados. Mar. Biol. 168, 149 (2021).
Artículo de Google Scholar
Macreadie, PI y cols. El carbono azul como solución climática natural. Nat. Rev. Medio Ambiente de la Tierra, https://doi.org/10.1038/s43017-021-00224-1 (2021).
Artículo de Google Scholar
Stevenson, A., Corcora, TC Ó., Hukriede, W., Schubert, P. & Reusch, TBH Las importantes reservas de carbono azul de pastos marinos en el suroeste del Mar Báltico son espacialmente heterogéneas, en su mayoría autóctonas e incluyen turberas históricamente terrestres. Frente. Marzo ciencia. 9, 949101 (2022).
Artículo de Google Scholar
Hämmerli, A. & Reusch, TBH Apareamiento flexible: cambio de proporción de sexos inducido experimentalmente en una planta clonal marina. J.Evol. Biol. 16, 1096-1105 (2003).
Artículo PubMed Google Scholar
Reusch, TBH Polinización en el ámbito marino: los microsatélites revelan altas tasas de cruzamiento y paternidad múltiple en la hierba marina Zostera marina. Herencia 85, 459–465 (2000).
Artículo PubMed Google Scholar
Yu, L. et al. Deriva genética somática y selección multinivel en una pradera marina clonal. Nat. Ecológico. Evolución. 4, 952–962 (2020).
Artículo PubMed Google Scholar
Reusch, TBH, Boström, C., Stam, WT y Olsen, JL Un antiguo clon de pasto marino en el Mar Báltico. Mar. Ecología. Prog. Ser. 183, 301–304 (1999).
Artículo de Google Scholar
Ewels, P., Magnusson, M., Lundin, S. & Käller, M. MultiQC: resumen los resultados del análisis para múltiples herramientas y muestras en un solo informe. Bioinformática 32, 3047–3048 (2016).
Artículo CAS PubMed PubMed Central Google Scholar
Georganas, E. et al. En SC '15: Proc. Conferencia internacional sobre informática, redes, almacenamiento y análisis de alto rendimiento, págs. 1 a 11 (2015).
Kent, WJ BLAT: la herramienta de alineación tipo BLAST. Genoma Res. 12, 656–664 (2002).
CAS PubMed PubMed Central Google Académico
Jombart, T. adegenet: un paquete R para el análisis multivariado de marcadores genéticos. Bioinformática 24, 1403-1405 (2008).
Artículo CAS PubMed Google Scholar
Li, H. y Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754-1760 (2009).
Artículo CAS PubMed PubMed Central Google Scholar
Van der Auwera, GA y O'Connor, BD Genomics en la nube: uso de Docker, GATK y WDL en Terra (O'Reilly Media, 2020).
Li, H. Un marco estadístico para la llamada de SNP, el descubrimiento de mutaciones, el mapeo de asociaciones y la estimación de parámetros genéticos de poblaciones a partir de datos de secuenciación. Bioinformática 27, 2987–2993 (2011).
Artículo CAS PubMed PubMed Central Google Scholar
Danecek, P. y col. El formato de llamada variante y VCFtools. Bioinformática 27, 2156–2158 (2011).
Artículo CAS PubMed PubMed Central Google Scholar
Quinlan, AR & Hall, IM BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática 26, 841–842 (2010).
Artículo CAS PubMed PubMed Central Google Scholar
Yu, L., Stachowicz, JJ, DuBois, K. & Reusch, TBH Detección de pares clonados en especies clonales diploides multicelulares basándose en un índice de heterocigosidad compartido. Mol. Ecológico. Recurso. 23, 592–600 (2023).
Artículo CAS PubMed Google Scholar
Dierckxsens, N., Mardulyn, P. y Smits, G. NOVOplastia: ensamblaje de novo de genomas de orgánulos a partir de datos del genoma completo. Ácidos nucleicos res. 45, e18 (2017).
PubMed Google Académico
Petit, RJ y Vendramin, GG en Filogeografía de los refugios del sur de Europa: perspectivas evolutivas sobre los orígenes y la conservación de la biodiversidad europea (eds Weiss, S. y Ferrand, N.) 23–97 (Springer, 2007).
Knaus, BJ & Grünwald, NJ vcfr: un paquete para manipular y visualizar datos de formato de llamada variante en R. Mol. Ecológico. Recurso. 17, 44–53 (2017).
Artículo CAS PubMed Google Scholar
Bandelt, HJ, Forster, P. y Röhl, A. Redes de unión de medianas para inferir filogenias intraespecíficas. Mol. Biol. Evolución. 16, 37–48 (1999).
Artículo CAS PubMed Google Scholar
Leigh, JW y Bryant, D. popart: software con todas las funciones para la construcción de redes de haplotipos. Métodos Ecología. Evolución. 6, 1110-1116 (2015).
Artículo de Google Scholar
Kumar, S., Stecher, G., Li, M., Knyaz, C. y Tamura, K. MEGA X: análisis de genética evolutiva molecular en plataformas informáticas. Mol. Biol. Evolución. 35, 1547-1549 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Pembleton, LW, Cogan, NOI y Forster, JW StAMPP: un paquete R para el cálculo de la diferenciación genética y la estructura de poblaciones de nivel de ploidía mixta. Mol. Ecológico. Recurso. 13, 946–952 (2013).
Artículo CAS PubMed Google Scholar
Collin, F.-D. et al. Ampliación del cálculo bayesiano aproximado con aprendizaje automático supervisado para inferir la historia demográfica a partir de polimorfismos genéticos utilizando DIYABC Random Forest. Mol. Ecológico. Recurso. 21, 2598–2613 (2021).
Artículo PubMed PubMed Central Google Scholar
Murphy, GEP y cols. De costa a costa a costa: ecología y gestión de ecosistemas de pastos marinos en todo Canadá. FACETAS 6, 139–179 (2021).
Artículo de Google Scholar
Jahnke, M. y col. La genética del paisaje marino y los modelos de conectividad biofísica respaldan la conservación de la pradera marina Zostera en la región de Skagerrak-Kattegat en el este del Mar del Norte. Evolución. Aplica. 11, 645–661 (2018).
Artículo PubMed PubMed Central Google Scholar
Letunic, I. & Bork, P. Interactive Tree Of Life (iTOL) v5: una herramienta en línea para la visualización y anotación de árboles filogenéticos. Ácidos nucleicos res. 49, W293–W296 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Descargar referencias
Este estudio fue financiado por una beca de doctorado del Consejo de Becas de China para LY (número 201704910807), por una beca para MK en la Escuela Helmholtz de Ciencias de Datos Marinos (número de subvención HIDSS-0005) y por una beca para J. Eisen, JJS y JLO del Programa de secuenciación comunitaria del Instituto Conjunto del Genoma del Departamento de Energía de EE. UU. (CSP 502951, 2016, Población y genómica evolutiva de las interacciones huésped-microbioma en Zostera marina y otros pastos marinos). El trabajo (propuesta 10.46936/10.25585/60000773) realizado por el Instituto Conjunto del Genoma del Departamento de Energía de EE. UU. (https://ror.org/04xm1d337), una instalación para usuarios de la Oficina de Ciencias del Departamento de Energía de EE. UU., cuenta con el apoyo de la Oficina de Ciencias del Departamento de Energía de EE.UU. operado bajo el Contrato No. DE-AC02-05CH11231. El muestreo de campo fue apoyado por la Fundación Nacional de Ciencias (OCE-1336206 para JED y OCE-1829976 para JJS). Cualquier uso de nombres comerciales, de empresas o de productos tiene fines descriptivos únicamente y no implica respaldo por parte del gobierno de los EE. UU. Agradecemos a X. Zhang por proporcionar el genoma de referencia inédito de Zostera japonica para predecir las secuencias codificantes, a Susanne Landis (scienstration) por ayudarnos con figuras e ilustraciones y a muchos otros miembros de la Red Experimental Zostera. Agradecemos a T. Bayer por las discusiones sobre problemas bioinformáticos y a Y. Li por su ayuda con el análisis ABC-RF.
Financiamiento de acceso abierto proporcionado por el Centro GEOMAR Helmholtz de Investigación Oceánica de Kiel.
Ecología Evolutiva Marina, Centro GEOMAR Helmholtz de Investigación Oceánica Kiel, Kiel, Alemania
Lei Yu, Marina Khachaturyan, Diana Gill y Thorsten BH Reusch
Instituto de Microbiología General, Universidad de Kiel, Kiel, Alemania
Marina Khachaturyan y Tal Dagan
Departamento de Paleontología y Museo, Universidad de Zurich, Zurich, Suiza
Michael Matschiner
Museo de Historia Natural, Universidad de Oslo, Oslo, Noruega
Michael Matschiner
Centro de secuenciación del genoma, Instituto HudsonAlpha de Biotecnología, Huntsville, AL, EE. UU.
Adam Healey, Jane Grimwood, Jerry Jenkins, Sujan Mamidi y Jeremy Schmutz
Instituto Conjunto del Genoma del Departamento de Energía de EE. UU., Laboratorio Nacional Lawrence Berkeley, Berkeley, CA, EE. UU.
Diane Bauer, Keykhosrow Keymanesh, Christa Pennacchio y Jeremy Schmutz
Departamento de Evolución y Ecología, Universidad de California, Davis, CA, EE. UU.
Brenda Cameron, Jonathan A. Eisen y John J. Stachowicz
Departamento de Ciencias Básicas, Université du Québec à Chicoutimi, Chicoutimi, Quebec, Canadá
Mateo Cusson
Red de Observatorios Marinos Tennenbaum, Centro Smithsonian de Investigación Ambiental, Edgewater, MD, EE. UU.
J. Emmett Duffy
Instituto de Ciencias Marinas (UNC-CH), Morehead City, Carolina del Norte, EE. UU.
F. Joel Fodrie
Agencia Japonesa de Educación e Investigación Pesquera, Yokohama, Japón
Masakazu Hori
Departamento de Biología, Universidad Estatal de San Diego, San Diego, CA, EE. UU.
Kevin Hovel
Centro de Ciencias Marinas, Universidad Northeastern, Nahant, MA, EE. UU.
Randall Hughes
Laboratorio Marino Tjärnö, Departamento de Ciencias Marinas, Universidad de Gotemburgo, Strömstad, Suecia
Marlene Jahnke
Universidad de Zadar, Zadar, Croacia
Claudia Kruschel y Stewart T. Schultz
Servicio Geológico de EE. UU., Centro de Ciencias de Alaska, Anchorage, AK, EE. UU.
Damián M. Menning y David H. Ward
Departamento de Ciencias Marinas, Universidad de Gotemburgo, Gotemburgo, Suecia
Per-Olav Moksnes
Universidad de Hokkaido, Akkeshi, Japón
Masahiro Nakaoka
Universidad del Norte, Bodø, Noruega
Katrin Reiss
Departamento de Ecología Marina Integrativa (EMI), Stazione Zoologica Anton Dohrn – Instituto Nacional de Biología, Ecología y Biotecnología Marinas, Génova, Italia
francesca rossi
Departamento de Biología, Universidad de Washington, Seattle, WA, EE. UU.
Jennifer Ruesink
Instituto Far Northwestern de Arte y Ciencia, Anchorage, Alaska, EE. UU.
Sandra Talbot
Departamento de Biociencias, Universidad de Swansea, Swansea, Reino Unido
Richard Unsworth
Proyecto Seagrass, The Yard, Bridgend, Reino Unido
Richard Unsworth
Centro de Biología de Poblaciones, Universidad de California, Davis, CA, EE. UU.
John J. Stachowicz
Departamento de Biotecnología Vegetal y Bioinformática, Universidad de Gante y Centro VIB-UGent de Biología de Sistemas Vegetales, Gante, Bélgica
Yves Van De Peer
Centro de Genómica y Ecología Microbiana, Departamento de Bioquímica, Genética y Microbiología, Universidad de Pretoria, Pretoria, Sudáfrica
Yves Van De Peer
Facultad de Horticultura, Academia de Estudios Interdisciplinarios Avanzados, Universidad Agrícola de Nanjing, Nanjing, China
Yves Van De Peer
Instituto de Ciencias Biológicas Evolutivas de Groningen, Groningen, Países Bajos
Jeanine Olsen
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
JAE, JJS, JS, JLO y TBHR concibieron y diseñaron el estudio; MK analizó los datos de los cloroplastos; LY, MM y AH realizaron los análisis filogenéticos; AH identificó los genes centrales; LY calculó el estadístico D con la ayuda de MM; LY realizó todos los demás análisis; BC y DG ayudaron con la adquisición de muestras y la extracción de ADN; JG, KK y CP realizaron la secuenciación del ADN; JG, JJ, SM, JS, TD y YVdP ayudaron con los análisis bioinformáticos; MC, JED, FJF, ARH, MH, MJ, CK, DMM, P.-OM, MN, KR, FR, JLR, SS, JJS, ST, RU y DHW proporcionaron acceso a los sitios de muestreo y realizaron el muestreo de muestras; JJS compiló la tabla sobre fauna asociada a pastos marinos; LY, MK, MM, AH, JLO, TD y TBHR discutieron e interpretaron los resultados; LY, JLO y TBHR escribieron el artículo. Todos los autores comentaron versiones anteriores del manuscrito.
Correspondencia a Thorsten BH Reusch.
Los autores declaran no tener conflictos de intereses.
Nature Plants agradece a Qing-Feng Wang, Richard Hodel y Sandra Lindstrom por su contribución a la revisión por pares de este trabajo.
Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Con base en genomas de cloroplastos completamente secuenciados, se incluyeron 108 SNP informativos sobre la parsimonia presentes en al menos dos muestras. La topología de árbol admite la topología de red de haplotipos con valores de arranque altos. El árbol fue reconstruido por IQ-TREE v1.5.5 con 1000 ejecuciones de arranque32 y visualizado por iTOL (ref. 78).
Los valores de la estadística D (también conocidos como estadísticas ABBA-BABA) se presentan como un mapa de calor de dos colores, donde la intensidad del rojo indica valores D más altos. Los colores más saturados hacia el borde inferior de la leyenda de color indican una significancia estadística creciente (log(p)). Los valores D altos y significativos indican una mezcla entre dos pares de poblaciones cualesquiera, pero no se puede estimar la dirección del flujo de genes. Una señal de mezcla puede ser causada por un flujo directo de genes entre las dos poblaciones o por un aporte genético de una tercera población no muestreada.
Notas complementarias 1 a 8, tablas 1 a 6 y figs. 1–12.
Tabla de datos suplementarios 1: Cobertura de secuencia. Tabla de datos suplementarios 2: Tasa de mapeo. Tabla de datos suplementarios 3: Número de acceso de cada biblioteca.
Datos brutos sobre la diversidad de nucleótidos (1b) y la heterocigosidad poblacional (1c) para cada muestra en las 16 poblaciones.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Yu, L., Khachaturyan, M., Matschiner, M. et al. Los patrones de las corrientes oceánicas impulsan la colonización mundial de la hierba marina (Zostera marina). Nat. Plantas (2023). https://doi.org/10.1038/s41477-023-01464-3
Descargar cita
Recibido: 30 de diciembre de 2022
Aceptado: 21 de junio de 2023
Publicado: 20 de julio de 2023
DOI: https://doi.org/10.1038/s41477-023-01464-3
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt