Unabhängige Rediploidisierungsmasken teilten die Vervielfältigung des gesamten Genoms beim Stör
Nature Communications Band 14, Artikelnummer: 2879 (2023) Diesen Artikel zitieren
2334 Zugriffe
82 Altmetrisch
Details zu den Metriken
Die Vervielfältigung des gesamten Genoms (WGD) ist ein dramatisches evolutionäres Ereignis, das viele neue Gene hervorbringt und möglicherweise eine Rolle beim Überleben durch Massenaussterben spielt. Paddelfische und Störe sind Schwesterlinien, die beide genomische Hinweise auf eine alte WGD aufweisen. Bisher wurde dies als zwei unabhängige WGD-Ereignisse interpretiert, da es überwiegend doppelte Gene mit unabhängigen Vorgeschichten gibt. Hier zeigen wir, dass es zwar tatsächlich eine Vielzahl scheinbar unabhängiger Genduplikationen gibt, diese jedoch auf ein gemeinsames Genomduplikationsereignis zurückzuführen sind, das vor weit über 200 Millionen Jahren stattfand, wahrscheinlich kurz vor dem Massenaussterben im Perm und der Trias. Darauf folgte ein längerer Prozess der Rückkehr zu einer stabilen diploiden Vererbung (Rediploidisierung), der möglicherweise das Überleben während des Massenaussterbens in Trias und Jura gefördert hat. Wir zeigen, dass die gemeinsame Nutzung dieser WGD durch die Tatsache verschleiert wird, dass es zu einer Divergenz der Abstammungslinien von Paddelfischen und Stören kam, bevor die Rediploidisierung auch nur zur Hälfte fortgeschritten war. Daher war die Auflösung der Diploidie bei den meisten Genen abstammungsspezifisch. Da Gene erst dann wirklich dupliziert werden, wenn die diploide Vererbung etabliert ist, sind die Paddelfisch- und Störgenome somit ein Mosaik aus gemeinsamen und nicht gemeinsamen Genduplikationen, die aus einem gemeinsamen Genomduplikationsereignis resultieren.
Uralte WGD-Ereignisse sind im gesamten Lebensbaum aufgetreten und wurden besonders gut bei Pflanzen1,2,3,4, Hefen5,6 und Wirbeltieren7,8,9,10,11,12,13,14,15,16,17 untersucht ,18. Es wird oft angenommen, dass diese Ereignisse den evolutionären Erfolg durch die Bereitstellung des genetischen Rohmaterials für phänotypische Innovation und Artendiversifizierung erleichtert haben1,19,20,21,22,23. Ein wichtiger evolutionärer Prozess nach WGD ist die Rediploidisierung – der Übergang eines polyploiden, normalerweise tetraploiden Genoms in einen stabileren diploiden Zustand1,7,9,14,22,23,24,25. Wichtig in diesem Zusammenhang ist, dass WGD-Ereignisse entweder aus der Hybridisierung zweier verschiedener Elternarten (Allopolyploidisierung) oder aus der Verdoppelung desselben Genoms auf der Ebene innerhalb der Spezies/des Individuums (Autopolyploidisierung) resultieren, jeweils mit unterschiedlichen zytogenetischen Ergebnissen. Klassischerweise paaren sich die nicht homologen Chromosomen neuer Allopolyploide während der Meiose vorzugsweise bivalent, wohingegen die vier homologen Chromosomen neuer Autopolyploide eine multivalente Formation eingehen1,9,14,22,24. Dies führt zu einer fortlaufenden homologen Rekombination und damit zu einer Genumwandlung und Homogenisierung über die vier Allelkopien an jedem Locus. Die Unterdrückung der Rekombination, die wahrscheinlich durch chromosomale Umlagerungen und andere Mutationen erreicht wird, ist ein notwendiger Schritt, um diese Gene aus tetraploiden Allelen in zwei unterschiedliche (bivalente) Ohnolog-Loci (WGD-abgeleitete doppelte Gene) zu rediploidisieren. Nur dann kann es zu einer ununterbrochenen Abfolge und funktionellen Divergenz zwischen ohnologen Paaren kommen24. Der Rediploidisierungsprozess entkoppelt somit den Genomduplikationsprozess vom Genduplikationsprozess in Autopolyploiden, da der Locus erst dann als dupliziert betrachtet werden kann, wenn die Rediploidisierung stattgefunden hat.
Umfangreiche Belege aus Studien des Vorfahren-Salmoniden WGD18,24,26 und des Vorfahren-Teleost WGD13,27,28 deuten darauf hin, dass die autopolyploide Rediploidisierung zeitlich in die Länge gezogen werden kann und über mehrere zehn Millionen Jahre asynchron im gesamten Genom abläuft13,18,24,26 ,27,28. Große Auswirkungen ergeben sich aus der damit einhergehenden Verzögerung aller Evolutionsprozesse, die von der ohnologischen genetischen Divergenz abhängen24. Dazu gehören gut etablierte Modelle der funktionellen Evolution nach Genduplikation, z. B. Sub-/Neofunktionalisierung29,30, und Modelle der reproduktiven Isolation, die den gegenseitigen Verlust von Ohnologen in Schwesterlinien beinhalten31. Wenn darüber hinaus die Artbildung erfolgt, bevor die Rediploidisierung in Nachkommenlinien derselben WGD abgeschlossen ist, kann die Rediploidisierung in einigen Genomregionen unabhängig in diesen Tochterlinien erfolgen (linienspezifische Rediploidisierung). Dies wiederum ermöglicht es Ohnolog-Paaren, unabhängig voneinander unterschiedliche regulatorische und funktionelle Trajektorien in jeder Abstammungslinie zu entwickeln, möglicherweise als Reaktion auf abstammungsspezifischen Selektionsdruck24. Es wurde beschrieben, dass Ohnologs mit dieser Geschichte dem LORe-Modell (Lineage-spezifische Ohnolog Resolution) folgen24.
Obwohl dies als potenziell wichtiger evolutionärer Prozess nach mehreren WGDs angesehen wird4,8,12,24,27,32,33,34, bleibt unklar, ob asynchrone und linienspezifische Rediploidisierung ein allgemeines Merkmal nach autopolyploiden WGDs außerhalb der Teleostgruppe ist. In den letzten Jahren wurden qualitativ hochwertige Referenzgenome aus mehreren Abstammungslinien von Nicht-Teleost-Rochenflossenfischen generiert7,8,35,36, die die beiden alten WGD-Runden gemeinsam haben, die allen Kieferwirbeltieren gemeinsam sind9,11,37, aber fehlt das teleostspezifische WGD-Ereignis7,8,35,36,38,39. Diese Arten verfügen typischerweise über sich langsam entwickelnde Genome, was eine zuverlässigere Rückschlüsse auf den angestammten Zustand von Knochenwirbeltieren als Knochenwirbeltieren ermöglicht und gleichzeitig Außengruppen bietet, um die Auswirkungen des Knochenfisch-spezifischen WGD-Ereignisses zu verstehen7,8,35,36,39. Zu diesen neu verfügbaren Genomen gehören Chromosomen-Anordnungen für den Sterlet-Stör (Acipenser ruthenus)7 und den Amerikanischen Paddelfisch (Polyodon spathula)8, die jeweils in ihrer Evolutionsgeschichte WGD erlebt haben.
Während der Evolution des Störs sind mehrere WGD-Ereignisse aufgetreten, aber in der Geschichte des Sterlet-Störs gibt es nur eines, von dem man annimmt, dass es bei allen Stören auftritt7,40,41,42. Andererseits ist der Amerikanische Paddelfisch der einzige noch existierende Paddelfisch43 und es wird vermutet, dass er ein einziges WGD-Ereignis durchgemacht hat8,35,44,45,46. Obwohl es sich um Schwesterlinien handelt, die zusammen vorhandene Acipenseriformes repräsentieren, haben frühere Analysen eine gemeinsame WGD der Vorfahren zugunsten unabhängiger WGD-Ereignisse konsequent abgelehnt (Abb. 1)8,35,38,44,45. Bisherige Bemühungen, diese WGDs zu datieren, haben zu widersprüchlichen Ergebnissen geführt, wobei die Schätzungen zwischen 21,3 Ma38, 51 Ma35 und 180 Ma7 für den Stör-WGD und 41,7 Ma44, ~50 Ma8 und 121 Ma35 für den Paddelfisch-WGD liegen. Obwohl einige Autoren angedeutet haben, dass die asynchrone Rediploidisierung zu der beobachteten Inkongruenz zwischen den Studien beitragen könnte8,44, wurde dieser Prozess bei der Datierung dieser WGDs ignoriert. Darüber hinaus wurde das Potenzial einer genomweiten, abstammungsspezifischen Rediploidisierung (z. B. 13, 24, 26) zur Maskierung eines gemeinsamen WGD-Ereignisses in keiner Abstammungslinie offiziell vorgeschlagen oder getestet.
Szenario 1 ist die weithin akzeptierte Hypothese unabhängiger WGD-Ereignisse in den Abstammungslinien der Störe und Paddelfische. Szenario 2 ist eine gemeinsame Ahnen-WGD mit vollständiger Rediploidisierung vor der Abstammungsdivergenz. Szenario 3 erweitert Szenario 2, indem es die Möglichkeit einer Artbildung während eines längeren, asynchronen Rediploidisierungsprozesses nach einem gemeinsamen WGD-Ereignis berücksichtigt. In diesem Fall folgen Gene, die vor der Artbildung rediploidisieren, dem in Szenario 2 erwarteten Genbaum, während Gene, die nach der Artbildung rediploidisieren (d. h. linienspezifische Rediploidisierung), dem in Szenario 1 erwarteten Genbaum folgen. Dies unterscheidet sich von der unabhängigen Duplikation im kleinen Maßstab unter Verwendung von Erwartung, dass Ohnolog-Paare die angestammte Kollinearität zwischen nicht überlappenden doppelten Chromosomenregionen weitgehend beibehalten. Rediploidisierungsereignisse und damit verbundene Genbäume nach der Stör-Paddelfisch-Artbildung sind in Rot dargestellt, diejenigen vor der Artbildung sind in Blau dargestellt.
Mithilfe eines phylogenomischen Ansatzes überdenken wir hier den Zeitpunkt von WGD(s) im Verhältnis zur Stör-Paddelfisch-Divergenz und berücksichtigen dabei die Möglichkeit einer linienspezifischen Rediploidisierung nach einem gemeinsamen WGD. Indem wir darauf achten, unsere Ergebnisse von phylogenetischen Fehlern zu unterscheiden, und uns auf konservierte Syntenie stützen, liefern wir starke Beweise für eine einzelne Vorfahren-Autopolyploidie, die in der Nähe des Perm-Trias-Aussterbeereignisses auftrat. Darauf folgte eine umfassende linienspezifische Rediploidisierung, die darauf zurückzuführen war, dass das acipenseriforme Genom der Vorfahren zum Zeitpunkt der Divergenz zwischen Stör und Paddelfisch überwiegend tetraploid blieb, ein genomischer Zustand, der möglicherweise das Überleben der Linie während des Massenaussterbens im Trias und Jura gefördert hat.
Frühere Studien zur Beurteilung des Zeitpunkts von WGD(s) in der acipenseriformen Geschichte haben nach einer einzigen Konsens-Ohnologen-Divergenzzeit im Verhältnis zur Artbildung gesucht8,35,44. Dieser Ansatz hält zwei Szenarien für plausibel: (1) Wenn eine Vielzahl von Ohnolog-Genbäumen nach der Divergenz zwischen Stör und Paddelfisch unabhängige Duplikationsknoten wiederherstellen, wird davon ausgegangen, dass Störe und Paddelfische unabhängige WGDs durchlaufen haben (derzeit akzeptierte Hypothese) (Abb. 1, Szenario). 1); und (2) wenn mehrere Ohnolog-Genbäume Duplikationsknoten aufweisen, die vor der Stör-Paddelfisch-Divergenz liegen, kann von einem einzelnen WGD-Ereignis der Vorfahren ausgegangen werden (typischerweise abgelehnte Hypothese) (Abb. 1, Szenario 2). Diese Interpretationen gehen implizit davon aus, dass alle Ohnologen denselben Rediploidisierungszeitpunkt haben. Hier betrachten wir ein drittes plausibles Szenario, wie es bereits zuvor nach den WGD-Ereignissen der Vorfahren von Salmoniden und Knochenfischen beobachtet wurde 13, 18, 24, 26: (3) eine gemeinsame WGD, gefolgt von einem verlängerten Rediploidisierungsprozess, der vor der Artbildung beginnt, aber nach der Artbildung andauert. Dies sagt das Vorhandensein von zwei unterschiedlichen Untergruppen von Ohnolog-Genbäumen voraus, eine mit Duplikationsknoten vor der Stör-Paddelfisch-Divergenz und die andere mit unabhängigen Duplikationsknoten nach der Artbildung (Abb. 1, Szenario 3).
Um zwischen diesen Szenarien zu unterscheiden, bauten wir auf einer Reihe von Ohnologen mit hoher Zuverlässigkeit auf, die zuvor im Störgenom7 identifiziert wurden, und integrierten umfangreiche zusätzliche phylogenetische und syntenische Beweise. Insbesondere haben wir eine breite Stichprobe vorhergesagter Proteome aus Kieferwirbeltiergenomen einbezogen, darunter auch aus neu verfügbaren Rochenflossenfischen ohne Knochenflossen. Dadurch konnten wir 5.439 Protein-kodierende Genfamilien definieren, die Ohnolog-Paare mit hoher Zuverlässigkeit sowohl im Stör als auch im Paddelfisch enthalten. Bei der Analyse der Maximum-Likelihood-Genbäume für jede Familie stellten wir fest, dass der Genbaum mit unabhängigen Duplikationsknoten die am häufigsten wiederhergestellte Topologie war (im Folgenden: „PostSpec“ für Post-Speciation-Duplikationsknoten, wie in Szenario 1 und Szenario 3 rechts). 2074 Mal (38,13 % aller Bäume; Abb. 2A). Die alternative Ohnolog-Paar-Topologie mit einem gemeinsamen Duplikationsknoten („PreSpec“ für Pre-Speciation, wie in Szenario 2 und Szenario 3-Mitte) wurde 1448 Mal wiederhergestellt (26,62 % aller Bäume; Abb. 2A). Die verbleibenden Genbäume (1917, 35,25 %; „Andere“ für andere Topologien als PostSpec oder PreSpec) konnten keine dieser Topologien wiederherstellen.
Eine Kategorisierung der 15 möglichen verwurzelten Stör-Paddelfisch-Unterbäume mit Duplikationsknoten vor („PreSpec“) oder nach („PostSpec“) der Divergenz dieser Arten und „Andere“ Bäume, die nur teilweise mit einem dieser Szenarios übereinstimmen (entweder „PreSpec“) -like‘ oder ‚PostSpec-like‘). Das Kreisdiagramm quantifiziert die relative Häufigkeit, mit der jede Topologie wiederhergestellt wurde. B Drei mögliche unbewurzelte Stör-Paddelfisch-Teilbäume (zwei „PreSpec-Typ“, links; und ein „PostSpec-Typ“, Mitte) und Approximately Unbiased (AU)-Test (rechts) der Baumzuverlässigkeit, um zu bestimmen, wie häufig Datensätze von jedem stammen Die in Teil (A) beschriebene Kategorie des verwurzelten Teilbaums kann einen gegebenen unverwurzelten Topologiekategorietyp entschieden ablehnen und dadurch den anderen bevorzugen. C Verwurzelte Teilbaum-Topologiekategorie (aufgeschlüsselt nach den Ebenen „Andere“, „PostSpec“, „PreSpec“) Anzahl (oben links), Prozentsatz (oben rechts) und fache Abweichung der Baumanzahl pro Kategorie von zufälligen Erwartungen (d. h. wie geschätzt). wenn jeder der 15 Wurzelbäume gleich häufig wiederhergestellt wurde; unten) unter immer strengeren UFBoot-Prozentsatzgrenzen, sodass beide UFBoot-Prozentsätze in einem bestimmten Unterbaum größer oder gleich dem Grenzwert sein müssen, damit dieser Baum erhalten bleibt. D Prozentsatz der Bäume, die zu jeder Stör-Paddelfisch-Unterbaumkategorie passen und andere wichtige unbestrittene Kladen bergen. E Zusammenfassung der signifikanten Unterschiede zwischen Sequenzausrichtung, Modellierung und baumbasierten Statistiken für jede Teilbaumkategorie (ergänzende Abbildung 1 enthält Violin-/Boxdiagramme mit p-Werten). Quelldaten werden als Quelldatendatei bereitgestellt. Roh-Alignments, Genbäume und Genbaum-Parsing-Code werden auf figshare106 bereitgestellt.
Die häufige Wiederherstellung der PostSpec-Topologie erklärt wahrscheinlich, warum frühere Studien darauf schließen ließen, dass Störe und Paddelfische unabhängige WGDs durchlaufen haben8,35,38,44,45 (Szenario 1; Abb. 1), jedoch die hohe Prävalenz der PreSpec-Topologie und „anderer“ Topologien in unseren Analysen bedarf einer Erklärung. Erstens steht die häufige Wiederherstellung sowohl der PreSpec- als auch der PostSpec-Topologie im Einklang mit einer gemeinsamen WGD, gefolgt von einer anhaltenden Rediploidisierung, die über die Stör-Paddelfisch-Artbildung hinausgeht (Szenario 3; Abb. 1). In diesem Fall sind die PreSpec- und PostSpec-Topologien direkt auf die vorfahren- und abstammungsspezifischen Ohnolog-Auflösungsmodelle (genannt „AORe“ und „LORe“) abgebildet, die zuvor in Salmoniden24 beschrieben wurden. Angesichts des hohen Anteils abgeleiteter „anderer“ Topologien ist es jedoch wichtig zu prüfen, ob die Variabilität der Schätzungen der ohnologischen Divergenzzeit durch phylogenetische Fehler beeinflusst wird. Ebenso ist es trotz unserer Bemühungen, eine Reihe hochzuverlässiger Ohnologs zu definieren, wichtig sicherzustellen, dass Duplikationsereignisse im kleinen Maßstab nicht die Wiederherstellung der PreSpec- oder PostSpec-Topologien vorantreiben.
Um den möglichen Einfluss phylogenetischer Fehler auf unsere Ergebnisse zu bestimmen, haben wir Faktoren berücksichtigt, die möglicherweise die ursprünglich wiederhergestellten Baumtopologien beeinflusst haben. Das entscheidende Verzweigungsmuster, das unseren konkurrierenden Hypothesen zugrunde liegt, ist die Klade in jedem verwurzelten Genstammbaum, bestehend aus den Paddelfisch- und Stör-Ohnolog-Paaren (dh ein Unterbaum mit vier Genen). Zunächst betrachteten wir die Wiederherstellung von drei breiten Topologiekategorien (PostSpec, PreSpec, „Andere“; Abb. 2A) im Lichte der 15 möglichen Wurzeltopologien, die ein Vier-Taxon-Baum annehmen kann. Eine dieser 15 Topologien ist PostSpec zugeordnet, zwei sind PreSpec und die restlichen 12 sind „Andere“ Topologien zugeordnet (Abb. 2A). Allerdings lassen sich diese „anderen“ Topologien natürlich in zwei Kategorien einteilen; „PostSpec-like“ und „PreSpec-like“, die jeweils mit einer Häufigkeit wiederhergestellt wurden, die ihrer nächstgelegenen Haupttopologie (d. h. PostSpec/PreSpec) entspricht, und erfordern nur eine einzige Zweigänderung (was durch eine Nebentopologie erklärt werden könnte). Inferenzfehler), der als PostSpec bzw. PreSpec wiederhergestellt werden soll (Abb. 2A). Darüber hinaus wären solche geringfügigen Topologieunterschiede nicht von ihrer nächstgelegenen Haupttopologie (PostSpec/PreSpec) zu unterscheiden, wenn die Bäume keine Wurzeln hätten (Abb. 2A, B). Die PostSpec- und PreSpec-Topologien, jedoch nicht „Andere“ Topologien, werden häufiger wiederhergestellt, als es durch Zufall zu erwarten wäre (d. h. unter der Annahme einer Wahrscheinlichkeit von 1 zu 15 für eine bestimmte Topologie; Abb. 2A). Dies weist auf ein starkes Signal für PreSpec und/oder PostSpec hin, nicht jedoch für „Andere“ Topologien.
Um die Stärke des Signals zu bestätigen, das jede Topologie unterstützt, haben wir unbewurzelte, ungefähr unverzerrte (AU) Tests47 an den Stör-Paddelfisch-Ohnolog-Paar-Teilbäumen durchgeführt und dabei die drei möglichen unbewurzelten Topologien eines Vier-Taxon-Baums berücksichtigt; ein PostSpec-Typ (das nicht verwurzelte Äquivalent von PostSpec und PostSpec-like) und zwei PreSpec-Typen (das nicht verwurzelte Äquivalent von PreSpec und PreSpec-like) (Abb. 2B). Die Ergebnisse zeigen, dass Ohnolog-Paare, die die verwurzelten PostSpec- und PreSpec-Topologien wiederherstellen, robuster sind. Insbesondere lehnen sie häufig den nicht verwurzelten alternativen Topologietyp ab; wohingegen diejenigen, die die verwurzelten PostSpec-ähnlichen und PreSpec-ähnlichen „Anderen“-Topologien wiederhergestellt haben, den nicht verwurzelten alternativen Topologietyp seltener ablehnen (Abb. 2B). Obwohl die PreSpec/PostSpec-ähnlichen „Anderen“ Datensätze unentschlossener sind, wird der passende nicht verwurzelte Topologietyp in keinem der vier verwurzelten Topologiesätze zugunsten der nicht verwurzelten alternativen Topologie abgelehnt (Abb. 2B). Anstatt dass eine einzelne Topologie einen Konsens liefert, stehen diese Ergebnisse im Einklang mit einer signifikanten Unterstützung sowohl für die PostSpec- als auch für die PreSpec-Topologie in unserem breiteren Ohnolog-Paar-Datensatz und mit der „Anderen“-Topologie, die aus weniger informativen Genfamilien-Alignments abgeleitet ist.
Als zusätzlichen Test der Baumrobustheit haben wir die Auswirkungen der Filterung von Bäumen auf der Grundlage immer strengerer Astunterstützungsgrenzwerte (z. B. Ultrafast Bootstrap [UFBoot]48) innerhalb des Stör-Paddelfisch-Ohnolog-Paar-Teilbaums bewertet. Mit zunehmender Stringenz beobachten wir einen Abfall aller Baumtopologien (Abb. 2C). Am gravierendsten ist dies jedoch bei „anderen“ Topologien, die bei hoher Stringenz selten wiederhergestellt werden und bei der strengsten Grenze (UFBoot = 100 %) mehr als 40-mal seltener wie zufällig wiederhergestellt werden (Abb. 2C). Andererseits wurden PostSpec- und PreSpec-Topologien viel häufiger als erwartet zufällig wiederhergestellt, unabhängig vom UFBoot-Cut-Off, wobei die PreSpec-Topologie PostSpec als am häufigsten wiederhergestellte Topologie bei UFBoot ≥ 95 % überholte (Abb. 2C). Dies bestätigt weiterhin ein starkes, nicht zufälliges Signal sowohl für die PostSpec- als auch für die PreSpec-Topologie in unserem vollständigen Datensatz der Ohnolog-Paar-Genfamilie.
Als Nächstes haben wir als Indikator dafür, ob wir davon ausgehen können, dass die Stör-Paddelfisch-Subklasse korrekt wiederhergestellt wird, die Fähigkeit von Genbäumen verglichen, die die Topologie jedes Stör-Paddelfisch-Ohnolog-Paares unterstützen, andere gut akzeptierte Gruppen wie Knorpelfische und Tetrapoden wiederherzustellen , Teleosts (Abb. 2D). Wenn ein Genbaum bekannte, gut unterstützte Kladen nicht wiederherstellt, kann dies ein Hinweis auf ein allgemein niedriges phylogenetisches Signal sein. Obwohl keine größeren Unterschiede zwischen den drei Topologiekategorien beobachtet wurden, schnitten PreSpec-Bäume durchweg am besten und „Sonstige“ am schlechtesten ab (Abb. 2D).
Nachdem wir die Robustheit des phylogenetischen Signals bestätigt hatten, wollten wir testen, ob systematische Fehler zu einem konsistenten und irreführend starken Signal für die PostSpec- und PreSpec-Topologien führen könnten. Wir haben eine Vielzahl von Statistiken51,52 auf der Ebene der Sequenzausrichtung, der Modellierung und der Baumtopologie analysiert (Abb. 2E, ergänzende Abb. 1). „Andere“ Baumtopologien leiten sich von kürzeren Mehrfachsequenz-Alignments mit weniger Substitutionen pro Stelle ab (d. h. höhere durchschnittliche paarweise Identität, langsamere Evolutionsrate53 und weniger variable und sparsame informative Stellen) als PostSpec- oder PreSpec-Topologien (Abb. 2E, ergänzende Abb. 1). . Die Kombination dieser Faktoren begrenzt vermutlich das phylogenetische Signal, was mit der Vorstellung übereinstimmt, dass „andere“ Topologien aus schwach unterstützten, geringfügigen phylogenetischen Fehlern resultieren. Wir haben keine signifikanten Unterschiede zwischen den betrachteten Statistiken zwischen den PreSpec- und PostSpec-Topologien festgestellt (Abb. 2E, ergänzende Abb. 1). Wichtig ist, dass PostSpec- und PreSpec-Datensätze, obwohl sie pro Standort mehr Substitutionen aufweisen als „andere“ Bäume, keine Anzeichen dafür aufweisen, dass sie anfälliger für systematische Fehler sind, ein vergleichbares Gleichgewicht der Substitutionen an internen und externen Baumzweigen (Baumstruktur) aufweisen und eine ähnliche Zusammensetzung aufweisen Variabilität und Substitutionssättigungsniveaus für „andere“ Datensätze (Abb. 2E, ergänzende Abb. 1)52,54,55. Schließlich können ortsheterogene Modelle dazu beitragen, durch systematische Fehler verursachte Verzweigungsartefakte in der phylogenetischen Analyse zu verringern56. Das Testen ihrer Verwendung an allen Genfamilien, die maximale Unterstützungswerte (UFBoot = 100 %) innerhalb der Stör-Paddelfisch-Ohnolog-Paar-Subklasse aufwiesen, führte nie zu einer Topologieänderung, während die Unterstützungswerte nie unter UFBoot = 97 % fielen (ergänzende Abbildung 2).
Zusammengenommen deuten diese Analysen darauf hin, dass weder die PostSpec- noch die PreSpec-Topologie auf Fehler zurückzuführen sind, was auf eine starke und zuverlässige Unterstützung für Ohnologs hinweist, die sowohl vor als auch nach der Stör-Paddelfisch-Divergenz divergieren, und gleichzeitig darauf hindeuten, dass „andere“ Baumtopologien häufig ein Produkt vergleichsweise begrenzter phylogenetischer Signale sind .
Im Genom des Störs sind im Vergleich zum Paddelfisch Tausende zusätzlicher Gene annotiert7,8,35. Um die Auswirkungen auf unsere Ergebnisse abzuschätzen, haben wir die Menge der Stör-Ohnolog-Paare analysiert, für die bei Paddelfischen ein einzelnes Ortholog annotiert ist. In diesen Genbäumen besteht der Stör-Paddelfisch-Ohnolog-Unterbaum nur aus drei Genen. Daher gibt es nur drei mögliche Wurzeltopologien: zwei ähneln PreSpec und eine PostSpec (ergänzende Abbildung 3). Wir bezeichnen diese als „PreSpec-Typ“ und „PostSpec-Typ“, da es nicht möglich ist, auszuschließen, dass diese Bäume stattdessen „Andere“ Topologien bilden, wenn eine zweite Paddelfischsequenz eingeführt wird.
Unter diesen offenbar in Einzelkopien vorkommenden Paddelfisch-Genen gibt es einen größeren Anteil von Bäumen vom PostSpec-Typ (1836 Bäume, ~82 %) bis zum PreSpec-Typ (397 Bäume, ~18 %), als für die oben genannten Hauptdaten ermittelt wurde (ergänzende Abbildung). 3). Da unsere früheren Analysen eine phylogenetische Tendenz zu einer bestimmten Topologie auszuschließen scheinen, ergeben sich zwei plausible Erklärungen. Entweder haben spät rediploidisierende Ohnologe eine größere Tendenz, in den Singleton-Status zurückzukehren, oder einige sehr ähnliche doppelte Genomregionen werden zu einer einzigen Assemblierungssequenz zusammengefasst. Die Herausforderungen bei der Unterscheidung solcher Regionen mit hoher Sequenzähnlichkeit wurden bei der Analyse des Störgenoms festgestellt7, und bei Salmoniden, insbesondere bei der Europäischen Äsche (Thymallus thymallus), wurde festgestellt, dass die Tetraploidie sowohl kollabieren als auch aufrechterhalten werden kann26,57.
Wenn ein kleiner Teil der duplizierten Paddelfisch-Loci immer noch einer tetrasomischen Vererbung unterliegt oder künstlich zu einem einzigen Locus zusammengefasst ist, sollte dies als Regionen mit der doppelten Sequenzierungstiefe im Vergleich zum Rest des Genoms erkennbar sein. Dies liegt daran, dass Lesevorgänge, die von zwei verschiedenen genomischen Standorten stammen, auf kollabierte Regionen abgebildet werden sollten26,57. Um dies zu testen, untersuchten wir die Verteilung der Lesetiefe der Genomsequenzierung für jedes Paddelfisch-Gen innerhalb eines beibehaltenen Ohnolog-Paars und untersuchten separat die Lesetiefe für Einzelkopie-Paddelfisch-Gene mit Topologien vom PostSpec-Typ oder PreSpec-Typ (d. h. Single-Copy-Paddlefish-Gene). Kopieren Sie Paddelfisch-Loci, an denen der Stör beide Ohnologs behält).
Der Hauptdichtepeak beim Plotten der Lesetiefe der Pro-Gen-Sequenzierung für die Einzelkopie-Gensätze ist mit jedem der Zwei-Kopie-Paddelfisch-Ohnolog-Paar-Gene vergleichbar. Dies impliziert, dass die meisten dieser Fälle durch einen Genverlust bei Paddelfischen und nicht durch die Aufrechterhaltung der Tetraploidie oder den Zusammenbruch der Baugruppe erklärt werden (ergänzende Abbildung 3). Wir finden jedoch einen kleineren, aber klaren Doppelabdeckungspeak für Einzelkopie-Paddelfisch-Gene. Dies macht einen wesentlich größeren Anteil der Einzelkopie-Gene vom PostSpec-Typ als von PreSpec-Typ-Genen aus (ergänzende Abbildung 3). Dies steht im Einklang mit der Erwartung, dass neuere rediploidisierte Ohnolog-Paare (PostSpec und PostSpec-Typ) die höchste Sequenzähnlichkeit aufweisen und anfälliger für Montageschwierigkeiten und Artefakte sind.
Es wird angenommen, dass der autopolyploide Rediploidisierungsprozess zahlreiche physikalisch unabhängige genomische Umlagerungsereignisse im gesamten Genom umfasst24. Unter der Annahme, dass diese Umlagerungen nicht auf einzelne Gene beschränkt sind und dass nachfolgende Umlagerungen nicht umfangreich sind, sollten große Blöcke benachbarter Gene mit gemeinsamen Rediploidisierungsverläufen als weitgehend nicht überlappende syntenische Blöcke auf verschiedenen Chromosomen sichtbar und in beiden Abstammungslinien vorhanden sein. Dies ist der Geschichte der Unterdrückung der Rekombination während der Evolution der Geschlechtschromosomen von Säugetieren nicht unähnlich, wo Genomumlagerungen mit dem Beginn der Ortsdivergenz auf X und Y verbunden sind und zu zusammenhängenden Schichten von Genen führten, die eine XY-Divergenzzeit teilen14,58. Wenn unsere phylogenetischen Ergebnisse auf einer gemeinsamen WGD beruhen, gefolgt von einer längeren Rediploidisierung, die sowohl die gemeinsamen als auch die abstammungsspezifischen Zweige umfasst, sollten solche Divergenz-Zeit-geschichteten Syntenieblöcke sehr offensichtlich sein, insbesondere wenn man bedenkt, dass sich acipenseriforme Genome langsam entwickeln und nach WGD7 eine begrenzte Reorganisation zeigen ,8,35.
Die Darstellung von Ohnolog-Paaren innerhalb und über die Stör- und Paddelfischgenome hinweg ergab, dass Ohnologs sowohl aus der PreSpec- als auch der PostSpec-Kategorie (Abb. 2) nicht zufällig entlang des Genoms verteilt sind. Stattdessen finden sich Ohnolog-Paare mit gemeinsamen Divergenzdaten in Bezug auf die Artbildung (PreSpec oder PostSpec) in syntenischen Blöcken entlang großer ununterbrochener Chromosomenabschnitte (und möglicherweise sogar ganzer kleiner Chromosomen) (Abb. 3). Beispielsweise sind lange PreSpec-Syntenieblöcke in beiden Genomen auf den sechs größten Chromosomen konserviert (die über beide Arten hinweg drei WGD-abgeleitete Paare bilden 7,8; Abb. 3C), was eine kleinräumige segmentale Duplikation vor der linienspezifischen WGD unwahrscheinlich macht Erklärung für diese Topologien und weitere Unterstützung der Hypothese, dass sie das wahre evolutionäre Signal widerspiegeln, das von WGD herrührt. Insgesamt werden diese Beobachtungen sparsam durch eine einzelne Ahnen-WGD erklärt, gefolgt von einer umfassenden Ahnen- und Abstammungs-spezifischen Rediploidisierung in der Evolution von Stören und Paddelfischen.
Circos-Diagramme des Genoms des Sterlet-Störs (A) und des Genoms des amerikanischen Paddelfischs (B), die die chromosomalen Positionen von Ohnolog-Paaren zeigen, mit Verbindungen, die entsprechend der PreSpec-Baumtopologie (blau) oder PostSpec-Baumtopologie (rot) gefärbt sind. Mikrochromosomen <20 MB werden nicht gekennzeichnet. C Circos Diagramm der Ohnolog-Paare sowohl im Stör- als auch im Paddelfisch-Genom, mit intraspezifischen PostSpec-Links (rot) und interspezifischen PreSpec-Links (blau). Nur Makrochromosomen >40 MB jeder Art werden gekennzeichnet. Quelldaten werden als Quelldatendatei bereitgestellt.
Dieses Ergebnis gilt auch dann, wenn nur die Makrochromosomen (> 40 MB) untersucht werden (ergänzende Abbildung 4) und für Ohnolog-Bäume mit zunehmend strengerer statistischer Unterstützung (d. h. UFBoot-Grenzwerte von ≥ 50 %, ≥ 75 % und 100 %) ( Ergänzende Abbildung 5). Unterdessen tendieren Ohnolog-Bäume aus der Kategorie „Andere“ und aus den Stör-Ohnolog-Paaren mit nur einer Paddlefish-Sequenz dazu, genomische Regionen zu besetzen, die Gene mit der ähnlichsten der beiden Haupttopologien (d. h. PreSpec-like und PreSpec-type neben PreSpec) beherbergen , und PostSpec-like und PostSpec-type neben PostSpec; Ergänzende Abbildungen 3 und 6) wie erwartet, wenn diese Topologien hauptsächlich auf geringfügigen Fehlern beruhen.
Die Verteilung synonymer Substitutionen pro Stelle (Ks) zwischen paralogen Genen innerhalb eines Genoms wird häufig als Grundlage für die Erkennung von WGD-Ereignissen und die Schätzung ihres Zeitpunkts im Verhältnis zur Artbildung verwendet59,60,61. Dies wird typischerweise durch statistische Modellierung und/oder einfache visuelle Identifizierung von Verteilungsspitzen in Ks-Diagrammen erreicht.
Wenn eine asynchrone (einschließlich abstammungsspezifische) Rediploidisierung stattgefunden hat, folgt daraus natürlich, dass kein starker, einzelner Ks-Peak zu erwarten ist, sondern stattdessen das Signal ohnologer Ks-Werte, soweit es als Proxy für die Zeit angesehen werden kann diffuser, was zu einem breiteren, flacheren Peak oder einer Reihe niedriger Peaks führt, die sich über die Ks-Werte während der Rediploidisierungsperiode erstrecken26.
Vor diesem Hintergrund und um die Unterschiede zwischen unseren PreSpec-, PostSpec- und „Anderen“-Topologiedatensätzen weiter zu untersuchen, haben wir paarweise Ks-Werte für artspezifische Ohnolog-Paare aus den PreSpec-, PostSpec- und PreSpec- und PostSpec-ähnlichen Datensätzen berechnet. sowie alle diese zusammen (Zeilen mit der Bezeichnung „Alle“ in Abb. 4). Zum Vergleich haben wir auch paarweise Ks-Werte für zwei Stör-Paddelfisch-Ortholog-Paardatensätze berechnet – Einzelkopie-Orthogruppen und PreSpec-Orthologe. Wir stellen eine klare Unterscheidung zwischen Ks-Verteilungen fest, wobei die PostSpec-Ohnolog-Paardaten den niedrigsten Ks-Peak aufweisen, die PreSpec-Ohnolog-Paare den höchsten Ks-Peak und der orthologe Ks-Peak, der dazwischen liegt (Abb. 4). Diese höheren Ks früher rediploidisierender Ohnologs (d. h. PreSpec) und niedrigere Ks später rediploidisierender Ohnologe (d. h. PostSpec) im Vergleich zu orthologen Ks-Werten stimmen mit unseren Vorhersagen überein und unterstützen das Szenario einer gemeinsamen WGD, gefolgt von einer asynchronen, weiter Rediploidisierungsprozess.
Speziesspezifische Ohnolog-Paar-Ks-Wertdichten werden für jede der vier Haupttopologiekategorien (d. h. PostSpec, PreSpec, PostSpec-like und PreSpec-like) für speziesinterne Ohnolog-Paardaten aufgetragen. Zum Vergleich haben wir auch zwei Sätze von Paddelfisch-Stör-Ortholog-Paaren aufgezeichnet: (i) Single-Copy-Orthogruppen – Stör- und Paddelfisch-Sequenzen, die in den von OrthoFinder in allen Arten identifizierten Einzelkopie-Genen vorhanden sind, und (ii) PreSpec-Ortholog-Paare – diese stammen von jedes Ohnolog in der PreSpec-Topologie, sodass eine einzelne PreSpec-Topologie zwei Orthologenpaare beisteuert, deren Divergenz mit der Stör-Paddelfisch-Artenbildung übereinstimmt. Weiße vertikale Linien unterteilen jede Verteilung in vier Quantile, und die Anzahl der Ks-Werte (n) der Ohnolog/Ortholog-Paare, die jeder Verteilung zugrunde liegen, wird auch pro Datensatz angezeigt. Ks-Werte ≥ 0,3 wurden ausgeschlossen, ebenso wie Paare, bei denen eine Kodierungssequenz vom wgd-Softwaretool, das zur Berechnung der Ks-Werte verwendet wurde, als potenziell problematisch gekennzeichnet wurde (z. B. frühes Stoppcodon). Quelldaten werden als Quelldatendatei bereitgestellt.
Interessanterweise liegen die Ks-Peaks des PostSpec-like- und PreSpec-like-Paares auch zwischen den Ks-Peaks des PostSpec- und PreSpec-Paares und auf einem Gradienten, wobei PostSpec-like immer näher an PostSpec und PreSpec-like immer näher an PreSpec liegt (Abb. 4). . Wir haben zuvor darüber nachgedacht, ob diese „anderen“ Topologien in erster Linie auf Verzweigungsfehler aufgrund begrenzter phylogenetischer Signale zurückzuführen sein könnten. Wenn, wie die Ks-Analyse nahelegt, diese Genpaare zeitnah zu den Artbildungsereignissen divergierten, würden wir ein begrenztes phylogenetisches Signal zur Unterscheidung von Artbildungs- und Duplikationsknoten innerhalb von Ohnolog-Paar-Teilbäumen erwarten, wie wir es tatsächlich für „andere“ Topologien beobachten, die es sind sehr selten stark unterstützt (Abb. 2C).
Im Vergleich zu den nach Topologiekategorie getrennten Ks-Dichten fanden wir bei der Analyse aller Ohnolog-Paare jeder Art breitere, flachere Ks-Dichtespitzen, insbesondere wenn nicht auf der Grundlage der UFBoot-Unterstützung gefiltert wurde (Abb. 4). Bei der Filterung nach 100 % UFBoot-Unterstützung kann eine klare bimodale Verteilung beobachtet werden (Abb. 4), die wahrscheinlich stark unterstützte PreSpec- und PostSpec-Rediploidisierungsergebnisse darstellt. Diese Ergebnisse entsprechen unseren vorgeschlagenen Erwartungen für Ks-Analysen bei asynchroner Rediploidisierung, stehen jedoch im Widerspruch zu den traditionellen Vorhersagen für die Erkennung und den Zeitpunkt von WGD-Ereignissen mit Ks. In diesem Zusammenhang beschränken sich unsere Ergebnisse auf Ohnolog-Sets und nicht auf alle Duplikate, wie es normalerweise bei der Durchführung solcher Analysen der Fall ist, was bedeutet, dass das Signal in einem Ab-initio-WGD-Erkennungsszenario wahrscheinlich noch diffuser wäre.
Ohnolog-Paar-Ks-Peaks mit höheren Werten (dh größerer Divergenz) werden bei Paddelfischen durchgängig ermittelt als bei Stören (Abb. 4). Dies könnte auf eine schnellere Sequenzentwicklung bei Paddelfischen hinweisen. Um dies zu untersuchen, haben wir getestet, ob Paddelfischsequenzen in PreSpec- und Single-Copy-Orthogroup-Genbäumen im Durchschnitt längere Verzweigungslängen als ihre Störorthologen aufwiesen, und stellten fest, dass es nur für PreSpec-Orthologenpaare einen signifikanten Unterschied gab (ergänzende Abbildung 7). Dies deutet darauf hin, dass die Geschwindigkeit der Sequenzentwicklung bei Paddelfischen möglicherweise schneller ist als bei Stören. Neben dem offensichtlichen Zusammenbruch einiger sehr ähnlicher ohnologer Regionen im Genom des Schaufelradfischs (was die Anzahl der ohnologen Paare des Schaufelradfischs mit niedrigen Ks-Werten künstlich verringern würde) erklärt dies wahrscheinlich den Trend zu höheren Ks-Werten im Schaufelfisch.
Insgesamt stimmen diese Ergebnisse eindeutig mit der asynchronen Rediploidisierung überein, die eine gemeinsame Vorfahren-WGD im Stör-Paddelfisch-Vorfahren maskiert. Darüber hinaus weisen sie darauf hin, dass Ansätze, die auf der Identifizierung und Datierung von WGD-Ereignissen durch die Erkennung eines einzelnen Ks-Peaks basieren, durch langwierige Rediploidisierungsperioden beeinträchtigt werden können.
Die asynchrone Rediploidisierung trennt die ohnologische Divergenz zeitlich von der WGD und verschleiert die Datierung von Autopolyploidie-Ereignissen24,26,62. Unsere Genbaum- und Ks-Analysen legen nahe, dass dies wahrscheinlich ein wichtiger Faktor ist, der die unterschiedliche Reihe von Daten beeinflusst, die zuvor für WGD bei Stören und Paddelfischen vorgeschlagen wurden. Obwohl unvollkommen, kann die zuverlässigste untere Schrankenschätzung für das ursprüngliche WGD-Ereignis Stör-Paddelfisch aus ohnologen Paaren geschätzt werden, die sich vor der Divergenz Stör-Paddelfisch rediploidisierten, da diese zeitlich näher am WGD-Ereignis auseinandergegangen sind62. Vor diesem Hintergrund wählten wir zur Abschätzung eines unteren Grenzwerts für die WGD einen bayesianischen phylogenomischen Ansatz63 unter Verwendung verketteter Ohnolog-Paare32,62 basierend auf dem Satz von 81 Genbäumen, die die gemeinsame WGD maximal unterstützten und keine Duplikate in anderen Arten enthielten. Wir analysierten fünf verschiedene Datensätze, die immer alle 81 Genfamilien umfassten, aber die Ohnologen eines Paares nach dem Zufallsprinzip mischten, um sie willkürlich als A- oder B-Kopie für die Verkettung zuzuordnen, um Verzerrungen zu vermeiden und die Robustheit der Ergebnisse gegenüber alternativen Verkettungen zu beurteilen62. Wir analysierten diese Datensätze mit einer autokorrelierten entspannten molekularen Uhr64, verwendeten das ortsheterogene CAT-GTR-Substitutionsmodell65 und betrachteten zwei fossile Kalibrierungsstrategien (Ergänzungsdaten 1). Die erste bezieht fossile Beweise ein, um obere und untere Grenzkalibrierungen auf wichtige Divergenzen zwischen den Hauptlinien der Rochenfische anzuwenden, und die zweite lässt die meisten dieser Divergenzen unkalibriert, da es schwierig ist, wichtige paläozoische Rochenfischfossilien phylogenetisch zu platzieren (Ergänzende Daten 1). , Abb. 5)66.
Ohnolog-Kopien wurden zufällig als (A oder B) klassifiziert und für die phylogenomische Analyse verkettet. Dargestellt ist der bayesianische phylogenomische Zeitbaum des Kieferwirbeltiers aus einer von fünf zufälligen Verkettungen (für alle fünf siehe ergänzende Abbildungen 8 und 9). Das 95 % CIR (Glaubwürdigkeitsintervall) wird für jeden Knoten in Blau angezeigt. Die 95 %-CIR-Ergebnisse einer unabhängigen Analyse unter dem Prior werden unter jedem Knoten in Rot angezeigt. Dies bestätigt, dass unsere Priors zur WGD-Divergenzzeit ausreichend diffus sind, um eine Beschränkung unserer Ergebnisse auf das abgeleitete WGD-Timing der unteren Grenze in den Hauptanalysen zu vermeiden. Für jede kalibrierte Divergenz werden die Ober- und Untergrenze der Fossilkalibrierungen als Dreiecke angezeigt. Es wurden zwei Kalibrierungsstrategien angewendet, die erste (A) mit mehr Kalibrierungen für Rochenfische (Kalibrierungsdreiecke mit weißer Füllung sind spezifisch für diese Analyse) als die zweite (B), bei der eine lockere Kalibrierungsstrategie angewendet wurde, um die Unsicherheit in der zu berücksichtigen phylogenetische Platzierung einiger Rochenfischfossilien. Einzelne zufällige Verkettungsanalysen sind in den ergänzenden Abbildungen dargestellt. 8 und 9. Quelldaten einschließlich Kalibrierungen und Ergebnisse werden in Supplementary Data 1 und auf figshare106 bereitgestellt.
Im ersten Fall (d. h. einschließlich aller Kalibrierungen) schließen wir eine Divergenzzeit von ~171,6 Ma (durchschnittlicher Mittelwert aller fünf zufälligen Verkettungen [AVG-5RC]; 95 %-Glaubwürdigkeitsintervallbereich [CIR]: ~124,1–203,3 Ma) für Aufteilung von Stören und Paddelfischen (dh Krone Acipenseriformes; unter Berücksichtigung beider ohnologer Paare) (Ergänzende Daten 1, Abb. 5A, Ergänzende Abb. 8). Nach der Spaltung von Chondrostei (von denen Störe und Paddelfische die einzigen lebenden Vertreter sind und die Krone Acipenseriformes bilden) und Neopterygii (d. h. Krone Actinopteri) ~ 367,8 Ma (AVG-5RC; 95 % CIR: ~360,6–374,8 Ma) schätzen wir a Untergrenze für die gemeinsame Stör-Paddelfisch-WGD bei ~ 254,7 Ma (AVG-5RC; 95 % CIR: ~ 207,1–289 Ma) (Ergänzende Daten 1, Abb. 5A, Ergänzende Abb. 8). Interessanterweise liegt diese mittlere Bayes'sche Schätzung für den Zeitpunkt der Untergrenze des ursprünglichen Stör-Paddelfisch-WGD in der Nähe des Perm-Trias-Grenzereignisses (P-Tr) des Massenaussterbens vor etwa 251,9 Millionen Jahren.
Unsere zweite Reihe von Analysen, die weniger Kalibrierungen für Rochenfische verwenden, legt die WGD-Untergrenze jedoch auf ~ 241,8 Ma (AVG-5RC; 95 % CIR: ~ 202,9–273,4 Ma) (Ergänzende Daten 1, Abb. 5B, Ergänzung). Abb. 9). Dementsprechend sind auch andere unkalibrierte Divergenzen in ähnlicher Weise in die Gegenwart verschoben, darunter Kronen-Neopterygii (Teleostei und Holostei; von 294,5 Ma [AVG-5RC; 95 % CIR: ~270,8–319,9 Ma] auf 278,5 Ma [AVG-5RC; 95 % CIR: ~256,9–304,6 Ma]) und Crown Holostei (d. h. Gars und Bowfin; von 276,9 Ma [AVG-5RC; 95 % CIR: ~251,4–306,4 Ma] bis 263,4 Ma [AVG-5RC; 95 % CIR: ~240,6–291,6 Ma]) oder sind dramatischer in die Gegenwart verschoben, wie z. B. Kronen-Actinopterygii (alle noch vorhandenen Strahlenflosserfische; von 378 Ma [AVG-5RC; 95 % CIR: ~372,1–384 Ma] bis 349,5 Ma [AVG-5RC; 95 % CIR: ~329,4–370,9 Ma]) und Kronen-Actinopteri (von 367,8 Ma [AVG-5RC; 95 % CIR: ~360,6–374,8 Ma] bis 340,2 Ma [AVG-5RC; 95 % CIR : ~320,3–361,7 Ma]) (Ergänzende Daten 1, Abb. 5, Ergänzende Abb. 8 und 9). Die Stör-Paddelfisch-Divergenz (Krone Acipenseriformes) ist in dieser Analyse mit ~167,5 Ma ebenfalls etwas neuer (AVG-5RC; 95% CIR: ~123,4–202,1 Ma) (Ergänzende Daten 1, Abb. 5B, Ergänzende Abb. 9). ).
Frühere Studien haben trotz ihrer engen phylogenetischen Verwandtschaft unabhängige WGD-Ereignisse in den Abstammungslinien der Störe und Paddelfische favorisiert8,35,38,44,45. Durch die Berücksichtigung der Möglichkeit eines einzelnen Autopolyploidie-Ereignisses, gefolgt von einer linienspezifischen Rediploidisierung, lehnen unsere Ergebnisse unabhängige WGDs ab und zeigen, dass auf eine angestammte WGD eine Artbildung zu einem Zeitpunkt folgte, als mindestens 50–66 % des Genoms tetraploid blieben. Dieser hohe Anteil an Tetraploidie zum Zeitpunkt der Artbildung liefert eine Erklärung für frühere Studien, die fälschlicherweise auf unabhängige WGD-Ereignisse schließen8,35,38,44,45 und hat Auswirkungen auf die Evolution und Biologie der Acipenseriformen.
Auch wenn dies nicht in den Kontext einer gemeinsamen WGD gestellt wird, wurde bereits früher eine Ähnlichkeit in der Entwicklung der Stör- und Paddelfischgenome festgestellt8. Beispielsweise scheinen die sechs größten Chromosomen (drei WGD-abgeleitete Chromosomenpaare) eine besonders starke chromosomale Homologie zwischen Stör und Paddelfisch aufzuweisen (Abb. 3C)8; und wir stellen fest, dass dieselben Chromosomen vor der Divergenz zwischen Stör und Paddelfisch hauptsächlich einer Rediploidisierung unterzogen wurden. Für diese und andere Regionen des Genoms, die vor der Artbildung einer Rediploidisierung unterzogen wurden, wird der Beginn der ohnologischen Sequenz und der funktionellen Divergenz (über die Allelvariation hinaus) ebenfalls ein Vorläufer beider vorhandener acipenseriformer Abstammungslinien gewesen sein. Diese teilweise gemeinsame Rediploidisierungsgeschichte nach der gemeinsamen WGD erklärt wahrscheinlich zumindest einen Teil der vorgeschlagenen Ähnlichkeit in der Genomentwicklung zwischen Paddelfischen und Stören und trägt möglicherweise zu ihrer bemerkenswerten Fähigkeit zur Hybridisierung bei8,67.
Umgekehrt rediploidierten andere Teile des Genoms – jene Chromosomen und Regionen von Chromosomen, die tetraploid waren, als sich Störe und Löffelfische trennten – in jeder Abstammungslinie unabhängig voneinander, wobei unterschiedliche (und unterschiedlich große) Regionen und damit unterschiedliche Sätze von Genen zu unterschiedlichen Zeiten rediploidisierten. Die Ohnologen, die sich nach der Artbildung von Allelen gelöst haben, müssen auch unabhängig voneinander einer Sub-/Neofunktionalisierung/Regulierung unterzogen worden sein24. Angesichts der Tatsache, dass mehr als die Hälfte des Genoms nach der Divergenz zwischen Stör und Paddelfisch rediploidisiert zu sein scheint, ist es wahrscheinlich, dass diese unabhängig rediploidisierten Ohnologen und die Netzwerke, die sie bilden, wesentlich zur einzigartigen Biologie jeder Abstammungslinie beitragen. Beispielsweise ergab eine kürzlich durchgeführte Studie der Oxytocin- und Vasotocin-Rezeptor-Genfamilie (OTR/VTR), die eine Vielzahl von Rollen spielt, unter anderem im Sozialverhalten und bei der Fortpflanzung, dass diese duplizierten Gene im Einklang mit unabhängigen WGDs in jeder Abstammungslinie entstanden sind68. Unsere Ergebnisse deuten stattdessen darauf hin, dass Gene aus der OTR/VTR-Familie möglicherweise besser so interpretiert werden könnten, dass sie dem LORe-Modell24 folgen, da sie bei Stören und Paddelfischen unabhängig voneinander rediploidisiert wurden.
Unsere Schätzung, dass mindestens 50–66 % des duplizierten Genoms zum Zeitpunkt der Divergenz zwischen Stör und Paddelfisch, d. Rediploidisierung nach ca. 50 Millionen Jahren abgeschlossen24,26) und Teleoste (Rediploidisierung nach ca. 60 Millionen Jahren weitgehend abgeklungen13,69) (Abb. 5, ergänzende Abb. 8 und 9). Wir vermuten, dass die scheinbar langsamere Evolutionsrate (sowohl in Bezug auf Substitutionen als auch Umlagerungen7,8) bei Stören und Paddelfischen zu einer längeren Rediploidisierungsperiode bei Acipenseriformes im Vergleich zu sich schneller entwickelnden Knochenfischen beitrug. Dies könnte auch dazu beitragen, den scheinbaren Zusammenbruch einiger ohnologer Regionen im Paddelfisch-Genom zu einer einzigen Assemblierungssequenz zu erklären, obwohl wir die Aufrechterhaltung der Tetraploidie für einen sehr kleinen Teil des Genoms nicht definitiv ausschließen können7,26,57. Trotz dieser langsameren Geschwindigkeit der Genomumordnung und Rediploidisierung und des Vorhandenseins großer Genblöcke mit konsistenter Rediploidisierungsgeschichte in unseren Analysen finden wir ohnologe Blöcke, die vor und nach der Artbildung auf denselben Chromosomen auseinander gingen, ähnlich wie bei Beobachtungen bei Salmoniden 24, 26. Dies scheint häufig durch zeitlich isolierte intrachromosomale Umlagerungsereignisse geschehen zu sein, was möglicherweise die Unterdrückung der homologen Rekombination erleichtert und die Auflösung von Ohnologen aus Allelen für dieses Genomsegment ermöglicht. Dieses Szenario ähnelt der schrittweisen Bildung von Evolutionsschichten auf den Geschlechtschromosomen von Säugetieren14,58 und fügt dem bestehenden Modell der segmentalen Rediploidisierung, das für Störe vorgeschlagen wurde, eine zusätzliche Komplexitätsebene hinzu7.
Unser WGD-Timing der unteren Grenze (~254,7 Ma; ~241,8 Ma mit weniger Fossilkalibrierungen) ist wesentlich älter als alle vorherigen Schätzungen7,8,38,44,45. Erstens wurde in früheren Studien typischerweise davon ausgegangen oder gefolgert, dass die WGD nicht geteilt wird und dass nach der Divergenz zwischen Stör und Paddelfisch in jeder Abstammungslinie unabhängige WGDs auftraten. Unsere Genbaum-, Syntenie- und Ks-Analysen widerlegen dies und weisen darauf hin, dass die WGD mindestens so lange vor der Entstehung dieser Abstammungslinien liegen muss, dass etwa 33–50 % des Genoms rediploidisiert sind. Basierend auf dem ältesten Kronen-Acipenseriform-Fossil, †Protopsephurus liui (ein Stammpaddelfisch)70, das auf ein Minimum von ca. 121 Ma71,72 datiert ist, widerspricht dieses harte Minimum direkt allen früheren Schätzungen mit Ausnahme von ca. 180 Ma, basierend auf dem Stör Genomanalyse7. Darüber hinaus bedeutet die asynchrone Rediploidisierung, dass gängige Ansätze (z. B. Phylogenomik oder molekularuhrbasierte Analysen), die zur direkten Schätzung des absoluten Datums autopolyploider WGD-Ereignisse verwendet werden, zwangsläufig problematisch sind, da sie die Zeit(en) der ohnologen Rediploidisierung mit der WGD selbst vermischen24,26, 62. Dies bedeutet, dass alle Ohnolog-Paare wahrscheinlich eine Tendenz zur Datierung in der Gegenwart haben, es sei denn, sie rediploidieren nahezu augenblicklich nach der WGD. Dies wird jedoch für Ohnologe, die nach der Stör-Paddelfisch-Divergenz divergieren, am problematischsten sein (PostSpec). Da frühere Studien die asynchrone Rediploidisierung nicht berücksichtigten, wurden alle früheren Datierungsanalysen diese PostSpec-Ohnolog-Paare in ihre Schätzung des WGD-Timings einbezogen. Wir haben diese Ohnolog-Paare aus unseren Analysen ausgeschlossen und im Gegensatz zu früheren Studien die WGD-Untergrenze mithilfe eines ausgefeilten phylogenomischen Ansatzes geschätzt. Obwohl unser geschätzter WGD-Timing für die Untergrenze weitaus älter ist als frühere Schätzungen, sollte er daher auch genauer sein. Darüber hinaus ist es aufgrund der asynchronen Rediploidisierung wahrscheinlich immer noch eine Unterschätzung des tatsächlichen WGD-Timings.
Interessanterweise unterstützen unsere Ergebnisse eine mögliche Rolle für Polyploidie und asynchrone Rediploidisierung bei Acipenseriformes, die das/die P-Tr- und/oder Tr-J-Massenaussterben überlebt haben. Es wurde vorgeschlagen, dass WGDs in Pflanzen Toleranz und Anpassungsfähigkeit gegenüber extremen Umweltbedingungen verleihen und so die Fitness angesichts von Massenaussterben erhöhen34,73. Unsere Datierung der Untergrenze des Stör-Paddelfisch-WGD legt nahe, dass das Ereignis nahe der P-Tr-Massenaussterbeperiode stattgefunden haben könnte, doch unser mittlerer Zeitpunkt hängt von der Kalibrierungsstrategie ab und die Konfidenzintervalle sind breit.
Wenn man jedoch bedenkt, dass die meisten Rediploidisierungen nach der Stör-Paddelfisch-Divergenz erfolgen, stimmen unsere Schätzungen für die WGD-Untergrenze und die Stör-Paddelfisch-Divergenz vollständig mit einem Modell überein, bei dem die Flexibilität und funktionelle Redundanz, die einem Genom in den frühen Stadien innewohnt, vollständig im Einklang stehen Die autopolyploide Rediploidisierung trug zum Überleben und Erfolg der Acipenseriformes bei, zumindest durch das Tr-J-Massenaussterben, wenn nicht sogar durch das P-Tr-Aussterben. Ein dupliziertes Genom ist jedoch kein allgemeiner Schutz gegen jegliches Aussterben, und unsere älteren WGD-Schätzungen der unteren Grenze deuten darauf hin, dass es relativ früh in der chondrostischen Evolution aufgetreten sein könnte, was darauf hindeutet, dass der Stamm Acipenseriformes (wie †Peipiaosteidae und †Chondrosteidae)74,75,76 ,77 spaltete sich wahrscheinlich vom Vorfahren der noch existierenden Acipenseriformes ab, deren Genome sich noch in einem frühen Stadium des Rediploidisierungsprozesses befanden.
Die asynchrone Rediploidisierung verschärft eindeutig die technischen Schwierigkeiten bei der Analyse von WGD-Ereignissen – sie stellt die traditionellen Erwartungen an WGD-Genbäume und Ks-Plots auf den Kopf und führt dazu, dass einige doppelte Genomregionen so ähnlich sind, dass sie lange danach zu einer einzigen Assemblierungsregion zusammenfallen oder vielleicht sogar immer noch tetraploid sind WGD (weit über 200 Millionen Jahre nach WGD beim Paddelfisch). In diesem Zusammenhang bieten wir durch die Identifizierung unterschiedlicher Signale für die abstammungsspezifische Rediploidisierung (in Genbaum-, Syntenie- und Ks-Analysen) einen Weg zur Erkennung und Analyse anderer WGD-Ereignisse, die von der asynchronen, abstammungsspezifischen Rediploidisierung betroffen sind. Wir stellen fest, dass unser Rahmenwerk zur Unterscheidung des Genbaumverteilungssignals für die abstammungsspezifische Rediploidisierung von dem eines phylogenetischen Fehlers alternative biologische Phänomene (unvollständige Abstammungssortierung oder Hybridisierung78) als Quelle der widersprüchlichen Genbaumtopologieverteilung nicht ausschließt. Allerdings sind selbst die einfachsten Szenarien, die erforderlich sind, um diese Faktoren anstelle einer asynchronen Rediploidisierung einzubeziehen, weitaus weniger sparsam (Ergänzende Abbildung 10; ausführliche Diskussion siehe Ergänzende Anmerkung 1).
Die Entdeckung einer Mischung aus angestammter und abstammungsspezifischer Rediploidisierung sowohl bei Teleost-13,24,26,27,28 als auch bei Nicht-Teleost-Strahlenflossenfischlinien lässt darauf schließen, dass es sich um ein allgemeines Phänomen nach der WGD handelt, zumindest bei Autopolyploiden. Da ein einzelnes Gen erst dann als dupliziert betrachtet werden kann, wenn die Rekombination unterdrückt wird, erzeugt ein solches Szenario Genome, die aus einem Mosaik gemeinsamer und abstammungsspezifischer Genduplikationen bestehen, auch wenn sie aus einer einzelnen Genomduplikation entstanden sind. Diese komplexe Beziehung könnte dazu beitragen, die seit langem bestehende Schwierigkeit bei der Bestimmung der Anzahl und des Zeitpunkts von WGDs in der frühen Wirbeltierentwicklung zu erklären9,11,12,79,80,81.
Eine umfassende linienspezifische Rediploidisierung hat erhebliche Auswirkungen auf unser Verständnis der Genomentwicklung nach Polyploidie und auf unsere Interpretation der Evolution doppelter Gene, einschließlich ihrer Rolle in der adaptiven Evolution. Dieser Rahmen für die Analyse und Interpretation der Evolution nach der WGD wird eine erneute Untersuchung anderer Autopolyploidie-Ereignisse anregen, einschließlich der Gründungs-WGD an der Basis aller Wirbeltiere.
Für diese Forschung waren keine ethischen Genehmigungen oder andere Genehmigungen erforderlich.
In ihrer Analyse des Sterlet-Stör-Genoms definierten Du et al.7 einen hochzuverlässigen Ohnolog-Paar-Datensatz für die Art, der eine erste Grundlage für unsere Analysen bildet. Um Paddlefish (GCF_017654505.1)8 Ohnologs zu diesem Datensatz hinzuzufügen, haben wir OrthoFinder82 (Version 2.5.4) verwendet, um phylogenetische hierarchische Orthogruppen (PHOGs) abzuleiten. Für OrthoFinder-Analysen haben wir auch eine Reihe von Proteomen von Arten einbezogen, die sich über die Phylogenie der Kieferwirbeltiere erstrecken, einschließlich des Geisterhais (Callorhinchus milii; GCF_000165045.1)83 und des Walhais (Rhincodon typus; GCF_001642345.1)84 aus Chondrichthyes sowie des Menschen (Homo sapiens). ; GCF_000001405.39), Haushuhn (Gallus gallus; GCF_000002315.6), Afrikanischer Krallenfrosch (Xenopus Tropicalis; GCF_000004195.4) und Quastenflosser (Latimeria chalumnae; GCF_000225785.1) von Sarcopterygii. Innerhalb von Actinopterygii haben wir Zebrafisch (Danio rerio; GCF_000002035.6), Fugu (Takifugu rubripes; GCF_901000725.2), Gefleckter Gar (Lepisosteus oculeatus; GCF_000242695.1)39 und Bogenflosser (Amia Calva; JAAWVP01.1)35 als Vertreter ausgewählt Neopterygii, die Schwestergruppe der Störe und Paddelfische, und Grauer Bichir (Polypterus senegalus; GCF_016835505.1)35 als ihre gemeinsame Schwestergruppe. Für diese Analysen wurde die längste Proteinsequenz für jedes Gen verwendet, wobei alternative Transkripte annotiert wurden. Mit zwei Ausnahmen wurden die Standard-OrthoFinder-Einstellungen verwendet. Zuerst haben wir einen Artenbaum spezifiziert, der den akzeptierten Verwandtschaftsbeziehungen zwischen Kieferwirbeltieren7,8,35,85 entspricht, um die orthologische Schlussfolgerung zu verbessern: „((Geisterhai,Walhai),((Quastenflosser,(Frosch,(Mensch,Huhn))), (Bichir,((Paddelfisch,Stör),((Zebrafisch,Fugu),(SpottedGar,Bowfin))))));". Zweitens wurde das OrthoFinder-Flag -y angegeben, um PHOGs, die nach dem Vorfahren des Kieferwirbeltiers dupliziert wurden, weiter in separate PHOGs aufzuteilen. Bei der Nachbearbeitung der OrthoFinder-Ergebnisse führten wir dann eine zusätzliche Prüfung durch, indem wir nur PHOGs extrahierten, die Sequenzen von möglichst vielen Arten enthielten, wobei wir immer zwei Sequenzen von Stör und Paddelfisch einschlossen. Dies wurde erreicht, indem der Satz von Sequenzen extrahiert wurde, die vom Knoten der ältesten Vorfahrenart im abgeglichenen Genbaum von OrthoFinder abstammen, um keine zusätzlichen Stör- oder Paddelfischsequenzen einzuschließen (basierend auf den.tsv-Dateien im OrthoFinder-Ausgabeordner Phylogenetic_Hierarchical_Orthogroups). Als einfaches Beispiel: In einer Orthogruppe mit einer Genduplikation im Vorfahren von Actinopterygii, wobei sowohl Paddelfisch- als auch Stör-Ohnologs in beiden Actinopterygian-Duplikaten erhalten bleiben, führt unser Ansatz zu zwei resultierenden PHOGs, die auf der Ebene von Actinopterygii aufgeteilt sind, wobei keines davon Sequenzen enthält vom anderen Duplikat oder ihren Co-Orthologen aus Sarcopterygii oder Chondrichthyes, und beide enthalten jeweils zwei Stör- und zwei Paddelfischsequenzen.
Diese PHOGs wurden dann gefiltert, um nur diejenigen beizubehalten, die mit einem zuvor abgeleiteten Stör-Ohnolog-Paar mit hoher Konfidenz7 übereinstimmten, sowie diejenigen, die mindestens eine Außengruppe enthielten, um die Wurzelbildung des Stör-Paddelfisch-Ohnolog-Paar-Teilbaums und damit den Rückschluss auf die relative Duplikationsknotenzeit zu ermöglichen zur Artbildung. Wir haben auch Genfamilien ausgeschlossen, bei denen beide Ohnologs entweder im Paddelfisch oder im Stör auf demselben Chromosom vorhanden waren oder bei denen eine Paddelfisch- oder Störsequenz auf einem Gerüst vorhanden war, das keinem der 60 Stör- oder Paddelfisch-Chromosomen zugeordnet war. Zuletzt überprüften wir, ob die Stör- und Paddelfischsequenzen eine monophyletische Gruppe in abgeleiteten PHOG-Genbäumen bildeten (siehe Abschnitt unten über die Inferenz der Ohnolog-Duplikationszeit). 5439 PHOGs erfüllten diese Kriterien (und bilden unseren Ohnolog-Paar-Satz), von denen 5372 auch jeweils mindestens eine Sequenz von Neopterygii und einer weiter entfernten verwandten Außengruppe enthielten, was nahezu sicherstellte, dass die beiden Paddelfisch- und Störsequenzen nach der Abspaltung von Neopterygii auseinander gingen.
Insgesamt hätte dies zu einem Datensatz führen sollen, der für Ohnolog-Paare bei Stör und Paddelfisch stark angereichert ist. Wir weisen jedoch darauf hin, dass das Set nur Ohnolog-Paare umfasst, bei denen beide Ohnologs in beiden Arten erhalten bleiben, und PHOGs ausschließt, die zusätzliche Duplikationen oder Verluste bei Stören, Paddelfischen oder deren angestammter Stammlinie erlitten haben. Ebenso ist es möglich, dass eine sehr kleine Teilmenge unserer Ohnolog-Paare aus komplexen Szenarien mehrerer Ohnolog-Verluste und interchromosomaler Duplikationen stammt, die unseren Filtern (sowie den doppelt konservierten Syntenie-Beweisen für den ursprünglichen Sturgeon-Ohnolog-Satz) entgangen sind hinterließ ein Paar Ohnolog-Doppelgänger in Paddelfisch und Stör. Wir gehen jedoch davon aus, dass PHOGs, bei denen dies aufgetreten ist, in unserem endgültigen 5439 Stör-Paddelfisch-Ohnolog-Paar-Datensatz äußerst selten sind.
Um die Rediploidisierungszeit (dh die Zeit des Duplikationsknotens) im Verhältnis zur Artbildung für jedes Stör-Paddelfisch-Ohnolog-Paar abzuschätzen, führten wir phylogenetische Analysen für jede Genfamilie aus den oben beschriebenen vormonophylisch gefilterten Stör-Paddelfisch-Ohnolog-Paar-PHOGs (5590 Bäume) durch. Mehrere Sequenzabgleiche wurden mit MAFFT v7.487 unter Angabe des Flags --auto und des Flags --anysymbol für diejenigen Datensätze durchgeführt, die Sequenzen enthielten, die Selenocystein (Symbol U) enthielten. Die phylogenetische Inferenz wurde unter Verwendung von IQ-tree86 (v. 2.1.4-beta COVID-edition) mit der Flagge -m JTT + G zur Verwendung des JTT87-Aminosäuresubstitutionsmodells mit vier diskreten Gammakategorien sowie der Option -bb 1000 durchgeführt Flag zur Angabe von 1000 ultraschnellen Bootstrap-Replikaten48. Die resultierenden Maximum-Likelihood-Bäume wurden zur Vorverarbeitung und Ableitung der Duplizierungszeit extrahiert. Um diese Bäume vorzuverarbeiten, verwendeten wir die Python-Bibliothek ETE (v3) Toolkit88, um zu überprüfen, ob Stör- und Paddelfischsequenzen in jedem PHOG-Genbaum einen monophyletischen (im unbewurzelten Sinne) Clan89 bildeten, und verwurzelten dann jeden Baum mit dem am weitesten entfernten Verwandten Reihenfolge im Vergleich zu Stören und Paddelfischen (dh typischerweise Geisterhai/Walhai). In einem separaten Python-Skript wurde dann das ETE-Toolkit verwendet, um einen strikten Genbaum-Arten-Baumabgleich88,90 durchzuführen, um Artbildungs- und Duplikationsknoten/-ereignisse abzuleiten, bevor eine Klassifizierung vorgenommen wurde (PreSpec, PostSpec, „Other“ [PreSpec-like, PostSpec-like ]) und Zusammenfassung der verschiedenen Topologien und Häufigkeiten des Stör-Paddelfisch-Teilbaum-Genbaums.
Um die Möglichkeit zu untersuchen, dass einer der PreSpec- oder PostSpec-Genbäume auf einem Fehler beruht, und um die Quelle der „anderen“ Topologien besser zu verstehen, haben wir eine Reihe von Analysen durchgeführt. Zunächst führten wir unbewurzelte AU-test47-Analysen in IQ-tree86 durch. Zu diesem Zweck haben wir die drei möglichen nicht verwurzelten Topologien unseres Stör-Paddelfisch-Unterbaums mit vier Spitzen entweder als PostSpec-Typ oder PreSpec-Typ klassifiziert, basierend darauf, ob sie bei Verwurzelung zu PostSpec(-like) oder PreSpec(-like) werden würden. Für jede der vier Kategorien der Wurzeltopologie (d. h. PostSpec, PreSpec und die beiden „anderen“ Kategorien PreSpec-like und PostSpec-like) haben wir die Unterausrichtung für die vier Stör-/Paddelfisch-Sequenzen aus jedem PHOG in dieser Kategorie extrahiert und dann führte eine AU-Testanalyse für jeden Ohnolog-Paar-Satz durch und spezifizierte die drei möglichen nicht verwurzelten Topologien. Anschließend wurde die Häufigkeit berechnet und grafisch dargestellt, mit der der übereinstimmende Topologietyp ohne Wurzel für Unterachsen aus jeder Topologiekategorie mit Wurzelbaum nicht abgelehnt wurde.
Als Nächstes haben wir mithilfe eines Python-Skripts und des ETE-Toolkits88 den Einfluss bewertet, den das Filtern unserer Ohnolog-Paar-PHOG-Anzahl durch immer höhere ultraschnelle Bootstrap-Prozentsatz-Grenzwerte (nur für die beiden Unterstützungswerte innerhalb der Vierspitzen-Paddelfisch-Stör-Gruppe berücksichtigt) haben würde haben auf verwurzelten Topologiefrequenzen. Ausgehend von einem Grenzwert von 0 % und in Schritten von 5 % bis zu 100 % bewerteten wir die Gesamtzahl und Prozentsätze der bei jedem Grenzwert wiederhergestellten PostSpec-, PreSpec- und „anderen“ Baumtopologien und beurteilten dann die Trends in Die Häufigkeit der Topologie nahm zu, da die Grenzfrequenz strenger wurde. Wir haben auch die Faltungsabweichung vom Zufall (d. h. wenn alle 15 Topologien gleich häufig wiederhergestellt wurden) berechnet und aufgezeichnet, bei der jede Wurzelbaumkategorie für PostSpec (zufällig erwartet 1/15 Mal), PreSpec (zufällig erwartet 2/15 Mal) und wiederhergestellt wurde „Andere“ (zufällig erwartete 12/15-mal) Topologien in derselben Serie ultraschneller Bootstrap-Abschaltungen und bewerteten die beobachteten Trends.
Um zu beurteilen, ob Genfamilien, die eine Topologie unterstützen, bei der Wiederherstellung anderer allgemein akzeptierter Kladen schlecht abschneiden (49, 50) und daher möglicherweise eher irreführend sind, haben wir ein benutzerdefiniertes ETE-Toolkit88-Python-Skript verwendet, um die Monophylie von drei weithin akzeptierten Kladen zu bewerten. Tetrapoda (Tetrapoden; Monophylie von Menschen, Hühnern und Fröschen), Teleostei (Teleostfische; Monophylie von Fugu und Zebrafischen) und Chondrichthyes (Knorpelfische; Monophylie von Geister-/Elefantenhaien und Walhaien). Dieses Skript erforderte außerdem, dass für jede Art in dieser monophyletischen Gruppe mindestens eine Sequenz vorhanden war, was bedeutet, dass einige Negative auch auf den Verlust oder das Fehlen von Genen in unserem abgeleiteten PHOG zurückzuführen sein können.
Um Anzeichen möglicher systematischer Fehler zu erkennen, verglichen wir eine Reihe von Statistiken auf der Ebene der Sequenzausrichtung, der Modellierung und des abgeleiteten phylogenetischen Baums zwischen Genbäumen, die zu den Baumtopologien PostSpec, PreSpec und „Andere“ passen, unter Verwendung des zweiseitigen Wilcox-Tests mit Bonferroni-Korrektur in R (Version 4.1.2 [01.11.2021])91. Die Ausrichtungslänge und die durchschnittliche paarweise prozentuale Identität wurden mit dem Programm esl-alistat aus dem Hmmer-Paket [Version 3.1b2; http://hmmer.org]92, während die Anzahl der sparsamen Informationsseiten52 aus der IQ-Tree-Ausgabe extrahiert wurde. PhyKIT (v. 1.11.3)51 wurde verwendet, um die Anzahl der variablen Standorte52, die Evolutionsrate (d. h. Gesamtbaumlänge/Anzahl der Blattknoten)53, die Baumart (d. h. Summe der internen Zweiglängen/Gesamtbaumlänge)54 zu berechnen. relative Zusammensetzungsvariabilität (RCV)54, Baumstruktur/RCV52,54 und Sättigungsgrad55.
Um weiter zu untersuchen, ob unsere Ergebnisse auf einem systematischen Fehler beruhen könnten, testeten wir die Verwendung vorberechneter ortsheterogener Mischungsmodelle für den Satz von PHOGs, die maximale Unterstützung für jede Stör-Paddelfisch-Subklassentopologie hatten (ultraschneller Bootstrap = 100 % für beide Unterstützungswerte in). der Stör-Paddelfisch-Unterbaum). Insbesondere haben wir die Passung und den Einfluss der Modelle UL393, EX_EHO94 und JTT + C2095 getestet, was dazu beitragen kann, systematische Verzerrungen zu mildern, und oft gut zu den Ausrichtungen einzelner Genfamilien passt96,97.
Wir analysierten den Satz von Ohnologen, bei denen beide Gene des Paares im Stör vorhanden waren und nur ein einziges Gen im Paddelfisch vorhanden war. Dies wurde durchgeführt, indem der Ansatz in den obigen Abschnitten zu Ohnolog-Paar-Datensätzen und Ohnolog-Duplikationszeit-Inferenz genau befolgt wurde, dieses Mal jedoch PHOGs ausgewählt wurden, die nur eine einzige Paddlefish-Sequenz enthalten. Im Vergleich zu dem für die Haupt-Ohnolog-Paaranalyse verwendeten Python-Skript wurde ein anderes Python-Skript verwendet, um den Stör-Paddelfisch-Teilbaum entweder in den PreSpec-Typ oder den PostSpec-Typ zu klassifizieren (beachten Sie, dass es für diesen Drei-Spitzen-Teilbaum nur drei insgesamt verwurzelte Bäume gibt). , ein PostSpec[-like] und zwei PreSpec[-like]). Um die Verteilung der beobachteten PreSpec-Typ- und PostSpec-Typ-Bäume besser zu verstehen, haben wir überlegt, ob die Paddelfisch-Gene in PostSpec-Typ-Bäumen (wo die ohnologen Regionen wahrscheinlich ähnlicher sind, da sie erst nach der Stör-Paddelfisch-Artbildung divergierten) möglicherweise vorhanden sind Dies resultiert aus der Zusammenführung zweier Ohnologs zu einem einzigen Montagebereich und nicht aus einer einzigen Kopie. Um dies zu testen, haben wir die DNA-Sequenzierungslesungen des Paddelfisch-Genoms (erhalten aus CNGBdb-Experimenten CNX0162203-5, aus dem Projekt CNP0000867, verfügbar unter https://db.cngb.org/search/project/CNP0000867/)8 auf die Paddelfisch-Genomassemblierung abgebildet Fliege (v. 2.4.2). Für die ausgerichteten Daten wurde mit SAMtools (v. 1.16.1)98 eine sortierte BAM-Datei generiert. Für drei separate Gensätze (Zwei-Kopien-Ohnolog-Paar-Gene [Hauptdatensatz] und Gene vom PreSpec-Typ und PostSpec-Typ, die bei Paddelfischen eine Einzelkopie sind, beim Stör jedoch ein Ohnolog-Paar bilden) wurde die Genabdeckung durch Extrahieren der rohen Lesetiefe pro berechnet Gen (d. h. ein Durchschnittswert von Anfang bis Ende für jedes Gen; Genabdeckung) aus der BAM unter Verwendung des Flags --by in mos Depth (v. 0.3.3)99.
Der ksd-Befehl aus dem wgd-Tool59 wurde mit Standardparametern verwendet, um paarweise Ks-Werte für zehn verschiedene Ohnolog/Ortholog-Paardatensätze zu berechnen; Acht davon waren die arteninternen PostSpec-, PostSpec-like-, PreSpec- und PreSpec-like-Ohnolog-Paare von Paddelfisch und Stör, während die restlichen zwei aus Ortholog-Paaren von (i) den jeweils zwei Stör-Paddelfisch-Ortholog-Paaren bestanden PreSpec-Genbaum und (ii) die in allen Arten vorhandenen Einzelkopie-Orthogruppen, wie in unserer OrthoFinder-Analyse abgeleitet. Dieser letztere Satz von Einzelkopie-Orthogruppen könnte möglicherweise einige versteckte Ohnologs enthalten, wenn es Fälle von unterschiedlichem PreSpec-Ohnolog-Verlust zwischen Stör und Paddelfisch gibt, und ist daher anfälliger für Verzerrungen, aber dennoch ein nützlicher Vergleich. In jedem Fall wurde die entsprechende Kodierungssequenz zu den in Genbaumanalysen verwendeten Aminosäuresequenzen angewendet, und Paare, bei denen eine der Sequenzen durch wgd mit einer Warnung gekennzeichnet war, wurden entfernt und wgd erneut ausgeführt. Paare mit Ks-Werten ≥ 0,3 wurden in den endgültigen Daten zur Visualisierung nicht berücksichtigt. Um die Analysen der Orthologpaar-Peak-Ks-Unterschiede zwischen Paddelfischen und Stören zu ergänzen, wurden die orthologen Zweiglängen von Stör und Paddelfischen verglichen, um Unterschiede in der Aminosäureentwicklungsrate bei Substitutionen pro Stelle in jeder Art zu ermitteln. Für diese Analyse stellten wir sicher, dass alle Genbäume in Übereinstimmung mit der Phylogenie der Wirbeltiere mit breiterem Kiefer verwurzelt waren und dass Stör- und Paddelfischsequenzen eine monophyletische Gruppierung bildeten (gemäß dem obigen Unterabschnitt „Ohnolog-Paardatensatzmethoden“). Anschließend extrahierten wir Astlängen für Stör und Paddelfisch aus jedem der beiden PreSpec-Stör-Paddelfisch-Orthologen sowie aus Einzelkopie-Orthogruppen (für die Alignments und Genbäume gemäß den MAFFT- und IQ-Baumeinstellungen erstellt wurden, die bei der Ohnolog-Duplikation verwendet wurden). Zeitinferenzmethoden im Unterabschnitt oben) mithilfe eines benutzerdefinierten ETE-Toolkit-Python-Skripts. Die Monophysenprüfung der Stör-Paddelfisch-Klade und der Fokus auf PreSpec-Orthologen und (in geringerem Maße) Single-Copy-Orthogruppen sollten sicherstellen, dass die Divergenz des Stör- und Paddelfisch-Sequenzpaars die Orthologdivergenz seit der Artbildung widerspiegelt. Somit erfasst die Variation dieser Verzweigungslängen zwischen den Arten speziell die Variation der Substitutionsrate. Eine diesbezügliche Einschränkung besteht für Einzelkopie-Orthogruppen, bei denen ein differenzieller Ohnologe-Verlust, der zu versteckten Ohnologen führt, die Analyse dieses Datensatzes irreführen könnte. Wir haben die Zweiglängen von Stör und Paddelfisch mithilfe des Wilcox-Tests mit paarweiser Stichprobe in R (Version 4.1.2 [01.11.2021])91 verglichen. Extreme Ausreißer-Orthologenpaare mit Zweiglängenwerten ≥ 0,15 wurden zur Visualisierung oder zum statistischen Vergleich nicht in die endgültigen Daten einbezogen.
Die genomischen Koordinaten jedes Gens in einem Ohnolog-Paar wurden verwendet, um Verbindungen zwischen Ohnologs auf Circos-Plots (gezeichnet mit Circos-0,69-9100) des Stör- und Paddelfisch-Genoms zu verankern. Alle Mitglieder eines Ohnolog-Paares mussten auf den größten 60 einzubeziehenden Chromosomen vorhanden sein. Zur Darstellung beider Arten in einem einzigen Zirkusdiagramm wurden PreSpec-Ohnolog-Paare in separate Ohnologs aufgeteilt, um sie als Orthologe zwischen Arten darzustellen, während PostSpec-Ohnolog-Paare als Ohnologe innerhalb von Arten gemäß den einzelnen Artendiagrammen dargestellt wurden.
Um eine Untergrenze für die Stör-Paddelfisch-WGD abzuschätzen, haben wir den Satz von Genbäumen extrahiert, um die PreSpec-Stör-Paddelfisch-Ohnolog-Paartopologie mit maximaler Unterstützung wiederherzustellen (ultraschneller Bootstrap = 100 % für beide Unterstützungswerte im Stör-Paddelfisch-Teilbaum). Um die Vorbereitung für die phylogenomische Analyse zu vereinfachen und die Berechnungszeit für Datierungsanalysen zu verkürzen, haben wir dann nach Genfamilien gefiltert, die ansonsten Einzelkopien waren, was zu einem Satz von 81 Genfamilien führte. Wir haben fünf unterschiedliche Datensätze generiert, indem wir Ohnologs aus einem Paar zufällig als A- oder B-Kopie zugewiesen haben, bevor alle 81 vorhandenen Mehrfachsequenz-Alignments der Genfamilie verkettet wurden. Dies vermeidet Verzerrungen aufgrund einer einzelnen willkürlichen Verkettung und ermöglicht gleichzeitig die Beurteilung, wie robust die Ergebnisse gegenüber Variationen in ohnologischen Verkettungen sind62.
Nach der Verkettung wurde jede Supermatrix dann mit trimAl101 (-nogaps) und BMGE102 (-m BLOSUM62) gefiltert, um lückenreiche und gesättigte Stellen zu trimmen, woraufhin in jedem Datensatz 42.126 Aminosäure-Ausrichtungsstellen verblieben.
Anschließend wurde eine phylogenomische Divergenzdatierung (für jede der fünf alternativen Supermatrizen) in Phylobayes63 (Version 4.1c) durchgeführt, wobei das ortsheterogene CAT-GTR + G465-Substitutionsmodell zusammen mit einem autokorrelierten lognormalen entspannten Uhrenmodell64 (das passt und funktioniert) spezifiziert wurde gut in der Phylogenomik von Kieferwirbeltieren85) und ein Geburt-Tod-Priori mit weichen Grenzen103,104 bei Fossilkalibrierungen. Für die meisten Knoten im Baum wurden Priors der Fossilkalibrierung (Supplementary Data 1) festgelegt, mit Ausnahme des WGD-Timing-Knotens für die untere Grenze des Stör-Paddelfischs und des Knotens, der Störe und Paddelfische (Acipenseriformes) aus Neopterygii spaltet. Die Kalibrierungen, einschließlich einer Mindestdivergenz von 121 Ma70,71 für Störe und Paddelfische, folgten Benton et al.72, mit Ausnahme der Untergrenze für Kronen-Chondrichthyes, die auf 381 Ma105 festgelegt wurde. Eine zweite Analyse wurde auch mit weniger Rochenfischknoten durchgeführt, die entsprechend der Schwierigkeit kalibriert wurden, paläozoische Fossilien aus dieser Abstammungslinie phylogenetisch zu platzieren66, insbesondere die Kronen-Actinopterygii-, Kronen-Neopterygii- und Kronen-Holostei-Knoten. Eine feste Baumtopologie („((GhostShark,WhaleShark),((Coelacanth,(Frog,(Human,Chicken))),(Bichir,(((PaddlefishA,SturgeonA),(PaddlefishB,SturgeonB)),((Zebrafish, Fugu),(Gar,Amia))))));") wurde basierend auf der akzeptierten Phylogenie der Kieferwirbeltiere7,8,35,85 und unserer Schlussfolgerung einer gemeinsamen WGD spezifiziert, und die Chondrichthyes-Vertreter, Geisterhai und Walhai, waren es als Außengruppe festgelegt. Wir haben diese Topologie für jeden unserer fünf Datensätze überprüft, indem wir eine grundlegende verkettete phylogenomische Analyse in IQ-tree86 unter dem JTT + G4-Modell87 mit 1000 UFBoot-Bootstrap-Replikaten48 durchgeführt haben.
Jede Monte-Carlo-Analyse der Phylobayes-Markov-Kette wurde für mindestens 10.000 Zyklen beprobt, wobei die ersten 5.000 als Burn-in verworfen wurden, bevor die abgeleiteten Divergenzdaten und 95 %-Glaubwürdigkeitsintervalle berechnet wurden. Läufe unter dem Prior wurden mit den gleichen Einstellungen durchgeführt, außer dass aus Gründen der Recheneffizienz auf ein ortshomogenes Poisson-Substitutionsmodell umgestellt wurde, da die Divergenzzeiten des Priors unabhängig von den Priors des Substitutionsmodells sind, um zu überprüfen, ob der Prior auf dem Stör-Paddelfisch-WGD niedriger ist Das gebundene Timing war ausreichend diffus, um nicht aussagekräftig zu sein.
Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.
Die in dieser Studie generierten Alignments, Genbäume, Zufallsverkettungs-Supermatrizen und phylogenomischen Datierungschronogramme werden auf figshare (https://doi.org/10.6084/m9.figshare.19762963.v1) bereitgestellt106. Die in dieser Studie generierten Kalibrierungen der phylogenomischen Datierungsknoten und das abgeleitete Alter sind in den Zusatzdaten 1 enthalten. Die abgeleiteten Topologiekategorien, AU-Testergebnisse, UFBoot-Grenzwerte, Wiederherstellung außerhalb der Zielgruppe, Ausrichtung, Modellierung und Genbaumstatistik sowie Synteniedaten , Ks-Werte, Lesetiefenabdeckung über Paddelfisch-Ohnologs und in dieser Studie generierte orthologe Zweiglängendaten werden in der Quelldatendatei bereitgestellt. Die DNA-Sequenzierungs-Lesedaten, die in dieser Studie zur Bewertung des möglichen Zusammenbruchs ohnologer Regionen im Paddelfisch-Genom verwendet wurden, sind in der CNGBdb-Datenbank unter den Zugangscodes CNX0162203-5 verfügbar (aus dem Projekt CNP0000867, verfügbar unter https://db.cngb.org/). Suche/Projekt/CNP0000867/). Quelldaten werden mit diesem Dokument bereitgestellt.
Alle benutzerdefinierten ETE3-basierten Genbaum-Parsing-Python-Skripte sind auf figshare verfügbar (https://doi.org/10.6084/m9.figshare.19762963.v1)106.
Mandáková, T. & Lysak, MA Postpolyploide Diploidisierung und Diversifizierung durch dysploide Veränderungen. Curr. Meinung. Pflanzenbiol. 42, 55–65 (2018).
Artikel PubMed Google Scholar
Blanc, G. & Wolfe, KH Weit verbreitete Paläopolyploidie bei Modellpflanzenarten, abgeleitet aus Altersverteilungen doppelter Gene. Pflanzenzelle 16, 1667–1678 (2004).
Artikel CAS PubMed PubMed Central Google Scholar
Soltis, PS & Soltis, DE Alte WGD-Ereignisse als Treiber wichtiger Innovationen bei Angiospermen. Curr. Meinung. Pflanzenbiol. 30, 159–165 (2016).
Artikel PubMed Google Scholar
Clark, JW & Donoghue, PCJ Duplikation des gesamten Genoms und Pflanzenmakroevolution. Trends Pflanzenwissenschaft. 23, 933–945 (2018).
Artikel CAS PubMed Google Scholar
Wolfe, KH & Shields, DC Molekulare Beweise für eine uralte Vervielfältigung des gesamten Hefegenoms. Nature 387, 708–713 (1997).
Artikel ADS CAS PubMed Google Scholar
Marcet-Houben, M. & Gabaldón, T. Jenseits der Vervielfältigung des gesamten Genoms: Phylogenetischer Beweis für eine alte Interspezies-Hybridisierung in der Bäckerhefe-Linie. PLOS Biol. 13, e1002220 (2015).
Artikel PubMed PubMed Central Google Scholar
Du, K. et al. Die Genomsequenz des Sterlet-Störs und die Mechanismen der segmentalen Rediploidisierung. Nat. Ökologisch. Entwicklung 4, 841–852 (2020).
Artikel PubMed PubMed Central Google Scholar
Cheng, P. et al. Das Genom des amerikanischen Paddelfisches bietet neue Einblicke in die Chromosomenentwicklung und Knochenmineralisierung bei frühen Wirbeltieren. Mol. Biol. Entwicklung 38, 1595–1607 (2021).
Artikel CAS PubMed Google Scholar
Furlong, RF & Holland, PWH Waren Wirbeltiere oktoploid? Philos. Trans. R. Soc. B Biol. Wissenschaft. 357, 531–544 (2002).
Artikel CAS Google Scholar
Meyer, A. & Van de Peer, Y. Von 2R zu 3R: Hinweise auf eine fischspezifische Genomduplikation (FSGD). BioEssays N. Rev. Mol. Zelle. Entwickler Biol. 27, 937–945 (2005).
CAS Google Scholar
Nakatani, Y. et al. Die Rekonstruktion der Proto-Vertebraten-, Proto-Cyclostom- und Proto-Gnathostom-Genome liefert neue Einblicke in die frühe Wirbeltierentwicklung. Nat. Komm. 12, 4489 (2021).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Simakov, O. et al. Tief konservierte Syntenie löst frühe Ereignisse in der Wirbeltierentwicklung auf. Nat. Ökologisch. Entwicklung 4, 820–830 (2020).
Artikel PubMed PubMed Central Google Scholar
Parey, E. et al. Ein Atlas der Genomentwicklung von Fischen zeigt eine verzögerte Rediploidisierung nach der Vervielfältigung des gesamten Genoms von Knochenfischen. Genomres. 32, 1685–1697 (2022).
Hokamp, K., McLysaght, A. & Wolfe, KH Die 2R-Hypothese und die Sequenz des menschlichen Genoms. in Genome Evolution (Hrsg. Meyer, A. & Van de Peer, Y.) 95–110 (Springer Niederlande, 2003). https://doi.org/10.1007/978-94-010-0263-9_10.
Taylor, RS, Daniels, RR, Morata, DP, Gundappa, MK & Macqueen, DJ Evolution von Rochenfischgenomen: Status und Richtungen mit einem Primer zur microRNA-Charakterisierung. in Cellular and Molecular Approaches in Fish Biology 309–346 (Elsevier, 2022).
Xu, P. et al. Der allotetraploide Ursprung und die asymmetrische Genomentwicklung des Karpfens Cyprinus carpio. Nat. Komm. 10, 4625 (2019).
Artikel ADS PubMed PubMed Central Google Scholar
Session, AM et al. Genomentwicklung beim allotetraploiden Frosch Xenopus laevis. Natur 538, 336–343 (2016).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Lien, S. et al. Das Genom des Atlantischen Lachses liefert Einblicke in die Rediploidisierung. Natur 533, 200–205 (2016).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Van de Peer, Y., Maere, S. & Meyer, A. Die evolutionäre Bedeutung antiker Genomduplikationen. Nat. Rev. Genet. 10, 725–732 (2009).
Artikel PubMed Google Scholar
Van de Peer, Y., Mizrachi, E. & Marchal, K. Die evolutionäre Bedeutung der Polyploidie. Nat. Rev. Genet. 18, 411–424 (2017).
Artikel PubMed Google Scholar
Conant, GC & Wolfe, KH Ein Hobby zum Beruf machen: Wie duplizierte Gene neue Funktionen finden. Nat. Rev. Genet. 9, 938–950 (2008).
Artikel CAS PubMed Google Scholar
Li, Z. et al. Muster und Prozesse der Diploidisierung in Landpflanzen. Annu. Rev. Plant Biol. 72, 387–410 (2021).
Artikel CAS PubMed Google Scholar
Wolfe, KH Die Polyploiden von gestern und das Geheimnis der Diploidisierung. Nat. Rev. Genet. 2, 333–341 (2001).
Artikel CAS PubMed Google Scholar
Robertson, FM et al. Abstammungsspezifische Rediploidisierung ist ein Mechanismus zur Erklärung von Zeitverzögerungen zwischen Genomduplikation und evolutionärer Diversifizierung. Genombiol. 18, 111 (2017).
Artikel PubMed PubMed Central Google Scholar
Conant, GC, Birchler, JA & Pires, JC Dosierung, Duplikation und Diploidisierung: Klärung des Zusammenspiels mehrerer Modelle für die Entwicklung doppelter Gene im Laufe der Zeit. Curr. Meinung. Pflanzenbiol. 19, 91–98 (2014).
Artikel CAS PubMed Google Scholar
Gundappa, MK et al. Genomweite Rekonstruktion der Rediploidisierung nach Autopolyploidisierung über einhundert Millionen Jahre Salmonidenevolution. Mol. Biol. Entwicklung 39, msab310 (2022).
Artikel CAS PubMed Google Scholar
Martin, KJ & Holland, PWH Rätselhafte orthologische Beziehungen zwischen Hox-Clustern des Afrikanischen Falterfisches und anderen Knochenfischen nach alter Duplikation des gesamten Genoms. Mol. Biol. Entwicklung 31, 2592–2611 (2014).
Artikel CAS PubMed PubMed Central Google Scholar
Rozenfeld, C. et al. Das De-novo-Transkriptom des europäischen Aals bietet Einblicke in die Evolutionsgeschichte duplizierter Gene in Knochenfischlinien. PLOS ONE 14, e0218085 (2019).
Artikel CAS PubMed PubMed Central Google Scholar
Hughes, AL Die Entwicklung funktionell neuer Proteine nach Genduplikation. Proz. R. Soc. London. B Biol. Wissenschaft. 256, 119–124 (1994).
Artikel ADS CAS Google Scholar
Ohno, S. Evolution durch Genduplikation. (Springer-Verlag, 1970).
Scannell, DR, Byrne, KP, Gordon, JL, Wong, S. & Wolfe, KH Mehrere Artbildungsrunden im Zusammenhang mit reziprokem Genverlust in polyploiden Hefen. Natur 440, 341–345 (2006).
Artikel ADS CAS PubMed Google Scholar
Clark, JW & Donoghue, PCJ Beschränkung des Zeitpunkts der Duplikation des gesamten Genoms in der Pflanzenevolutionsgeschichte. Proz. R. Soc. B Biol. Wissenschaft. 284, 20170912 (2017).
Artikel Google Scholar
Chen, Y.-C. et al. Das Litsea-Genom und die Entwicklung der Lorbeerfamilie. Nat. Komm. 11, 1675 (2020).
Artikel ADS PubMed PubMed Central Google Scholar
Carretero-Paulet, L. & Van de Peer, Y. Das evolutionäre Rätsel der Duplikation des gesamten Genoms. Bin. J. Bot. 107, 1101–1105 (2020).
Artikel PubMed PubMed Central Google Scholar
Bi, X. et al. Verfolgung der genetischen Fußabdrücke der Landung von Wirbeltieren bei Rochenfischen ohne Knochenflossen. Zelle 184, 1377–1391.e14 (2021).
Artikel CAS PubMed Google Scholar
Thompson, AW et al. Das Bowfin-Genom beleuchtet die Entwicklungsentwicklung von Rochenfischen. Nat. Genet. 53, 1373–1384 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Dehal, P. & Boore, JL Zwei Runden der Duplikation des gesamten Genoms im Wirbeltier der Vorfahren. PLoS Biol. 3, e314 (2005).
Artikel PubMed PubMed Central Google Scholar
Cheng, P. et al. Entwurf des Genoms und vollständige Hox-Cluster-Charakterisierung des Sterlets (Acipenser ruthenus). Vorderseite. Genet. 10, 776 (2019).
Artikel CAS PubMed PubMed Central Google Scholar
Braasch, I. et al. Das Genom des Gefleckten Gars beleuchtet die Evolution der Wirbeltiere und erleichtert Vergleiche zwischen Menschen und Knochentieren. Nat. Genet. 48, 427–437 (2016).
Artikel CAS PubMed PubMed Central Google Scholar
Fontana, F. Chromosomale nukleoläre Organisatorregionen in 4 Störarten als Marker der Karyotypentwicklung bei Acipenseriformes (Fische). Genom 37, 888–892 (1994).
Artikel CAS PubMed Google Scholar
Havelka, M., Hulák, M., Bailie, DA, Prodöhl, PA & Flajšhans, M. Umfangreiche Genomduplikationen bei Stören: neue Erkenntnisse aus Mikrosatellitendaten. J. Appl. Ichthyol. 29, 704–708 (2013).
Artikel Google Scholar
Ohno, S. et al. Mikrochromosomen in holozephalen, chondrostäischen und holostäischen Fischen. Chromosoma 26, 35–40 (1969).
Artikel CAS PubMed Google Scholar
Zhang, H. et al. Aussterben eines der größten Süßwasserfische der Welt: Lehren für den Schutz der gefährdeten Jangtse-Fauna. Wissenschaft. Gesamtumgebung. 710, 136242 (2020).
Artikel ADS CAS PubMed Google Scholar
Crow, KD, Smith, CD, Cheng, J.-F., Wagner, GP & Amemiya, CT Eine unabhängige Genomduplikation, abgeleitet aus Hox-Paralogs beim Amerikanischen Paddelfisch – einem repräsentativen Basalstrahlenflossenfisch und wichtigen Vergleichsreferenz. Genombiol. Entwicklung 4, 937–953 (2012).
Artikel PubMed PubMed Central Google Scholar
Symonová, R. et al. Molekulare zytogenetische Differenzierung von Paralogs von Hox-Paralogs im duplizierten und rediploidisierten Genom des nordamerikanischen Paddelfisches (Polyodon spathula). BMC Genet. 18, 19 (2017).
Artikel PubMed PubMed Central Google Scholar
Dingerkus, G. & Howell, WM Karyotypische Analyse und Nachweis von Tetraploidie beim nordamerikanischen Paddelfisch, Polyodon spathula. Science 194, 842–844 (1976).
Artikel ADS CAS PubMed Google Scholar
Shimodaira, H. Ein annähernd unvoreingenommener Test der phylogenetischen Baumauswahl. Syst. Biol. 51, 492–508 (2002).
Artikel PubMed Google Scholar
Hoang, DT, Chernomor, O., von Haeseler, A., Minh, BQ & Vinh, LS UFBoot2: Verbesserung der ultraschnellen Bootstrap-Approximation. Mol. Biol. Entwicklung 35, 518–522 (2018).
Artikel CAS PubMed Google Scholar
Siu-Ting, K. et al. Unbeabsichtigter Einschluss von Paralog führt zu künstlichen Topologien und Zeitbaumschätzungen in der Phylogenomik. Mol. Biol. Entwicklung 36, 1344–1356 (2019).
Artikel CAS PubMed PubMed Central Google Scholar
Philippe, H. et al. Die Abschwächung der erwarteten Auswirkungen systematischer Fehler unterstützt die Schwestergruppenbeziehung zwischen Xenacoelomorpha und Ambulacraria. Curr. Biol. CB 29, 1818–1826.e6 (2019).
Artikel CAS PubMed Google Scholar
Steenwyk, JL et al. PhyKIT: ein breit anwendbares UNIX-Shell-Toolkit zur Verarbeitung und Analyse phylogenomischer Daten. Bioinformatik 37, 2325–2331 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Shen, X.-X., Salichos, L. & Rokas, A. Eine Untersuchung im Genommaßstab, wie Sequenz, Funktion und baumbasierte Geneigenschaften die phylogenetische Inferenz beeinflussen. Genombiol. Entwicklung 8, 2565–2580 (2016).
Artikel CAS PubMed PubMed Central Google Scholar
Telford, MJ et al. Die phylogenomische Analyse der Klassenbeziehungen der Stachelhäuter stützt Asterozoa. Proz. R. Soc. B Biol. Wissenschaft. 281, 20140479 (2014).
Artikel Google Scholar
Phillips, MJ & Penny, D. Die Wurzel des Säugetierbaums, abgeleitet aus ganzen mitochondrialen Genomen. Mol. Phylogenet. Entwicklung 28, 171–185 (2003).
Artikel CAS PubMed Google Scholar
Philippe, H. et al. Lösung schwieriger phylogenetischer Fragen: Warum mehr Sequenzen nicht ausreichen. PLOS Biol. 9, e1000602 (2011).
Artikel CAS PubMed PubMed Central Google Scholar
Lartillot, N., Brinkmann, H. & Philippe, H. Unterdrückung von Langzweig-Anziehungsartefakten in der Tierphylogenie mithilfe eines ortsheterogenen Modells. BMC Evol. Biol. 7, S4 (2007).
Artikel PubMed PubMed Central Google Scholar
Varadharajan, S. et al. Das Grayling-Genom enthüllt die Selektion der Genexpressionsregulation nach der Vervielfältigung des gesamten Genoms. Genombiol. Entwicklung 10, 2785–2800 (2018).
Artikel CAS PubMed PubMed Central Google Scholar
Lahn, BT & Page, DC Vier Evolutionsschichten auf dem menschlichen X-Chromosom. Science 286, 964–967 (1999).
Artikel CAS PubMed Google Scholar
Zwaenepoel, A. & Van de Peer, Y. wgd – einfache Befehlszeilentools für die Analyse alter Duplikationen des gesamten Genoms. Bioinformatik 35, 2153–2155 (2019).
Artikel CAS PubMed Google Scholar
Tiley, GP, Barker, MS & Burleigh, JG Bewertung der Leistung von Ks-Plots zur Erkennung alter Duplikationen des gesamten Genoms. Genombiol. Entwicklung 10, 2882–2898 (2018).
PubMed PubMed Central Google Scholar
Zwaenepoel, A., Li, Z., Lohaus, R. & Peer, YV de. Suche nach Beweisen für Duplikationen des gesamten Genoms: Eine Neubewertung. Mol. Werk 12, 133–136 (2019).
Artikel CAS PubMed Google Scholar
Macqueen, DJ & Johnston, IA Eine genaue Schätzung des Zeitpunkts der Duplikation des gesamten Salmonidengenoms zeigt eine erhebliche Entkopplung von der Artendiversifizierung. Proz. Biol. Wissenschaft. 281, 20132881 (2014).
PubMed PubMed Central Google Scholar
Lartillot, N., Lepage, T. & Blanquart, S. PhyloBayes 3: ein Bayesianisches Softwarepaket für phylogenetische Rekonstruktion und molekulare Datierung. Bioinformatik 25, 2286–2288 (2009).
Artikel CAS PubMed Google Scholar
Thorne, JL, Kishino, H. & Painter, IS Schätzung der Entwicklungsrate der molekularen Evolutionsrate. Mol. Biol. Entwicklung 15, 1647–1657 (1998).
Artikel CAS PubMed Google Scholar
Lartillot, N. & Philippe, H. Ein Bayesianisches Mischungsmodell für standortübergreifende Heterogenitäten im Aminosäureaustauschprozess. Mol. Biol. Entwicklung 21, 1095–1109 (2004).
Artikel CAS PubMed Google Scholar
Giles, S., Xu, G.-H., Near, TJ & Friedman, M. Frühe Mitglieder der Abstammungslinie der „lebenden Fossilien“ deuten auf eine spätere Entstehung moderner Rochenfische hin. Natur 549, 265–268 (2017).
Artikel ADS CAS PubMed Google Scholar
Káldy, J. et al. Hybridisierung von Russischem Stör (Acipenser gueldenstaedtii, Brandt und Ratzeberg, 1833) und Amerikanischem Paddelfisch (Polyodon spathula, Walbaum 1792) und Bewertung ihrer Nachkommen. Gene 11, 753 (2020).
Artikel PubMed PubMed Central Google Scholar
Ocampo Daza, D., Bergqvist, CA & Larhammar, D. Die Entwicklung der Oxytocin- und Vasotocin-Rezeptorgene bei Wirbeltieren mit Kiefer: Ein klarer Fall für Genduplikationen durch Duplikationen des gesamten Genoms der Vorfahren. Vorderseite. Endokrinol. 12, 792644 (2022).
Artikel Google Scholar
Davesne, D. et al. Versteinerte Zellstrukturen weisen auf einen antiken Ursprung für die Vervielfältigung des Gesamtgenoms von Knochenfischen hin. Proz. Natl Acad. Wissenschaft. 118, e2101780118 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Grande, L., Jin, F., Yabumoto, Y. & Bemis, WE Protopsephurus liui, ein gut erhaltener primitiver Paddelfisch (Acipenseriformes: Polyodontidae) aus der Unterkreide Chinas. J. Wirbel. Paläontol. 22, 209–237 (2002).
Artikel Google Scholar
Swisher, CC et al. Weitere Belege für ein Kreidezeitalter für die Gefieder-Dinosaurier-Schichten von Liaoning, China: Neue 40Ar-39Ar-Datierung der Yixian- und Tuchengzi-Formationen. Kinn. Wissenschaft. Stier. 47, 136–139 (2002).
Google Scholar
Benton, MJ et al. Einschränkungen der Zeitskala der Evolutionsgeschichte der Tiere. Paläontol. Electron 18, 1–107 (2015).
Google Scholar
Fawcett, JA, Maere, S. & Van de Peer, Y. Pflanzen mit Doppelgenomen hätten möglicherweise eine bessere Chance gehabt, das Kreide-Tertiär-Aussterben zu überleben. Proz. Natl Acad. Wissenschaft. USA 106, 5737–5742 (2009).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Bemis, WE, Findeis, EK & Grande, L. Ein Überblick über Acipenseriformes. Umgebung. Biol. Fische 48, 25–71 (1997).
Artikel Google Scholar
Hilton, EJ & Forey, PL Neubeschreibung von †Chondrosteus acipenseroides Egerton, 1858 (Acipenseriformes, †Chondrosteidae) aus dem Lower Lias von Lyme Regis (Dorset, England), mit Kommentaren zur frühen Entwicklung von Stören und Paddelfischen. J. Syst. Paläontol. 7, 427–453 (2009).
Lu, L., Tan, K. & Wang, X. Neubeschreibung von Eochondrosteus sinensis (Acipenseriformes, Actinopterygii) und seinem geologischen Alter. Erdwissenschaft. Vorderseite. 27, 371–381 (2020).
Google Scholar
Bemis, WE & Kynard, B. Störflüsse: eine Einführung in die Biogeographie und Lebensgeschichte der Acipenseriformen. Umgebung. Biol. Fische 48, 167–183 (1997).
Hibbins, MS & Hahn, MW Phylogenomische Ansätze zur Erkennung und Charakterisierung von Introgression. Genetik 220, iyab173 (2022).
Artikel PubMed Google Scholar
Smith, JJ et al. Die Sequenzierung des Genoms des Meerneunauges (Petromyzon marinus) liefert Einblicke in die Evolution der Wirbeltiere. Nat. Genet. 45, 415–421 421e1-2 (2013).
Artikel CAS PubMed PubMed Central Google Scholar
Smith, JJ & Keinath, MC Die meiotische Karte des Meerneunauges verbessert die Auflösung alter Genomduplikationen von Wirbeltieren. Genomres. 25, 1081–1090 (2015).
Artikel CAS PubMed PubMed Central Google Scholar
Kuraku, S., Meyer, A. & Kuratani, S. Zeitpunkt der Genomduplikationen im Verhältnis zum Ursprung der Wirbeltiere: Divergierten die Zyklostome vorher oder nachher? Mol. Biol. Entwicklung 26, 47–59 (2009).
Artikel CAS PubMed Google Scholar
Emms, DM & Kelly, S. OrthoFinder: Phylogenetische Orthologie-Inferenz für die vergleichende Genomik. Genombiol. 20, 238 (2019).
Artikel PubMed PubMed Central Google Scholar
Venkatesh, B. et al. Das Genom des Elefantenhais bietet einzigartige Einblicke in die Evolution des Gnathostoms. Natur 505, 174–179 (2014).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Tan, M. et al. Das Walhai-Genom enthüllt Muster der Evolution der Genfamilie von Wirbeltieren. eLife 10, e65394 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Irisarri, I. et al. Phylotranskriptomische Konsolidierung des Zeitbaums der Kieferwirbeltiere. Nat. Ökologisch. Entwicklung 1, 1370–1378 (2017).
Artikel PubMed PubMed Central Google Scholar
Minh, BQ et al. IQ-TREE 2: Neue Modelle und effiziente Methoden zur phylogenetischen Inferenz im Genomzeitalter. Mol. Biol. Entwicklung 37, 1530–1534 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Jones, DT, Taylor, WR & Thornton, JM Die schnelle Generierung von Mutationsdatenmatrizen aus Proteinsequenzen. Berechnen. Appl. Biowissenschaften. CABIOS 8, 275–282 (1992).
CAS PubMed Google Scholar
Huerta-Cepas, J., Serra, F. & Bork, P. ETE 3: Rekonstruktion, Analyse und Visualisierung phylogenomischer Daten. Mol. Biol. Entwicklung 33, 1635–1638 (2016).
Artikel CAS PubMed PubMed Central Google Scholar
Wilkinson, M., McInerney, JO, Hirt, RP, Foster, PG & Embley, TM Von Kladen und Clans: Begriffe für phylogenetische Beziehungen in unbewurzelten Bäumen. Trends Ecol. Entwicklung 22, 114–115 (2007).
Artikel PubMed Google Scholar
Page, RD & Charleston, MA Vom Gen zur Phylogenie des Organismus: Versöhnte Bäume und das Genbaum/Artenbaum-Problem. Mol. Phylogenet. Entwicklung 7, 231–240 (1997).
Artikel CAS PubMed Google Scholar
R-Kernteam. R: Eine Sprache und Umgebung für statistische Berechnungen. (R Foundation for Statistical Computing, 2021).
Eddy, SR Beschleunigte Profil-HMM-Suchen. PLOS-Computing. Biol. 7, e1002195 (2011).
Artikel ADS MathSciNet CAS PubMed Central Google Scholar
Le, SQ, Lartillot, N. & Gascuel, O. Phylogenetische Mischungsmodelle für Proteine. Philos. Trans. R. Soc. B Biol. Wissenschaft. (2008) https://doi.org/10.1098/rstb.2008.0180.
Le, SQ & Gascuel, O. Die Berücksichtigung der Lösungsmittelzugänglichkeit und der Sekundärstruktur in der Proteinphylogenetik ist eindeutig von Vorteil. Syst. Biol. 59, 277–287 (2010).
Artikel CAS PubMed Google Scholar
Si Quang, L., Gascuel, O. & Lartillot, N. Empirische Profilmischungsmodelle für die phylogenetische Rekonstruktion. Bioinformatik 24, 2317–2323 (2008).
Artikel Google Scholar
Redmond, AK & McLysaght, A. Hinweise auf Schwämme als Schwester aller anderen Tiere aus der partitionierten Phylogenomik mit Mischungsmodellen und Neukodierung. Nat. Komm. 12, 1783 (2021).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Redmond, AK, Macqueen, DJ & Dooley, H. Phylotranscriptomics legt nahe, dass der Vorfahre des Kieferwirbeltiers verschiedene Untergruppen von Helfer- und regulatorischen T-Zellen erzeugen könnte. BMC Evol. Biol. 18, 169 (2018).
Artikel CAS PubMed PubMed Central Google Scholar
Danecek, P. et al. Zwölf Jahre SAMtools und BCFtools. GigaScience 10, giab008 (2021).
Artikel PubMed PubMed Central Google Scholar
Pedersen, BS & Quinlan, AR Mos Depth: schnelle Abdeckungsberechnung für Genome und Exome. Bioinformatik 34, 867–868 (2018).
Artikel CAS PubMed Google Scholar
Krzywinski, MI et al. Circos: Eine Informationsästhetik für die vergleichende Genomik. Genomres. (2009) https://doi.org/10.1101/gr.092759.109.
Capella-Gutiérrez, S., Silla-Martínez, JM & Gabaldón, T. trimAl: ein Werkzeug zum automatisierten Alignment-Trimmen in groß angelegten phylogenetischen Analysen. Bioinformatik 25, 1972–1973 (2009).
Artikel PubMed PubMed Central Google Scholar
Criscuolo, A. & Gribaldo, S. BMGE (Block Mapping and Gathering with Entropy): eine neue Software zur Auswahl phylogenetisch informativer Regionen aus mehreren Sequenz-Alignments. BMC Evol. Biol. 10, 210 (2010).
Artikel PubMed PubMed Central Google Scholar
Yang, Z. & Rannala, B. Bayesianische Schätzung der Artendivergenzzeiten unter einer molekularen Uhr unter Verwendung mehrerer Fossilkalibrierungen mit weichen Grenzen. Mol. Biol. Entwicklung 23, 212–226 (2006).
Artikel CAS PubMed Google Scholar
Inoue, J., Donoghue, PCJ & Yang, Z. Der Einfluss der Darstellung fossiler Kalibrierungen auf die bayesianische Schätzung der Artendivergenzzeiten. Syst. Biol. 59, 74–89 (2010).
Artikel PubMed Google Scholar
Frey, L. et al. Der frühe Elasmobranch Phoebodus: phylogenetische Beziehungen, Ökomorphologie und eine neue Zeitskala für die Evolution der Haie. Proz. R. Soc. B Biol. Wissenschaft. 286, 20191336 (2019).
Artikel Google Scholar
Redmond, A., Casey, D., Gundappa, MK, Macqueen, DJ & McLysaght, A. Sturgeon-Paddlefish Duplikationsdaten des gesamten Genoms. (2023) https://doi.org/10.6084/m9.figshare.19762963.v1.
Referenzen herunterladen
Wir danken Dr. Matthias Stöck für die Weitergabe der Annotation zum Sterlet-Stör-Genom. Wir danken Dr. Sam Giles für den Hinweis auf die Notwendigkeit, die Auswirkungen des Ausschlusses einiger fossiler Kalibrierungen zu berücksichtigen. AKR wird durch ein Postdoktorandenstipendium der irischen Regierung des Irish Research Council (GOIPD/2021/466) unterstützt. Diese Arbeit wurde durch Mittel des Europäischen Forschungsrats, Fördervereinbarung 771419 (A.McL.), unterstützt.
Smurfit Institute of Genetics, Trinity College Dublin, Dublin, Irland
Anthony K. Redmond, Dearbhaile Casey und Aoife McLysaght
Das Roslin Institute und die Royal (Dick) School of Veterinary Studies, University of Edinburgh, Edinburgh, Großbritannien
Manu Kumar Gundappa und Daniel J. Macqueen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
AKR und A.McL. entwarf die Studie mit Input von DJM und MKGAKR und DC führte Analysen durch. AKR und A.McL. analysierte und interpretierte Ergebnisse. AKR, A.McL., DJM und DC haben den Artikel geschrieben.
Korrespondenz mit Aoife McLysaght.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Nature Communications dankt den anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Eine Peer-Review-Datei ist verfügbar.
Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Redmond, AK, Casey, D., Gundappa, MK et al. Unabhängige Rediploidisierungsmasken teilten die Vervielfältigung des gesamten Genoms beim Stör-Paddelfisch-Vorfahren. Nat Commun 14, 2879 (2023). https://doi.org/10.1038/s41467-023-38714-z
Zitat herunterladen
Eingegangen: 11. Juli 2022
Angenommen: 12. Mai 2023
Veröffentlicht: 19. Mai 2023
DOI: https://doi.org/10.1038/s41467-023-38714-z
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.