Information

Simulieren der Migration im SimBit-Softwareprogramm


Wie ist die Migration in das SimBit-Programm von Remi Matthey-Doret und Michael Whitlock eingebunden?

Wird ein Inselmodell oder ein Sprungbrettmodell angenommen?


In SimBit wird kein bestimmtes Modell angenommen, da der Benutzer sehr selbst bestimmen kann, welches Migrationsszenario simuliert werden soll. Das Migrationsszenario kann mit der Option--m(oder äquivalent zu--DispMat).

Es gibt vier Möglichkeiten (im Handbuch "Modus" genannt), um die Migration anzuzeigen.EIN,LSS,OnePatch,InselundLinearNormal.

  • EIN
    • Dieser Modus steht für "Alle". In diesem Modus kann der Benutzer eine Matrix mit der Migrationsrate zwischen zwei beliebigen Patches eingeben. Jedes Migrationsszenario, einschließlich der mit den folgenden Modi erreichten, kann mit erreicht werdenEIN. Das Interesse der anderen Modi besteht darin, das Leben des Benutzers zu vereinfachen, insbesondere. beim Umgang mit vielen Patches. Ich empfehle eher, die anderen Modi zu verwenden, wenn diese zutreffen.
  • LSS
    • Dieser Modus steht für „Linear Stepping Stones“. Es ermöglicht dem Benutzer, lineare Trittsteine ​​mit einer beliebigen Anzahl von Steinen und einer möglichen Asymmetrie zu setzen.
  • OnePatch
    • Dies ist die Standardeinstellung. Dies bedeutet, dass kein Migrationsszenario zutrifft, da es nur einen Patch (oder einen Deme, wenn Sie es vorziehen) gibt.
  • Insel
    • Dies ist ein klassisches Inselmodell. Der Benutzer muss die Wahrscheinlichkeit eingeben, dass er nicht migriert.
  • LinearNormal
    • Dies ist wie ein lineares Sprungbrettmodell, außer dass der Ausbreitungskernel einer Normalverteilung folgt.

Beachten Sie auch, dass das Migrationsszenario (sowie die Anzahl der Patches) ein zeitspezifisches Argument ist und daher im Laufe der Zeit beliebig variieren kann. Weitere Informationen finden Sie im Handbuch.

Beachten Sie, dass ich ziemlich viel an neuen Versionen gearbeitet habe, die ich noch nicht online gestellt habe, hauptsächlich weil ich zu faul war, das Handbuch neu zu schreiben! Die letzte online Version ist 3.69, aber ich arbeite gerade an der Version 3.139! Ich werde in der kommenden Woche(n) eine neuere Version hochladen. Zu den bemerkenswertesten Verbesserungen der neuen Version gehören:

  1. Einfachere Benutzeroberfläche; keine Notwendigkeit für all diese Anführungszeichen. Das Migrationsszenario wird vom Benutzer als Vorwärtsmigration angegeben, während es derzeit eine Rückwärtsmigration ist, die für den Benutzer etwas weniger intuitiv ist.
  2. Mehr Freiheit bei der Demografie.
  3. Möglichkeit, die Interaktion mehrerer Arten mit ökologischen Beziehungen zu simulieren. Man kann ein ganzes Ökosystem simulieren!

Diese Programme sind eine Sammlung von Tests und Methoden, die üblicherweise in der Populationsgenetik verwendet werden

Arlequin Allzweckpaket, das fast jede Analyse im Buch durchführt und Mikrosatelliten-, Allozym-, Sequenz- und andere Daten akzeptiert. Hat eine Importfunktion für GENEPOP-Dateien, aber prüfen Sie sorgfältig, da dies nicht immer funktioniert. Die Verwendung des Excel Microsatellite Toolkit zur Vorbereitung der Eingabedatei ist eine bessere Option. Achten Sie auch auf Ergebnisse aus Datensätzen mit vielen fehlenden Daten. PowerMarker Potenziell mächtiges Programm, das alle möglichen genetischen Distanzen berechnet und auch noch ein paar andere Dinge tut, die kein anderes Programm macht. Akzeptiert Eingabedateien aus Excel (Kopieren & Einfügen), die relativ einfach vorzubereiten sind. Genetix Leistungsstarkes Analysepaket für Populationsgenetik, aber Sie müssen Französisch verstehen. Hat nette Features wie einen PCA auf einzelne Genotypen und Permutationstests von FST. Importiert Genepop-Dateien, aber vergewissern Sie sich, dass der Import funktioniert hat - manchmal werden Allele verwechselt.


Abstrakt

Viele Probleme multizellulärer Systeme können nur verstanden werden, wenn man untersucht, wie sich Zellen bewegen, wachsen, sich teilen, interagieren und sterben. Eine Dynamik auf Gewebeebene entsteht aus Systemen vieler interagierender Zellen, wenn diese auf ihre Mikroumgebung reagieren und diese beeinflussen. Das ideale „virtuelle Labor“ für solche multizellulären Systeme simuliert sowohl die biochemische Mikroumgebung (die „Bühne“) als auch viele mechanisch und biochemisch interagierende Zellen (die „Spieler“ auf der Bühne). PhysiCell – ein physikbasierter multizellulärer Simulator – ist ein Open-Source-Simulator auf Agentenbasis, der sowohl die Bühne als auch die Spieler bietet, um viele interagierende Zellen in dynamischen Gewebemikroumgebungen zu untersuchen. Es baut auf einem Multi-Substrat-Biotransport-Solver auf, um den Zellphänotyp mit mehreren diffundierenden Substraten und Signalfaktoren zu verknüpfen. Es umfasst biologisch getriebene Untermodelle für Zellzyklus, Apoptose, Nekrose, Volumenänderungen von Feststoffen und Flüssigkeiten, Mechanik und Motilität „out of the box“. Der C++-Code weist minimale Abhängigkeiten auf, was die Wartung und Bereitstellung auf allen Plattformen vereinfacht. PhysiCell wurde mit OpenMP parallelisiert und seine Leistung skaliert linear mit der Anzahl der Zellen. Simulationen mit bis zu 10 5 -10 6 Zellen sind auf Quad-Core-Desktop-Workstations möglich, größere Simulationen sind auf einzelnen HPC-Rechenknoten möglich. Wir demonstrieren PhysiCell, indem wir den Einfluss der nekrotischen Kernbiomechanik, der 3D-Geometrie und der Stochastik auf die Dynamik von Hanging-Drop-Tumorsphäroiden und duktalen Karzinom in situ (DCIS) der Brust simulieren. Wir demonstrieren stochastische Motilität, chemische und kontaktbasierte Interaktion mehrerer Zelltypen und die Erweiterbarkeit von PhysiCell anhand von Beispielen in synthetischen multizellulären Systemen (ein „zelluläres Cargo Delivery“-System mit Anwendung auf Krebsbehandlungen), Krebsheterogenität und Krebs Immunologie. PhysiCell ist ein leistungsstarker Simulator für multizelluläre Systeme, der ständig mit neuen Fähigkeiten und Leistungsverbesserungen verbessert wird. Es stellt auch eine bedeutende unabhängige Codebasis dar, um Ergebnisse von anderen Simulationsplattformen zu replizieren. Der Quellcode von PhysiCell, Beispiele, Dokumentation und Support sind unter der BSD-Lizenz unter http://PhysiCell.MathCancer.org und http://PhysiCell.sf.net verfügbar.


Einführung

Bayesian Evolutionary Analysis by Sampling Trees (BEAST) ist ein Softwarepaket zur Durchführung Bayesscher phylogenetischer und phylodynamischer Analysen. BEAST-Proben aus der Posterior-Verteilung von Bäumen (oder Netzwerken) und Parametern, die den Eingabedaten unter Verwendung des Markov-Chain-Monte-Carlo-(MCMC)-Algorithmus gegeben wurden. Vor vier Jahren wurde BEAST 2 [1, 2] als komplette Neufassung der ursprünglichen BEAST-Software veröffentlicht. Ein Hauptziel dieser Neufassung war die Entwicklung eines modulareren Software-Frameworks, das leicht durch Dritte erweitert werden kann. Die Softwareplattform besteht aus verschiedenen Standalone-Programmen, darunter BEAUti (eine grafische Benutzeroberfläche [GUI] zum Einrichten einer Analyse), BEAST zum Ausführen von MCMC-Analysen und Nachbearbeitungstools wie LogAnalyser, LogCombiner, TreeAnnotator, DensiTree [3], as sowie ein Paketmanager.

Kurz nach der Veröffentlichung wurden eine Reihe von Paketen hinzugefügt, wie zum Beispiel MASTER zur Simulation stochastischer Populationsdynamikmodelle [4], MultiTypeTree zum Ableiten strukturierter Koaleszenzmodelle [5], RBS für reversible Jump-over-Substitutionsmodelle [6], SNAPP für Multi-Spezies Koaleszenz über SNP-Daten [7], subst-bma für das Bayes-Modell für die Mittelwertbildung über Standortmodelle [8] und BDSKY für das Geburts-Tod-Skyline-Baummodell [9]. Alle diese Pakete waren für sich genommen sehr beliebt, und seit der ersten Veröffentlichung von BEAST 2 wurde eine große Menge an Funktionen und Paketen hinzugefügt, die den Erfolg des Ansatzes zeigen. In diesem Beitrag fassen wir die wesentlichen Fortschritte zusammen, die erzielt wurden.

Was ist BEAST?

BEAST ist ein Paket zur Durchführung von Bayes'schen phylogenetischen Inferenzen mit MCMC. Im Zentrum stehen verwurzelte Zeitbäume (oder Zeitnetzwerke in neuesten Entwicklungen), die aus mehreren Datenquellen abgeleitet werden können. BEAST unterstützt Sequenzdaten für Nukleotide, Aminosäuren, Codon-Modelle, diskrete und kontinuierliche morphologische Merkmale, Sprache, Mikrosatelliten und SNPs sowie benutzerdefinierte diskrete und biogeografische Daten. Die Bayessche Inferenz ermöglicht die Einbeziehung vieler Informationsquellen in dieselbe Analyse, wie z. B. DNA-Sequenzen von existierenden und ausgestorbenen Arten, kombiniert mit Informationen aus dem Fossilienbestand. Neben der Ableitung verwurzelter Zeitbäume, die an sich schon wertvoll sind [10], ermöglicht BEAST auch die Beantwortung vieler Arten von mikro- und makroevolutionären Fragen, wie z Migration und Ausbreitungsgeschwindigkeit von Epidemien.


SEAWAT: Ein Computerprogramm zur Simulation von dreidimensionaler Grundwasserströmung und -transport mit variabler Dichte

SEAWAT ist ein generisches MODFLOW/MT3DMS-basiertes Computerprogramm, das entwickelt wurde, um dreidimensionale Grundwasserströmungen mit variabler Dichte in Verbindung mit dem Transport von gelösten Stoffen und Wärme von mehreren Arten zu simulieren. Das Programm wurde für eine Vielzahl von Grundwasserstudien verwendet, einschließlich solcher, die sich auf die Solemigration in kontinentalen Grundwasserleitern konzentrieren, sowie solche, die sich auf die Salzwasserintrusion in Küstengrundwasserleitern konzentrieren. SEAWAT verwendet die bekannte Struktur von MODFLOW und MT3DMS. Somit können die meisten der gebräuchlichsten Pre- und Postprozessoren verwendet werden, um SEAWAT-Datensätze zu erstellen und Ergebnisse zu visualisieren. Die MODFLOW-Konzepte von "Paketen" und "Prozessen" werden in SEAWAT beibehalten, was es dem Programm ermöglicht, mit vielen der MODFLOW-bezogenen Softwareprogramme wie MODPATH, ZONEBUDGET und Parameterschätzprogrammen zu arbeiten. SEAWAT ist ein gemeinfreies Computerprogramm. Der Quellcode und die Software werden vom U.S. Geological Survey (USGS) kostenlos verteilt.

SEAWAT Version 4 ist ein Ersatz für SEAWAT-2000. SEAWAT-2000-Benutzern wird empfohlen, diese neue Version zu verwenden, auch wenn die neuen Funktionen für eine bestimmte Anwendung nicht erforderlich sind. SEAWAT Version 4 ist abwärtskompatibel mit Datensätzen, die für SEAWAT-2000 erstellt wurden, und daher wird SEAWAT-2000 nicht mehr unterstützt oder gewartet.

Was ist neu in Version 4

SEAWAT Version 4 ist die neueste SEAWAT-Version, und wie SEAWAT-2000 basiert Version 4 auf MODFLOW-2000 und MT3DMS. SEAWAT Version 4 behält die gesamte Funktionalität von SEAWAT-2000 und ist abwärtskompatibel mit SEAWAT-2000-Datensätzen. SEAWAT Version 4 enthält die folgenden neuen Funktionen:

  • Auswirkungen von Viskositätsschwankungen auf den Grundwasserfluss können mit dem Viskositätspaket (VSC) dargestellt werden.
  • Für jede MT3DMS-Komponente können eindeutige Diffusionskoeffizienten eingegeben werden. Dies ermöglicht die Verwendung der Wärmeleitfähigkeit für die Temperaturkomponente und die Verwendung von molekularen Diffusionskoeffizienten für gelöste Spezies.
  • Flüssigkeitsdichte und Viskosität können als Funktion einer oder mehrerer MT3DMS-Spezies berechnet werden.
  • Zusätzliche Optionen sind verfügbar, um den Dichtewert anzugeben, der mit Constant-Head (CHD)-Grenzen verknüpft ist.
  • Neue Optionen und Programm-Neugestaltung ermöglichen schnellere Ausführungszeiten.

Frühere SEAWAT-Versionen stehen ebenfalls zum Download von dieser Site zur Verfügung, diese Versionen werden jedoch nicht mehr gewartet, aktualisiert oder unterstützt. Benutzern wird empfohlen, die neueste Version von SEAWAT zu verwenden, da diese Korrekturen und Verbesserungen enthalten kann, die in älteren Versionen nicht enthalten sind.

Laden Sie die aktuelle Version von SEAWAT . herunter

Die aktuelle Version von SEAWAT ist v.4.00.05, veröffentlicht am 19. Oktober 2012.

Dokumentation für SEAWAT

Benutzerhandbücher und technische Informationen

Thorne, D., Langevin, C.D. und Sukop, M.C., 2006, Addition of simultaner Wärme- und Soluttransport und variable Flüssigkeitsviskosität zu SEAWAT: Computer and Geosciences vol. 32, 1758-1768.

Veröffentlichte Berichte und Artikel, die eine Anwendung von SEAWAT . beschreiben

Al-Maktoumi, A., Lockington, D.A. und Volker, R.E., im Druck, SEAWAT 2000: modeling instabile Strömung und Empfindlichkeit gegenüber Diskretisierungsniveaus und numerischen Schemata: Hydrogeology Journal 15, No. 6: 1119-1129.

Bakker, M., Oude Essink, G.H.P. und Langevin, C.D., 2004, Die rotierende Bewegung von drei nicht mischbaren Flüssigkeiten – ein Benchmark-Problem. Zeitschrift für Hydrologie 287, 270-278.

Bauer-Gottwein, P., Langer, T., Prommer, H., Wolski, P. und Kinzelbach, W., 2007. Okavango Delta Islands: Interaction between density-driven flow and geochemical applications under evapo-concentration: Journal of Hydrologie 335, Nr. 3-4: 389-405.

Bauer-Gottwein, P., Rasmussen, N.F., Feificova, D. und Trapp, S., 2008. Phototoxizität von Salz- und Pflanzensalzaufnahme: Modellierung von ökohydrologischen Rückkopplungsmechanismen: Water Resources Research 44, No. 4, Artikelnummer W04418.

Brovelli, A., Mao, X. und Barry, D.A., 2007, Numerical Modeling of Gezeiteneinfluss auf den dichteabhängigen Schadstofftransport, Water Resources Research vol. 43, W10426, doi:10.1029/2006WR005173.

Don, N.C., Hang, N.T.M., Araki, H., Yamanishi, H., Koga, K., 2006. Versalzungsprozesse in einer alluvialen Küstentieflandebene und Auswirkungen des Meeresspiegelanstiegs. Umweltgeologie vol. 49, nein. 5.

Don, N.C., Araki, H., Yamanishi, H., Koga, K., 2005. Simulation von Grundwasserströmung und Umwelteinflüssen durch Pumpen. Umweltgeologie vol. 47, nein. 3.

Don, N.C., Araki, H., Hang, N.T.M., Yamanishi, H., Koga, K., 2006. Modellierung des Grundwasserflusses und des damit verbundenen Umweltproblems in einer Tieflandküstenebene: ein erster Schritt zu einem nachhaltigen Entwicklungsplan. Umwelt, Entwicklung und Nachhaltigkeit, online zuerst, doi: 10.1007/s10668-006-9061-4.

Dreybolt, W. und Romanov, D., 2007, Zeitskalen in der Entwicklung der Lösungporosität in porösen Küstenkarbonat-Aquiferen durch Mischkorrosion in der Salzwasser-Süßwasser-Übergangszone: Acta Carsologica 36, ​​Nr. 1: 25-34.

Goswami, R.R. und Clement, T.P., 2007, Labormaßstabuntersuchung der Salzwasserintrusionsdynamik: Water Resources Research 43, W04418, doi:10.1029/2006WR005151.

Langevin, C.D., 2008, Modellierung axialsymmetrischer Strömung und Transport: Grundwasser 46, No. 4: 579-590.

Langevin, CD, Oude Essink, GHP, Panday, S., Bakker, M., Prommer, H., Swain, ED, Jones, W., Beach, M. und M. Barcelo, 2004. Kapitel 3, MODFLOW- basierte Tools zur Simulation von Grundwasserströmungen mit variabler Dichte: in Coastal Aquifer Management: Monitoring, Modeling, and Case Studies, (Hrsg.) A. Cheng und D. Ouazar, Lewis Publishers, p. 49-76.

Lin, J., Zheng, C., Wu, J. und Chien, C.C., 2007. Grundwassersimulationsoptimierungsmodell basierend auf genetischem Algorithmus unter variablen Dichtebedingungen: Shuili Xuebao/Journal of Hydraulic Engineering 38, No. 10: 1236-1244.

Maliva, R.G., Guo, W., Missimer, T.M., 2007. Vertikale Migration von kommunalem Abwasser in tiefen Injektionsbrunnensystemen, Südflorida, USA: Hydrogeology Journal 15, No. 7: 1387-1396.

Maliva, R.G., Guo, W., Missimer, T.M., 2006. Aquifer storage and recovery: Recent hydrogeological progress and system performance: Water Environment Research v. 78, No. 13, s. 2428-2435.

Mao, X., Prommer, H., Barry, DA, Langevin, CD, Panteleit, B. und Li, L., 2006. Dreidimensionales Modell für mehrkomponentigen reaktiven Transport mit Grundwasserströmung mit variabler Dichte: Umweltmodellierung & Software, Bd. 21, 5: 615-628.

Mao, X., Enot, P., Barry, D.A., Li, L., Binley, A., Jeng, D.-S., 2006. Gezeiteneinfluss auf das Verhalten eines Küstengrundwasserleiters neben einer Flachreliefmündung. Zeitschrift für Hydrologie, vol. 327. nein. 1-2. P. 110-127.

Masterson, J.P. und Garabedian, S.P., 2007, Auswirkungen des Meeresspiegelanstiegs auf den Grundwasserfluss in einem Küstenaquifersystem: Grundwasser, v. 45, Nr. 2, 209-217, pp.

Mulligan, A.E., Evans, R.L. und Lizarralde, D., 2007, Die Rolle von Paläokanälen beim Grundwasser-/Meerwasseraustausch: Journal of Hydrology 335, Nr. 3-4. P. 313-329.

Nassar, M.K.K., El-Damak, R.M. und Ghanem, A.H.M., 2008 3. p. 445-454.

Post, V.E.A., und Prommer, H., 2007. Multicomponent reactive transport simulation of the Elder problem: Effects of Chemical Reactions on Salt Plume Development: Water Resources Research Volume 43, no. 10, Artikelnummer W10404.

Qahman, K., Larabi, A., 2006. Bewertung und numerische Modellierung der Meerwasserintrusion im Gaza-Aquifer (Palästina). Hydrogeology Journal, vol. 14, Nr. 5. p. 713-728.

Rao S V N (2007)Optimale Standorte von Abschöpfbrunnen. Hydrologische Wissenschaften Zeitschrift, 52 (2), 352-361.

Rao, SV N., Sudhir Kumar, Shashank Shekher und SK Sinha, in press, Optimal operation of skimming wells – A case study in river Yamuna Flood Ebene at Palla in North India (veröffentlicht online DOI: 10.1007/s 10040-007-0173 -1, Hydrogeologie-Journal, Springer)

Rao, S. V. N., Sudhir Kumar, Shashank Shekher und D. Chakravorty, 2006. Optimales Pumpen aus Abschöpfbrunnen. ASCE J. of Hydrologic Engineering, Vol. 2, No. 11, 5, 464-471.

Rao, S V N. (2006)Eine rechentechnisch effiziente Technik für Probleme bei der Quellenidentifikation in 3D-Aquiferen unter Verwendung von KNN und simuliertem Tempern Environmental Forensics Journal, Vol. 2, No. 7, 3, 233-240.

Rao, S. V. N. , Bhallamudi, S. M., Thandaveswara, B. S. , Sreenivasulu, V., 2005, Planung der Grundwasserentwicklung in Küstendeltas mit Paläokanälen: Water Resources Management 19, No. 5:625 - 639

Rao, S.V.N., Sreenivasulu, V., Bhallamudi, S.M., Thandaveswara, B.S., und Sudheer, K.P., 2004, Planung der Grundwasserentwicklung in Küstenaquiferen: Hydrological Sciences Journal 49, No. 1:155-170

Robinson, C., L. Li und D. A. Barry, 2006. Auswirkung des Gezeitenantriebs auf eine unterirdische Flussmündung Advances in Water Resources 30, No. 4: 851-865.

Robinson, C., Gibbes, B. und Li, L., 2006. Antriebsmechanismen für Grundwasserströmung und Salztransport in einer unterirdischen Mündung. Geophysikalische Forschungsbriefe, vol. 33, L03402, doi:10.1029/2005GL025247, 2006.

Romanov, D., Dreybrodt, W., 2006. Entwicklung der Porosität in der Salzwasser-Süsswasser-Mischzone küstennaher Karbonat-Aquifere: Ein alternativer Modellierungsansatz. Zeitschrift für Hydrologie, vol. 329, s. 661-673.


Ein Beispiel für eine SLiM 2-Simulation

Um zu veranschaulichen, wie das Einrichten und Ausführen einer Simulation in der Praxis funktioniert, werden wir ein einfaches Spielzeugmodell konstruieren, dem wir sukzessive evolutionäre Komplexitätsstufen hinzufügen. Dies wird mehrere Schlüsselkonzepte demonstrieren, wie evolutionäre Szenarien in Eidos spezifiziert werden, einschließlich Populationsstruktur und Demografie, Fitness und Selektion, Partnerwahl und explizite genetische Modifikation von Individuen.

Wir beginnen mit der Modellierung einer genomischen Region mit einheitlichen Mutations- und Rekombinationsraten, die sich in einem Inselmodell mit sechs Populationen mit einer vorherrschenden Richtung des Genflusses entwickelt. Der Eidos-Code für diese Simulation ( Codebeispiel 1) kann direkt in SLiMgui eingegeben oder SLiM auf der Kommandozeile als Textdatei zur Verfügung gestellt werden.

Codebeispiel 1

Das Handbuch von SLiM beschreibt die Details der verschiedenen Aufrufe hier für unsere Zwecke, es genügt zu sagen, dass ein initialize()-Callback (die erste Hälfte des Skripts) grundlegende Simulationsparameter wie die Mutationsrate, die Rekombinationsrate, die Struktur einrichtet der genomischen Region und die Fitnessmerkmale der Mutationen, die auftreten können. In unserem Fall spezifiziert der Mutationstyp m1 neutrale Mutationen, die gleichmäßig über eine 100 kb lange Genomregion auftreten. Ein Ereignis, das in Generation 1 (der unteren Hälfte des Skripts) abläuft, erstellt eine „Inselkette“ von sechs Subpopulationen mit jeweils 500 Individuen und initialisiert die Migrationsraten entlang der Kette so, dass sie in eine Richtung größer sind als in die andere. Schließlich gibt ein Ereignis bei Generation 10000 den Zustand der Population aus, einschließlich Informationen über alle segregierenden Mutationen, da definiert ist, dass nichts nach Generation 10000 passiert, endet die Simulation am Ende dieser Generation. Beachten Sie, dass SLiM-Simulationen mit leeren Genomen beginnen (d. h. ohne vorbestehende Mutationsvariation), es sei denn, Sie schreiben ein Skript, das eine solche Variation explizit zur Ausgangspopulation hinzufügt. Bei der Untersuchung von Mustern genetischer Diversität sollten Simulationen daher eine „Einbrennphase“ beinhalten, um Diversität durch neue Mutationen zu etablieren. Im obigen Modell haben sich beispielsweise die Niveaus der neutralen Diversität bis zur Generation 10000 vollständig ausgeglichen.

Wir haben bereits ein nützliches Modell, und es wäre einfach, durch Modifikation dieses Skripts eine komplexere genetische oder Populationsstruktur aufzubauen. Beachten Sie, dass dieses Skript keinen Aufruf zur Aktivierung einer integrierten Bevölkerungsstrukturfunktion des „Inselmodells“ getätigt hat. Stattdessen werden alle benötigten Funktionen wie oben in nur wenigen Zeilen Eidos-Code angegeben. Das bedeutet, dass SLiM Sie nicht auf ein bestimmtes Feature-Set beschränkt, das in das Paket integriert ist. Sie können buchstäblich alles tun, was Sie in Eidos schreiben können, ohne den C++-Code verstehen oder ändern zu müssen, der der Implementierung von SLiM zugrunde liegt. Obwohl der obige Code eine bereits vorhandene Ausgabemethode, outputFull(), verwendet, um am Ende der Simulation eine Ausgabe zu generieren, können Sie Eidos-Code schreiben, um eine beliebige benutzerdefinierte Ausgabe zu erzeugen, wie unten gezeigt.

Das obige Skript richtet einen Mutationstyp namens m2 ein, verwendet ihn jedoch noch nicht. Wir können unserem Skript etwas Code hinzufügen ( Codebeispiel 2), um eine Mutation vom Typ m2 in Generation 5000 einzuführen und sie dann auf Fixierung oder Verlust zu überwachen.

Codebeispiel 2

Der obere Codeblock fügt die neue m2-Mutation im Zentrum unserer Region zu 50 Genomen innerhalb der Population hinzu. Der untere Block prüft auf Fixierung oder Verlust dieser Mutation, falls eine der beiden auftritt, druckt eine Nachricht (FIXED oder LOST) aus, gibt 10-Genomproben von jeder Subpopulation aus und beendet die Simulation. Dies ist sehr einfach, aber es zeigt die Tatsache, dass SLiM-Simulationen basierend auf den aktuellen Simulationsstatus-Beispielrezepten im SLiM-Handbuch jede gewünschte benutzerdefinierte Ausgabe generieren können, um komplexere Ausgaben zu erzeugen, z FNS zwischen Teilpopulationen.

Da der Mutationstyp m2 (im Initialisierungscode) so konfiguriert ist, dass er mit einem Selektionskoeffizienten von 0,5 vorteilhaft ist, wird die eingeführte m2-Mutation oft alle Subpopulationen durchdringen und eine Fixierung erreichen. Wir können dies ändern ( Codebeispiel 3), indem wir eine räumliche Variation in die Fitnesseffekte des m2-Mutationstyps einführen.

Codebeispiel 3

Der Fitnesseffekt von Mutationen vom Typ m2 wird nun auf individueller Basis durch diesen Eidos-Callback berechnet und nicht mehr durch den festen Selektionskoeffizienten von 0,5, der im Initialisierungscode für den Mutationstyp m2 angegeben ist. Für ein bestimmtes Individuum, das eine m2-Mutation trägt, verwendet dieser Code die Kennung (von 0 bis 5) der Subpopulation, aus der das Individuum stammt, um den Fitnesseffekt zu bestimmen, wodurch die Mutation in der ersten Subpopulation etwas vorteilhaft, in der letzten jedoch stark schädlich ist. Wenn das Modell jetzt ausgeführt wird, erreicht die eingeführte Mutation typischerweise ein Migrations-Selektions-Gleichgewicht innerhalb der ersten Subpopulation (begrenzt durch einen starken Genfluss aus der zweiten), wobei fast keine Penetration in die anderen Subpopulationen stattfindet.

Wir können dieses Migrations-Selektions-Verhältnis modifizieren, indem wir etwas Code hinzufügen ( Code Sample 4), um die eingeführte m2-Mutation zu einem CRISPR-Gene-Drive-Allel zu machen, das Heterozygoten für das Allel in Homozygote umwandelt, um eine sogenannte „mutagene Kettenreaktion“ zu erzeugen ( Gantz und Bier 2015).

Codebeispiel 4

Dieser Code teilt SLiM mit, dass jedes Mal, wenn ein Nachkommen die m2-Mutation in einem seiner beiden Genome trägt, die Mutation auch in das andere (homologe) Genom kopiert werden sollte. Da die m2-Mutation nun ein Treiberallel ist, wird sie typischerweise die ersten fünf Subpopulationen durchdringen, obwohl sie in den späteren Subpopulationen schädlich ist. Es ist jedoch immer noch nicht in der Lage, sich in der sechsten Subpopulation zu beheben, da es dort so stark schädlich ist (mit einer relativen Fitness von nur 0,45 gemäß dem oben definierten fitness()-Callback).

Um das m2-Treiber-Allel bis zur Fixierung in der gesamten Population zu verbreiten, werden wir eine Paarungspräferenz für m2-Träger hinzufügen. Biologisch würde dies eine phänotypische Eigenschaft von m2-Trägern widerspiegeln – vielleicht ein attraktives Pheromon –, die dazu führt, dass sie als Partner bevorzugt werden. Dies in unserem Modell zu implementieren ist sehr einfach ( Codebeispiel 5).

Codebeispiel 5

Dieser Callback erkennt m2-Träger, indem er sich die Tatsache zunutze macht, dass ihre relative Fitness ungleich 1,0 ist, während Nicht-Träger nur neutrale Mutationen und somit eine relative Fitness von 1,0 aufweisen. Es wäre möglich, die Partnerwahl explizit auf das Vorhandensein oder Fehlen der m2-Mutation in jedem potentiellen Partner zu stützen, anstatt die Fitnesswerte als Proxy zu verwenden, aber der Code wäre etwas komplexer (ein Beispiel dafür kann gefunden werden .) im SLiM-Handbuch). Träger erhalten einen Bonus von 0,1 zu ihrem Standardpaarungsgewicht (das ihrer relativen Fitness entspricht). Dieser kleine Schub reicht in Kombination mit der Konversionsaktivität des Driver-Allels selbst aus, um das m2-Driver-Allel jetzt zu reparieren – obwohl es eine Weile dauern kann, da es vom Aufbau einer kritischen Masse von Trägern in der letzten Subpopulation abhängt, die überwältigt die Auswahl gegen den Fahrer.


Ergebnisse

MASTER kann eine Vielzahl von Simulationen unter Modellen mit der im späteren Abschnitt vorgestellten Form durchführen. Jede Simulation fällt in einen der folgenden generischen „Simulationstypen“: In diesem Abschnitt untersuchen wir die Verwendung dieser Simulationstypen und demonstrieren ihre Anwendung auf die Behandlung stochastischer Populationsdynamikmodelle mit zunehmender Komplexität (eine vollständigere Beschreibung der Syntax der XML-Eingabedateien werden in einem späteren Abschnitt bereitgestellt). Darüber hinaus präsentieren wir eine kurze Analyse der Recheneffizienz der Software.

Trajektorie: Dies umfasst Simulationen, die eine einzelne Historie (d. h. eine stochastische Realisierung) der Größe der im Modell vorhandenen Populationen generieren.

Ensemble: Dies beschreibt Berechnungen, die mehrere unabhängige Trajektorien der Populationsgröße erzeugen.

Ensemble-Zusammenfassung: Dies ist eine andere Art von Simulation, die mehrere Trajektorien der Populationsgröße umfasst, aber in diesem Fall werden die Ergebnisse im laufenden Betrieb in Form von zeitabhängigen zusammenfassenden Statistiken oder Momentschätzungen zusammengefasst.

Vererbungsverlauf: Dies umfasst gemeinsame Simulationen der Dynamik von Populationsgrößen und einen Baum oder ein Netzwerk, das die Vererbungsbeziehungen zwischen einer Untergruppe von Individuen innerhalb dieser Populationen beschreibt.

Vererbungs-Ensemble: Dies ermöglicht die Erstellung mehrerer unabhängiger Vererbungs-Trajektorien-Simulationen.

Ein einfaches epidemiologisches Modell

Wir beginnen damit, die Anwendung von MASTER auf die Simulation eines grundlegenden, aber fundamentalen Modells der Epidemiedynamik zu demonstrieren. Was heute unter mathematischen Epidemiologen als SIR-Modell bekannt ist, ist ein Sonderfall eines Formalismus, der vor fast einem Jahrhundert von Kermack und McKendrick (1927) eingeführt wurde. Es wird so genannt, weil es die Aufteilung von Individuen in einer ansonsten homogenen Population in drei Klassen oder „Kompartimente“ mit dem Namen beinhaltet S, ich, und R. Mitglieder des Abteils S gelten als anfällig für Infektionen durch Personen aus dem Kompartiment ich, die infizierte und (vor allem) infektiöse Personen enthält. Abteil R enthält diejenigen Personen, bei denen die Infektion abgeschlossen ist und die daher als genesen gelten können (obwohl entfernt möglicherweise besser beschrieben wird, da das Modell gleichermaßen für tödliche Krankheitserreger gilt).

Die grundlegende MASTER-Eingabedatei, die zur Simulation der Populationsgrößendynamik unter diesem Modell verwendet werden kann, ist in Abbildung 1 dargestellt. Hier haben wir den Simulationstyp „Trajektorie“ ausgewählt und das Attribut simulationTime verwendet, um anzugeben, dass die Simulation ausgeführt werden soll für 50 Zeiteinheiten. Das Element < model > wurde verwendet, um zu spezifizieren, dass das Modell die drei Kompartimentpopulationen enthält und dass diese Populationen den zwei zuvor angegebenen Reaktionen unterliegen. Das Element < initialState > wurde verwendet, um die Simulation mit 1.000 Individuen zu initialisieren, darunter 999 anfällige und 1 infizierte (beachten Sie, dass wir die Populationsgröße des R-Kompartiments nicht explizit auf Null setzen müssen, da dies die Standardeinstellung ist). Schließlich wird das Element < output > verwendet, um eine JSON-formatierte Ausgabedatei mit dem Namen „SIR_output.json“ anzugeben.

MASTER-Eingabedatei, die eine einzelne Simulation mit fester Zeitdauer eines stochastischen SIR-Modells angibt.

MASTER-Eingabedatei, die eine einzelne Simulation mit fester Zeitdauer eines stochastischen SIR-Modells angibt.

Um die Simulation tatsächlich auszuführen, muss MASTER die Datei mit dieser XML-Datei bereitgestellt werden. Wie dies genau geschieht, hängt von den Details der Installation und dem Betriebssystem des Benutzers ab und ist auf der Website des Projekts beschrieben. Nach Abschluss können wir die resultierende Ausgabedatei mithilfe der fromJSON-Funktion der rjson-Bibliothek ( Couture-Beil 2013) wie folgt in eine aktive R-Sitzung einlesen:

> df ← fromJSON(file='SIR_output.json')

Die df-Variable enthält dann die Simulationsergebnisse einschließlich der Zeitpunkte, zu denen die simulierten Infektions-/Wiederherstellungsereignisse aufgetreten sind, und die Größen der Kompartimentpopulationen unmittelbar nach diesen Ereignissen. Dies kann verwendet werden, um Diagramme der simulierten Populationsdynamik zu erstellen. Zum Beispiel kann ein Diagramm der Dynamik der infizierten Population erstellt werden mit:

Abbildung 2 zeigt jede der auf diese Weise visualisierten simulierten Populationsgrößenverläufe der Kompartimente.

Visualisierung eines typischen SIR-Simulationsergebnisses unter Verwendung von R in Kombination mit der rjson-Bibliothek.

Visualisierung eines typischen SIR-Simulationsergebnisses unter Verwendung von R in Kombination mit der rjson-Bibliothek.

Modellierung von Epidemien in strukturierten Populationen

Eine offensichtliche Erweiterung des grundlegenden SIR-Modells ist eine, in der die Gemeinschaft, in der die Epidemie stattfindet, in irgendeiner Weise strukturiert ist. Dies geschieht natürlich in realen Populationen aufgrund der geographisch bedingten Segregation, wo Orte wie Städte als annähernd homogen betrachtet werden können, aber die relativ langsamere Migration zwischen Städten verhindert, dass diese Annäherung in der Meta-Population gehalten wird.


MATERIALEN UND METHODEN

Die Dauer der pelagischen Wanderung von Florida-Unechten Karettschildkröten beträgt ungefähr 6–12 Jahre (Bjorndal et al., 2000). In dieser Studie haben wir uns auf den ersten Teil der Wanderung konzentriert, bei dem Schildkröten den Atlantik überqueren. Daher waren unsere Simulationen auf Zeiträume von 5 Jahren beschränkt.

Die Bewegung junger Schildkröten wurde mit dem Partikel-Tracking-Programm ICHTHYOP v. 2.21 (Lett et al., 2008) simuliert, das Oberflächenströmungen aus dem globalen Hybrid-Koordinaten-Ozeanmodell (HYCOM) (Bleck, 2002) interpoliert. Global HYCOM wird durch Windstress, Windgeschwindigkeit, Wärmestrom und Niederschlag erzwungen. Darüber hinaus verwendet HYCOM die Datenassimilation, um eine „hindcast“-Modellausgabe aus Satellitenhöhenmessdaten zu erzeugen und vor Ort Messungen aus einer globalen Reihe von Einweg-Badethermographen (XBTs), ARGO-Schwimmern und festgemachten Bojen. Wir haben die Standardausgabe verwendet, die eine räumliche Auflösung von 0,08 Grad (∼7 km) und einen täglichen Zeitschritt hat. Es hat sich gezeigt, dass Global HYCOM mesoskalige Prozesse wie mäandernde Strömungen, Fronten, Filamente und ozeanische Wirbel genau auflöst (Bleck, 2002, Chassignet et al., 2007), die für die realistische Charakterisierung von Ausbreitungsszenarien von Schildkröten wichtig sind (Witherington, 2002, Bolten, 2003 .). ). Für die Advektion von Partikeln durch HYCOM-Geschwindigkeitsfelder implementierte ICHTHYOP eine Runge-Kutta-Zeitschrittmethode 4. Ordnung, bei der die Partikelposition stündlich berechnet wurde (Lett et al., 2008). Der Untersuchungsbereich erstreckte sich vom Äquator bis 47°N und von 100°W bis zum Nullmeridian (Abb. 1).

Mögliche Ausbreitungsrouten juveniler Unechten Karpfen, die aus Südost-Florida, USA, einwandern. Given surface currents in the North Atlantic, turtles can be transported along five main trajectories: (1) into the South Atlantic Bight (yellow coastline) (2) into the Mid-Atlantic Bight and the Gulf of Maine (orange coastline) (3) north of the subtropical gyre system (north of red line) (4) within the western portion of the Sargasso Sea around the Bahamas (purple polygon) or (5) to the eastern Atlantic passing through the Azores (green rectangle). Blue shaded regions (A–C) demarcate three ‘navigation zones’ defined by regional magnetic fields known to elicit navigational responses in young loggerheads (Lohmann et al., 2001 Fuxjager et al., 2011). Zones are irregularly shaped because of how the Earth’s field varies across the Atlantic (see Materials and methods). The direction turtles swam in each navigation zone is shown by the gray-shaded area in the corresponding circular diagram. Each hour per day that a turtle swam, it adopted a new heading, randomly chosen from within this gray area.

Possible dispersal routes of juvenile loggerheads migrating from southeast Florida, USA. Given surface currents in the North Atlantic, turtles can be transported along five main trajectories: (1) into the South Atlantic Bight (yellow coastline) (2) into the Mid-Atlantic Bight and the Gulf of Maine (orange coastline) (3) north of the subtropical gyre system (north of red line) (4) within the western portion of the Sargasso Sea around the Bahamas (purple polygon) or (5) to the eastern Atlantic passing through the Azores (green rectangle). Blue shaded regions (A–C) demarcate three ‘navigation zones’ defined by regional magnetic fields known to elicit navigational responses in young loggerheads (Lohmann et al., 2001 Fuxjager et al., 2011). Zones are irregularly shaped because of how the Earth’s field varies across the Atlantic (see Materials and methods). The direction turtles swam in each navigation zone is shown by the gray-shaded area in the corresponding circular diagram. Each hour per day that a turtle swam, it adopted a new heading, randomly chosen from within this gray area.

Release conditions

Virtual particles (i.e. simulated turtles) were released in an offshore zone that paralleled the east coast of Florida. The release zone was located between latitudes 26.0°N and 28.5°N and spanned an area that was 30–50 km from the coast. Releasing turtles offshore served to minimize the influence of coastal processes not characterized by the global HYCOM model. Moreover, 40 km (the center of the release zone) is the approximate distance that hatchling loggerheads can swim using the residual energy from their yolk sacks (Kraemer and Bennett, 1981) 30–50 km is also a distance from shore where post-hatchlings are routinely observed (Witherington, 2002).

Previous modeling studies on hatchling dispersal suggest that the interannual variation in ocean current conditions can greatly influence the outcome (Putman et al., 2010 Hays et al., 2010). To make our analysis as broadly applicable as possible and to avoid outcomes that result from conditions unique to any particular year, six different years were used as a starting point (2004–2009). Simulations starting in 2004 and 2005 ran through 2009 and 2010, respectively. Simulations starting in 2006, 2007, 2008 and 2009 ran through 2010 and then looped back over to resume in 2004. Therefore, in all simulations turtles were transported for a total of 5 years. For example, the simulation that began in 2006 ran until 2010 and then continued from 2004 to 2005. This ‘looping technique’ is common in oceanographic simulations (e.g. Brochier et al., 2009) and diminishes the potential impact of a single, anomalous year. Similarly, to reduce possible effects of storms or other unusual events that might yield atypical oceanic conditions, releases each year were at 5 day intervals starting on 1 July and continuing through 18 September, a period that encompasses the main loggerhead hatching season in Florida (Weishampel et al., 2003).

Behavioral scenarios

For each behavioral scenario modeled (Table 1), a total of 900,000 simulated turtles were tracked. This total consisted of 15 total release events of 1000 turtles each (see above), replicated 10 times each year for each of six different years. Replications within each year differed in two parameters: (1) the exact release sites of individuals within the release zone, which were assigned randomly and (2) the exact direction that individual turtles swam within each navigation zone, which was assigned randomly from a range of directions derived from empirical results (see below). The technique of tracking 900,000 simulated turtles in each of the behavioral scenarios allowed nearly all possibilities of transport to be observed and the use of statistics to determine the likelihood of each possibility.

Parameters of the four behavioral scenarios

P2ufJKrUN9RrLBwYkDHo0ek1zo6Nt-froOW4R3beOgfJ2MsFGAS-Aw__&Key-Pair-Id=APKAIE5G5CRDK6RD3PGA" />

Modifications were made to ICHTHYOP to simulate the swimming behavior of young turtles. For the active swimming scenarios, three geographic regions along the northern portion of the turtles’ migratory route were designated as ‘navigation zones’ (Fig. 1). Each zone encompassed the location of a specific magnetic field that is known to elicit directional swimming in loggerhead hatchlings (Lohmann et al., 2001 Fuxjager et al., 2011). The magnetic fields were defined by intensity (field strength) and inclination (the angle at which field lines intersect the Earth’s surface) and correspond to broad oceanic regions in the northwest, north-central and northeastern Atlantic (Fig. 1, Table 1). Because the precise boundaries of each navigation zone have not been determined empirically, we arbitrarily extended each zone outward ±3.0 μT of intensity and ±3.0 deg inclination (or until this extrapolation brought the zone into contact with an adjacent navigation zone). This process yielded navigation zones that were wider in the east–west axis than in the north–south axis (Fig. 1), a pattern attributable to the fact that the magnetic field in the North Atlantic varies more with latitude than with longitude (Putman et al., 2011).

In simulations, turtles were transported passively by currents unless they entered one of the three navigation zones, at which point additional velocity was imparted to them in a direction that depended on the zone (see below). When in a navigation zone, simulated turtles swam 0.20 m s –1 , a speed that both hatchlings and juveniles are capable of sustaining (O’Hara, 1980 Salmon and Wyneken, 1987 Revelles et al., 2007). The duration of swimming bouts varied among scenarios and included 1 h per day (total distance traveled under the turtles’ own power in still water=0.72 km per day), 2 h per day (distance=1.44 km per day) and 3 h per day (distance=2.16 km per day). These swim durations and corresponding distances are well within the physiological capabilities of young loggerheads (O’Hara, 1980 Kraemer and Bennett, 1981 Salmon and Wyneken, 1987 Revelles et al., 2007). These conservative estimates were selected to avoid overestimating the influence of navigation behavior on turtle distributions.

Four behavioral scenarios were modeled (Table 1). One assumed that turtles drifted passively. Three other scenarios assumed that turtles swam 1, 2 or 3 h per day. The directions that turtles swam matched those of actual turtles that were tested in the same magnetic fields that defined each of the navigation zones (Lohmann et al., 2001 Fuxjager et al., 2011). At the start of every hour that a simulated turtle swam, a directional heading was assigned. The heading was selected randomly from a range of orientation bearings suitable for each navigation zone. All headings in a given zone were within ±40 deg of the mean heading elicited by the corresponding field. The 80 deg range of orientation angles used approximately matches the 95% confidence interval observed in behavioral experiments (Lohmann et al., 2001 Fuxjager et al., 2011). Turtles only swam when inside a navigation zone (Fig. 1) otherwise they drifted passively. We initially included simulations of turtles that swam for equivalent periods (1–3 h per day) in random directions (0–359 deg), but do not report these results here because outcomes were essentially identical to those of the passively drifting group (supplementary material Fig. S1). Parameters for each behavioral scenario are summarized in Table 1.

Analyses

As a first step towards visualizing how navigation behavior might affect the distribution of young loggerheads throughout the North Atlantic, we generated maps that highlight locations where models of passive drift and oriented swimming behavior predicted differences in abundance. For each 5 year period modeled, one of the 10 replicates of passive drifting and one of the 10 replicates of magnetic navigation were selected at random. An image showing the distribution of turtles in each scenario was created by plotting the locations of all turtles at 25 day intervals starting 18 September and continuing through the duration of the simulation. This date was chosen as a starting point because that was when the final group of simulated hatchlings was released each year and thus was the first day that the position of all turtles could be plotted. In each image, individual turtles were represented as squares of approximately 0.25° latitude by 0.25° longitude, centered on the exact position specified by ICHTHYOP. A custom Python™ script summed the number of turtles overlapping each pixel in the map.

This process was repeated for both maps, so that each pixel in each map was assigned a value representing the number of turtles at that geographic location. For each pixel, the script then subtracted the value obtained in the magnetic navigation simulation from the value obtained in the passive drift simulation. These data were used to generate a new map, in which negative values (highlighted in blue) corresponded to locations where navigation behavior led to an increased density of turtles and positive values (highlighted in red) corresponded to locations where navigation behavior led to a decreased density of turtles. Color scales were adjusted so that darker colors indicated greater differences in turtle density between the two scenarios. In other words, dark blue indicated a location where navigation behavior greatly increased turtle density, relative to the scenario of passive drift, whereas light blue indicated only a modest increase (see color scale in Fig. 2). Locations with no difference between behavioral scenarios were shown as white. For simplicity, we present the results comparing the simulations of passive drift to the intermediate activity level that was modeled (2 h per day of swimming).

Effects of simulated magnetic navigation behavior on spatial patterns of loggerhead turtle abundance in the North Atlantic. Each map displays the results of a different 5 year period (the start year is indicated in the lower left corner) in which the distribution of turtles that drifted passively was compared with the distribution of turtles that engaged in 2 h of magnetic navigation behavior per day. Locations highlighted in blue correspond to areas where navigation behavior (see Materials and methods) led to an increased abundance of turtles relative to passive drift. Locations in red correspond to areas where the same navigation behavior led to a decrease in the abundance of turtles relative to passive drift. The darker each color, the greater the difference in predicted turtle density between simulations involving navigation behavior and those involving passive drift. Locations with no difference in predicted turtle density between the two scenarios are colored white (indicated by 0 on the color scale at the bottom of the figure). Most blue coloration is distributed within the currents of the North Atlantic Subtropical Gyre (a favorable habitat for young loggerheads), indicating that magnetic navigation increases turtle density (relative to passive drift) in this oceanic area. In particular, a dense cluster of blue can be seen around the Azores (islands off the coast of Portugal see Fig. 1, trajectory 5 for location) during most 5 year periods, suggesting that responses to regional magnetic fields facilitate migration to this productive foraging area. For all six years studied, magnetic navigation led to an increase in the number of turtles reaching the Azores relative to passive drifters: 110% in 2004, 117% in 2005, 122% in 2006, 141% in 2007, 75% in 2008 and 57% in 2009. By contrast, red coloration is mostly concentrated near the margins of the gyre. Thus, relative to passive drift, magnetic navigation apparently diminished the density of turtles in suboptimal locations where predation or winter temperatures pose risk, such as along the eastern US coast and in the northeastern corner of the gyre.

Effects of simulated magnetic navigation behavior on spatial patterns of loggerhead turtle abundance in the North Atlantic. Each map displays the results of a different 5 year period (the start year is indicated in the lower left corner) in which the distribution of turtles that drifted passively was compared with the distribution of turtles that engaged in 2 h of magnetic navigation behavior per day. Locations highlighted in blue correspond to areas where navigation behavior (see Materials and methods) led to an increased abundance of turtles relative to passive drift. Locations in red correspond to areas where the same navigation behavior led to a decrease in the abundance of turtles relative to passive drift. The darker each color, the greater the difference in predicted turtle density between simulations involving navigation behavior and those involving passive drift. Locations with no difference in predicted turtle density between the two scenarios are colored white (indicated by 0 on the color scale at the bottom of the figure). Most blue coloration is distributed within the currents of the North Atlantic Subtropical Gyre (a favorable habitat for young loggerheads), indicating that magnetic navigation increases turtle density (relative to passive drift) in this oceanic area. In particular, a dense cluster of blue can be seen around the Azores (islands off the coast of Portugal see Fig. 1, trajectory 5 for location) during most 5 year periods, suggesting that responses to regional magnetic fields facilitate migration to this productive foraging area. For all six years studied, magnetic navigation led to an increase in the number of turtles reaching the Azores relative to passive drifters: 110% in 2004, 117% in 2005, 122% in 2006, 141% in 2007, 75% in 2008 and 57% in 2009. By contrast, red coloration is mostly concentrated near the margins of the gyre. Thus, relative to passive drift, magnetic navigation apparently diminished the density of turtles in suboptimal locations where predation or winter temperatures pose risk, such as along the eastern US coast and in the northeastern corner of the gyre.

To further quantify how magnetic navigation behavior of young loggerheads influences their distribution in the North Atlantic, we performed statistical analyses using the data from all 10 replicates per simulation and for each behavioral scenario. To determine the percentage of turtles following five likely dispersal trajectories, we counted the number of turtles throughout the 5 year simulations that entered: (1) the South Atlantic Bight (2) the Mid-Atlantic Bight and Gulf of Maine (3) any area north of 46° latitude (4) the waters surrounding the Bahamas and (5) the waters surrounding the Azores (Fig. 1). These five trajectories differ in their suitability for young turtles. The first three trajectories (South Atlantic Bight, Mid-Atlantic Bight/Gulf of Maine and north of 46° latitude) are likely suboptimal because winter temperatures fall below the thermal tolerance of loggerheads (Collard and Ogren, 1990 Witt et al., 2010). Additionally, predators of young turtles are thought to be abundant in coastal waters of North America and the likelihood of small turtles surviving in such areas is probably low (Collard and Ogren, 1990 Whelan and Wynken, 2007). In contrast, the open-sea trajectories that lead towards the Bahamas and Azores have appropriate temperatures, ample foraging opportunities and reduced predation risk and are thus favorable for young loggerheads (Carr, 1986 Carr, 1987 Bolten and Bjorndal, 1988 Bjorndal and Bolten, 1988 Bolten et al., 1998).

A two-way ANOVA with replication was used to determine whether magnetic navigation behavior influences the proportion of turtles following the five dispersal trajectories in the North Atlantic throughout the 5 year simulations. The two factors we considered were swimming activity (d.f.=3) and dispersal trajectory (d.f.=4). For each swimming activity (0, 1, 2, 3 h per day of swimming), we calculated the mean percentage of turtles that followed each trajectory in the 10 replicates (thus the six 5 year periods were treated as replicates). Two-way ANOVAs with replication were also used to determine whether swimming activity affected the percentage of turtles that followed different dispersal trajectories. For these analyses, the two factors were swimming activity (d.f.=3) and the six 5 year periods (d.f.=5) in this case the 10 replicates for each 5 year period served as replicates.

At present, no empirical observations of loggerhead abundance in the open ocean are available to compare with the predicted patterns from these models. However, as a first step towards determining which modeled behavior is most compatible with the available data on the open-sea distribution of loggerheads, we compared the results for each behavioral scenario with analyses by Monzon-Arguello et al. (Monzon-Arguello et al., 2009), which used mtDNA to predict the connectivity between the nesting rookeries and foraging grounds of loggerheads in the North Atlantic. Their techniques took into account the relative population sizes at nesting rookeries and the haplotype frequencies at the rookeries and foraging grounds to generate a ‘rookery-centric’ estimate of the percentage of turtles from a given rookery that travel to particular foraging grounds. Because of our focus on navigation behavior along the northern portion of the turtles’ migratory route, we compared the percentage of simulated turtles reaching the Azores in our model with the estimate by Monzon-Arguello et al. (Monzon-Arguello et al., 2009) for the south Florida loggerhead rookery. To make our results comparable, we excluded from this analysis turtles that: (1) were advected into coastlines [as was done by Blumenthal et al. (Blumenthal et al., 2009)] and (2) exited the domain north of 47° latitude during the first year of the simulation. This was necessary because ICHTHYOP (v. 2.21) particle-tracking software does not compute subsequent trajectories for such particles that, in effect, experience ‘mortality’. The technique used by Monzon-Arguello et al. (Monzon-Arguello et al., 2009) does not consider mortality and assumes that all turtles from a given rookery survive to reach some location (even if the location is unknown) (Bolker et al., 2007).


Diskussion

We have presented SLiM 3, a new major release of the SLiM forward genetic simulation framework. SLiM 3 provides many improvements over previous versions of SLiM, which are described in detail in the comprehensive documentation. Here we have focused on the two major features that enable SLiM 3 models to go beyond the limitations and assumptions of the Wright–Fisher model upon which all previous versions were based: the nonWF model type, and support for continuous space.

The nonWF model type affords the model control over each individual mating event. This makes it easy to control model characteristics such as mate-choice behavior, fecundity, and individual variation in reproduction. In nonWF models, fitness influences survival, not mating probability, by default, which allows more natural and realistic population dynamics. Other important model features that are relevant for realistic ecology, such as overlapping generations, age structure, and realistic migration/dispersal behavior, also emerge naturally in this design. However, the option to construct a WF model, as in previous SLiM versions, remains this can be useful particularly when one wishes to compare a forward simulation model to an analytical model based upon Wright–Fisher assumptions.

Similarly, SLiM 3 provides the option of incorporating continuous space into a model, but models of discrete subpopulations connected by migration are also still supported. When continuous space is enabled, SLiM 3 provides a variety of useful tools for spatial modeling, such as spatial maps, which can define landscape characteristics that influence model dynamics, and a spatial interaction engine that can efficiently calculate interaction strengths between individuals and find nearby neighbors of an individual. SLiMgui also provides helpful visualizations for such models, making it easy to observe the dynamics that emerge from spatiality.

It should be emphasized that these features really dovetail with each other in particular, ecologically realistic models involving continuous space should almost always be nonWF models. This is because the WF model imposes global population regulation upon the simulation an overall size is set for each subpopulation, such that if density increases in one area of space (due to immigration, for example), absolute fitness will effectively decrease across the whole landscape. It is possible to compensate for this with appropriate fitness scaling, but it becomes quite complex if there is variation in local carrying capacity, immigration and emigration rates, variation in fecundity, etc. the externally imposed population size of WF models is simply not designed to accommodate locally determined population density. The emergent population size and density in nonWF models, on the other hand, automatically accounts for whatever factors influence birth and death in the model. This is the reason that both of the continuous-space examples we presented are nonWF models the influence upon local density of the sweep of a beneficial mutation in Example 3, or of the occasional disasters of Example 4, would be extremely difficult to model in a WF framework.

Many other new features of SLiM 3 have not been substantially discussed here. We urge all users to read about tree-sequence recording, which we believe to be a revolutionary new method that will considerably extend the horizon of what is possible in forward simulation ( Haller et al. 2018). The SLiM manual ( Haller and Messer 2016) now contains recipes and reference documentation for other new features, and the Eidos manual ( Haller 2016) now documents new additions to the Eidos language. It is worth noting particularly that a great deal of optimization work has gone into SLiM 3, and it is generally much faster than previous versions, especially for large models with long chromosomes, which can be orders of magnitude faster than in previous versions. We have provided a performance comparison ( supplementary results , Supplementary Material online ) that illustrates these benefits and the performance tradeoffs involved with nonWF models and continuous space.

SLiM 3 is free, licensed under the GNU GPL, and is available on GitHub. Most users, however, will wish to download the release version from https://messerlab.org/slim/ the extensive manuals, with many examples, can be downloaded from the same website. We also encourage SLiM users to subscribe to the slim-discuss list at http://bit.ly/slim-discuss, where new versions are announced and users can ask questions and get help. The features that we have focused on here, nonWF models and continuous space, will enable many modeling scenarios that would have been difficult or impossible to model in previous versions of SLiM. We hope this will open up new frontiers in both applied and theoretical research.


Materialen und Methoden

Sampling from phylo-grammars

A phylo-grammar is a stochastic context-free grammar whose every state generates alignment columns (or groups of alignment columns). The residues in each row of such a column are related by an underlying phylogenetic tree (whose topology remains constant), using a continuous-time Markov chain subsitution model (which is allowed to vary from state to state). Each state in the grammar is allowed to generate several columns simultaneously these sites then evolve co-ordinately, so that a state can (for example) emit three columns that evolve together as a codon triplet, or two distantly separated columns that evolve as a base-pair in a non-coding RNA alignment.

One can vary the evolutionary rate throughout the tree, and for this behavior to be state-dependent, so that different states in the grammar can have trees with different branch lengths. However, SIMGRAM requires that the tree topology stay constant throughout the alignment. (While it is mathematically straightforward to construct phylo-grammars with alternative tree topologies in the various states, such models are not implemented by SIMGRAM.)

Sampling from the phylo-grammar proceeds in two stages. First, a parse tree is sampled by repeated application of randomized grammar rules. Next, a Gillespie algorithm is used to simulate continuous-time Markov chain trajectories for each set of co-evolving columns [64].

Sampling from lexicalized transducers

A transducer is a finite state machine, similar to a 'Pair-HMM', but conditionally normalized thus, instead of emitting two sequences (as does a Pair-HMM), the transducer absorbs one sequence (x) as an input and emits the second sequence (Ja) as an output. Practically, a transducer looks very similar to a Pair-HMM: it has match, delete and insert states, and the training and alignment algorithms are almost identical. The key difference is the probabilistic normalization: a transducer's emission and transition probabilities are normalized such that the likelihood of any state path π corresponds to the conditional probability P(π,Ja|x), whereas in a Pair-HMM the state path likelihood corresponds to the joint probability P(π,x,Ja). Conceptually, a transducer absorbs a symbol on the input, then decides (randomly) what state to go into, then emits a symbol (or symbols) on the output in contrast, a Pair-HMM first changes state, then emits symbol(s) on either or both outputs.

A transducer models random changes in a sequence, as might occur on an individual branch of a phylogenetic tree. It is also convenient to introduce a special type of transducer, located at the root of the tree, that only emits sequence (that is, it has only 'insert' states, and lacks 'match' or 'delete' states to absorb an input sequence). Such a transducer is referred to as a 'singleton' transducer and is exactly equivalent to a single sequence-emitting HMM. The composition of an (emitting) singleton transducer with an (absorbing-and-emitting) branch transducer yields a machine that is exactly equivalent to a Pair-HMM.

A lexicalized transducer is one in which the probability parameters for making transitions between states, and for absorbing or emitting various symbols within states, are dependent on the last few symbols that were emitted or absorbed. This dependence allows the root transducer to generate higher-order compositional statistics of DNA (such as dinucleotide or trinucleotide frequencies). It also allows the branch transducers to model phenomena such as increased rates of indels and substitutions in low-complexity regions, such as microsatellites.

The lexicalized transducer underlying GSIMULATOR is a discrete mutator that introduces substitutions and indels at a frequency corresponding to a finite span τ of evolutionary time, corresponding (typically) to a short branch on a phylogenetic tree. For example, the pre-trained transducers that are distributed with GSIMULATOR, and parameterized from Drosophila alignments, correspond to a branch length of τ ≈ 0.07 substitutions per site. Longer branches of the tree, with length T > τ, are simulated by iterated application of the transducer (for example, a branch of length T = 0.35 corresponds to five repeated applications of an evolutionary transducer with branch length τ ≈ 0.07) branches of length T < τ are rounded up (if T ≥ τ/2) or down (if T < τ/2).

In other words, evolutionary time T is treated as a discrete parameter, corresponding to some integer multiple of τ. This contrasts with many point substitution models that are used in molecular evolution (and in previous evolutionary simulators), which are based on continuous-time Markov chains. This behavior is deliberate and justified on the grounds of realism, as follows: it is extremely difficult to obtain closed-form matrix exponential solutions to the transition probabilities for context-dependent substitution and indel models of the kind used by GSIMULATOR. Indeed, only approximate solutions currently exist for context-dependent substitution models [44, 65], and there is currently no good theory at all for context-dependent indels. We argue that the increased realism of context-dependence is easily worth a small reduction in granularity of the evolutionary time parameter. In cases where fine-grained time distinctions are critical, the SIMGRAM phylo-grammar simulator described here can be used instead.

The training procedure for GSIMULATOR is straightforward. The algorithm for estimating the parameters is essentially the same as the Baum-Welch algorithm for training a Pair-HMM from a pairwise sequence alignment [66]. The corresponding inference algorithms are not detailed here, but there exist a range of dynamic programming algorithms, from exhaustive inference to Markov Chain Monte Carlo algorithms [31, 67–69] that can be used to impute alignments and evolutionary histories, to reconstruct ancestral sequences, or to annotate sequences in alignment-free (as well as alignment-dependent) ways. The particular algorithm used by GSIMULATOR to infer parameters is a variant on the Baum-Welch algorithm [66]. During training, GSIMULATOR finds the branch length τ from the underlying data using a Jukes-Cantor distance estimate [70].

For the four symbols of the DNA alphabet, order-K context-dependence multiplies the number of transducer parameters by a factor of 4 2K . In practice, the quantity of training data (and potentially runtime and/or memory considerations) will limit the value of K. We find that a value of K = 3 yields a transducer that can reasonably be trained from eukaryotic genome alignments of the approximate size of Drosophila, but that this transducer takes a long time to train (especially if the degeneracy n of the indel states is greater than 1).

We do not currently have a specialized ancestral reconstruction tool for lexicalized transducers instead, we have a more general tool. The previously published Handel program [68] is a Gibbs sampler for multiple alignments and ancestral sequence reconstructions under the TKF91 model [71]. More recently, it has been extended to model affine indel-length distributions (unpublished). Handel can also be coupled to any external program that implements a probabilistic scoring function for alignments that is, given any ancestral reconstruction EIN in Stockholm alignment format [72], the program must compute and then output P(EIN,S|m) for some model m, wo S represents the observed sequences at leaf nodes. (GSIMULATOR is itself one such program.) Handel then accepts the Markov Chain Monte Carlo move from EINA' with probability:

wo T represents the TKF91 model this is a Hastings ratio [73]. Asymptotically, this yields a direct sample from P(EIN|S,m).

Generative model features

Most features of the SIMGENOME phylo-grammar are self-explanatory, either from this paper or by inspection of the commented grammar file (located in the subdirectory dart/grammars/SIMGENOME.eg ). The length distribution of exons is a negative binomial distribution, or Pascal distribution, obtained by serial chaining of left-regular states, each of which emits a geometrically distributed number of codons. (The Pascal distribution is that of the sum of independent, geometrically distributed random variables.) This results in far fewer unrealistically shorter exons than would be generated by a geometric distribution, while allowing easy parameterization of the mean exon length.

The default GSIMULATOR model used by SIMGENOME has two insert states and two delete states, and uses three nucleotides of both input and output context. Roughly speaking, this corresponds to a mixture of geometric distributions over gap lengths however, due to the input and output context, the precise length of inserted or deleted sequences will also depend on the sequence content of those indels.


Schau das Video: How to Avoid Developer Burnout 8 Simple Tips (Januar 2022).