Information

Gibt es eine Möglichkeit zu sagen, ob ein Gen für ein Individuum nur mit einer Referenzsequenz und der Sequenz des Gens des Individuums funktionsfähig ist?


Ich habe die Gensequenz einer Tonne von Individuen innerhalb einer Unterart von cdna und auch die ncbi-identifizierte Sequenz. Gibt es eine Möglichkeit, anhand der Sequenz zu erkennen, dass das Gen für ein Individuum nicht oder nur teilweise funktionsfähig ist?


Generell nein. Es kann bestimmte Fälle geben, in denen Sie dies tun können, z. B. wenn es frühzeitig ein Stoppcodon oder eine Frameshift-Mutation gibt, oder jemand anderes Ihre genaue Variante gesehen und experimentell bewiesen hat, dass sie keine Funktion hat.

Aber im Allgemeinen kann man die Funktion nicht vorhersagen von in silico Daten allein.


Mit Programmen wie Sift oder polyphen (nur für menschliche Proteine) ist es möglich, eine Vorhersage der durch eine Mutation verursachten Veränderung zu erhalten, aber dies sind nur grobe Schätzungen


Ich kenne Ihren Kenntnisstand nicht, daher mag Ihnen dies sehr offensichtlich erscheinen, aber…

  • Wenn Sie es in die sechs Frames übersetzen, erhalten Sie einige Hinweise. Wenn die Sequenz degeneriert ist und voller Stoppcodons ist, dann ist sie nicht funktionsfähig.

  • Richten Sie die Sequenzen mit Mega oder AliView oder was auch immer aus und übersetzen Sie sie dann. Wenn in Ihrer Sequenz eine Frameshift-Mutation vorhanden ist, wird diese innerhalb des Alignments sehr sichtbar und die Wahrscheinlichkeit ist groß, dass die Sequenz nicht mehr funktioniert.

  • Finden Sie Informationen über die Domäne des Proteins in Pfam und sehen Sie sich die Ausrichtungen in der funktionellen Domäne genau an. Wenn sonst konservierte Reste mutiert sind, sollte dies klingeln. (Da alle Ihre Sequenzen einander sehr ähnlich sind, möchten Sie möglicherweise einige Sequenzen des Proteins anderer Spezies hinzufügen, damit Sie die aktiven Reste innerhalb einer Domäne leichter finden können)


GOToolBox: Funktionsanalyse von Gendatensätzen basierend auf Gene Ontology

Wir haben Methoden und Werkzeuge entwickelt, die auf der Ressource Gene Ontology (GO) basieren, die es ermöglichen, statistisch über- oder unterrepräsentierte Begriffe in einem Gendatensatz zu identifizieren, funktionell verwandte Gene innerhalb eines Sets zu gruppieren und Gene abzurufen, die Annotationen mit einer Abfrage teilen Gen. GO-Annotationen können auch auf eine schlanke Hierarchie oder eine bestimmte Ebene der Ontologie beschränkt werden. Die Quellcodes sind auf Anfrage erhältlich und werden unter der GPL-Lizenz vertrieben.


Hintergrund

Die genetische Variation beschränkt sich nicht auf einzelne Nukleotidpolymorphismen oder kleine Insertionen und Deletionen, sondern erstreckt sich auch auf (große) strukturelle Variationen. Zu diesen strukturellen Variationen gehören Kopienzahlvariationen (CNVs) und Anwesenheits-/Abwesenheitsvariationen (PAVs), die zu erheblichen Variationen des Gengehalts zwischen einzelnen Genomen führen können [1, 2]. Die vergleichende Analyse mehrerer Genome derselben phylogenetischen Klade ermöglicht die Identifizierung von PAVs, die mit phänotypischen Merkmalen verbunden sind. Bei Nutzpflanzenarten ist die Identifizierung von PAVs möglich, die bestimmten agronomischen Merkmalen zugrunde liegen, die nur bei einer einzelnen oder wenigen Arten vorkommen [3,4,5]. Da immer höher zusammenhängende Genomsequenzen verfügbar werden, eignen sich Pangenome zur Beschreibung und Untersuchung der Genset-Diversität einer biologischen Klade, z.B. Art, Gattung oder höher [6, 7].

Man nimmt an, dass die Gene eines Pangenoms in einen Kern- und einen entbehrlichen Gensatz unterteilt werden, letzterer wird in der Literatur auch oft als „Accessoire“ bezeichnet. Kerngene kommen in allen untersuchten Genomen vor, entbehrliche Gene hingegen nur in einem oder wenigen Genomen [8]. In eukaryotischen Pangenomstudien werden Kern- und entbehrliche Gene meist anhand von Sequenzähnlichkeiten identifiziert, z. unter Verwendung von GET_HOMOLOGUES-EST Markov-Clustering [9], OrthoMCL-Genfamilien-Clustering [10] oder BLASTN [11]. Manchmal wird eine dritte Kategorie von 'bedingt entbehrlichen' Genen aufgerufen [12] oder Gene können als 'Cloud', 'Shell', 'Soft-Core' und 'Core' [13] oder sogar als 'Core', ' softcore“, „entbehrlich“ und „privat“ [14]. Diese eindeutige Klassifizierung basiert jedoch nicht auf der biologischen Entbehrlichkeit von Genen und beruht auf einem oder mehreren willkürlichen Cutoffs. Einige Studien betrachten Gene als „Core“, wenn diese Gene in mindestens 90 % der untersuchten Genome vorkommen [11], in anderen Studien sind nur Gene, die in allen Genomen vorkommen, Teil des Core-Genoms [10]. Darüber hinaus können Abhängigkeitsgruppen die Entbehrlichkeit bestimmter Gene beeinflussen. Die Möglichkeit, dass zwei Gene durch eine bestimmte Anzahl anderer Gene „ersetzt“ werden, muss in Betracht gezogen werden. Einige Gene, von z.B. einer Genfamilie, in einem bestimmten Anteil benötigt werden und daher nur bedingt entbehrlich sind [12]. Darüber hinaus können Genom- oder Transkriptomanordnungen unvollständig sein, was zu künstlich fehlenden Genen führt [15]. Eine Möglichkeit, dies zu umgehen, besteht darin, sich nur auf qualitativ hochwertige Referenzgenomsequenzen zu verlassen und so zusätzliche Baugruppen zu vermeiden, die potenzielle Fehlerquellen darstellen.

Hier stellen wir QUOD vor – ein bioinformatisches Werkzeug zur Quantifizierung der Entbehrlichkeit von Genen. Ein A. thaliana Ein Datensatz von etwa 1000 Akzessionen wurde verwendet, um einen Pro-Gen-Entbehrlichkeits-Score zu berechnen, der aus der Abdeckung aller Gene in den gegebenen Genomen abgeleitet wurde. Dieser Score wurde durch den Vergleich von Scores von BUSCOs und die funktionelle Untersuchung von Genen mit High-Dispensability-Scores validiert. Unser Tool ist für alle Arten von Pflanzenarten einfach zu bedienen. QUOD erweitert die eindeutige Klassifizierung von Genen in „Kern“ und „entbehrlich“ basierend auf einem willkürlichen Schwellenwert zu einem kontinuierlichen Entbehrlichkeits-Score.


Genetische Störungen

Genetische Störungen können aus vielen Gründen auftreten. Genetische Störungen werden oft in Bezug auf das Chromosom beschrieben, das das Gen enthält, das bei Menschen mit der Störung verändert wurde. Wenn sich das Gen auf einem der ersten 22 Chromosomenpaare, den Autosomen, befindet, wird die genetische Störung als autosomale Erkrankung bezeichnet. Liegt das Gen auf dem X-Chromosom, wird die Störung als X-chromosomal bezeichnet.

Genetische Störungen werden auch danach gruppiert, wie sie in der Familie verlaufen. Störungen können dominant oder rezessiv sein, je nachdem, wie sie Erkrankungen verursachen und wie sie in der Familie verlaufen.

Dominant

Dominante Krankheiten können durch nur eine Kopie eines Gens mit einer DNA-Mutation verursacht werden. Wenn ein Elternteil die Krankheit hat, hat jedes Kind eine 50%ige Chance, das mutierte Gen zu erben.

Rezessiv

Bei rezessiven Erkrankungen müssen beide Kopien eines Gens eine DNA-Mutation aufweisen, um eine dieser Erkrankungen zu bekommen. Wenn beide Elternteile eine Kopie des mutierten Gens besitzen, hat jedes Kind eine 25-prozentige Wahrscheinlichkeit, an der Krankheit zu erkranken, obwohl kein Elternteil sie hat. In solchen Fällen wird jeder Elternteil als Träger der Krankheit bezeichnet. Sie können die Krankheit an ihre Kinder weitergeben, haben die Krankheit aber selbst nicht.


Ergebnisse

Nachweis einer abweichenden Genexpression über mehrere transkriptomische Phänotypen

Wir quantifizierten drei transkriptionelle Phänotypen für jedes Gen, um ein breites Spektrum funktioneller Effekte zu erfassen, die durch regulatorische genetische Varianten verursacht werden. Kurz gesagt, um Ausdrucksausreißer (eOutliers) zu identifizieren, haben wir Z Scores aus korrigierten Expressionsdaten pro Gewebe, um zu bestimmen, ob ein Gen in einem Individuum eine extrem hohe oder niedrige Expression aufweist (Abb. S1) (15, 16). Um Gene mit übermäßigem allelischem Ungleichgewicht [allelspezifische Expression (ASE) Ausreißer (aseOutliers)] zu identifizieren, verwendeten wir ANEVA-DOT (Analyse der Expressionsvariation-Dosierung Ausreißer Test Abb. S2 und S3) (16, 17). Diese Methode verwendet Schätzungen der genetischen Variation in der Dosierung jedes Gens in einer Population, um Gene zu identifizieren, für die ein Individuum eine heterozygote Variante mit einer ungewöhnlich starken Wirkung auf die Genregulation aufweist (17). Splicing-Ausreißer (sOutliers) wurden mit SPOT (Splicing Outlier Detection) erkannt, einem hier vorgestellten Ansatz, der eine Dirichlet-Multinomial-Verteilung direkt an die Anzahl der Reads anpasst, die über alternativ gespleißte Exon-Exon-Verbindungen für jedes Gen aufgeteilt wurden. SPOT identifiziert dann anhand dieser angepassten Verteilung Individuen, die signifikant von der Erwartung abweichen (Abb. S4 bis S6) (16). Jede der drei Methoden wurde auf alle GTEx-Proben angewendet. Ein Individuum wurde als Multitissue-Ausreißer für ein bestimmtes Gen bezeichnet, wenn seine mediane Ausreißerstatistik über alle gemessenen Gewebe einen gewählten Schwellenwert überstieg (Abb. 1A) (16). Mit diesem Multitissue-Ansatz für jeden Phänotyp fanden wir heraus, dass jedes Individuum im Median vier eOutlier-, vier aseOutlier- und fünf sOutlier-Gene aufwies.

(EIN) RNA-seq-Daten von 838 Individuen wurden in 49 Geweben kombiniert und verwendet, um gemeinsame Gewebeexpression, ASE und alternative Splicing-Ausreißer zu identifizieren. (B) Relatives Risiko für neue (nicht in gnomAD), Singleton, Doubleton, seltene (MAF <1%) und niederfrequente (MAF 1 bis 5%) Varianten in einem 10-kb-Fenster um die Ausreißergene über alle Datentypen im Vergleich zu Nicht-Ausreißer für die gleichen Gene. Ausreißer wurden als solche mit Werten >3 SDs vom Mittelwert (|Median Z| > 3) oder äquivalent ein Median P < 0,0027. Balken repräsentieren das 95 %-Konfidenzintervall. (C) Zuweisung jedes Ausreißers seiner folgenreichsten nahegelegenen RV, wobei das relative Risiko für verschiedene Kategorien von RVs innerhalb von 10 kb jedes Ausreißertyps liegt. Das eingefügte Panel zeigt Anreicherungen für eine Teilmenge von Variantenkategorien auf einem log(2)-transformierten ja-Achsenskala für bessere Sichtbarkeit. (D) Anteil der Ausreißer bei einem gegebenen Schwellenwert, die einen nahegelegenen RV in der gegebenen Kategorie haben. eAusreißer |median Z Partituren| wurden umgewandelt in P Werte unter Verwendung der kumulativen Wahrscheinlichkeitsdichtefunktion für die Normalverteilung. TE, transponierbares Element INV, Inversion BND, Break-Ende DEL, Deletion DUP, Duplikation. (E) Anteil der RVs in einer bestimmten Kategorie, die zu einem Ausreißer bei a . führen P-Wertschwelle von 0,0027 für alle Typen.

Gene mit abweichender Expression, ASE und Spleißen werden für funktionell unterschiedliche RVs angereichert

Wir beobachteten, dass Multitissue-Ausreißer für jeden der drei transkriptomischen Phänotypen signifikant häufiger einen RV (MAF <1%) im Genkörper oder ±10 kb trugen als Personen ohne Ausreißer, die unter 714 Personen mit europäischer Abstammung untersucht wurden. Diese Anreicherungen waren bei selteneren Varianten zunehmend ausgeprägter und bei Strukturvarianten (SVs) stärker als bei Einzelnukleotidvarianten (SNVs) und Indels ( 1B ). Diese Trends waren nicht von der spezifischen Wahl des Schwellenwerts abhängig, der zur Definition von Ausreißern verwendet wurde (Abb. S7 und S8).

Wir fanden nur 35 Fälle, in denen ein einzelnes Gen ein Multitissue-Ausreißer für alle drei transkriptionellen Phänotypen war. Alle außer einem davon hatten einen nahegelegenen RV, und die meisten wurden als Spleißvarianten bezeichnet. Unter den Genen, die Ausreißer für zwei Transkriptionsphänotypen in einem Individuum waren (n = 465), gab es die größte Überlappung zwischen aseOutliers und eOutliers (n = 319 fig. S9A). Wir haben festgestellt, dass aseOutliers mit bescheidenen Ausdrucksänderungen (1 < |median Z| < 3) zeigte eine stärkere Anreicherung für benachbarte RVs als diejenigen ohne jegliche Expressionsänderung (Abb. S9), was einen wichtigen Vorteil der Kombination dieser Phänotypen zur Entdeckung verschiedener RV-Effekte hervorhebt. Wir fanden heraus, dass Gene, für die keine Ausreißer identifiziert wurden, um biologische Prozessbegriffe der Genontologie in Bezug auf die sensorische Wahrnehmung und die Detektion chemischer Reize für alle Ausreißertypen angereichert wurden (Abb. S10) (16(18).

Wir fanden heraus, dass verschiedene Typen genetischer Varianten zu Ausreißern für die drei molekularen Phänotypen beitragen, obwohl seltene Spleißdonor-Varianten in der Nähe aller Ausreißertypen angereichert waren (Abb. 1C). Die größten Unterschiede in der Variantentypanreicherung zwischen den drei Ausreißertypen waren Kopienzahlvariationen (CNVs) und Duplikationen, die fast ausschließlich mit eOutliers assoziiert waren, und Spleißakzeptorvarianten, die innerhalb von sOutliers deutlich stärker angereichert waren (Abb. S11).

Für alle Phänotypen nahm der Anteil der Ausreißer mit einem nahegelegenen RV jeder Kategorie mit der Schwellenwertstringenz zu (Abb. 1D). Für eOutliers, aseOutliers und sOutliers am strengsten Schwellenwert des Median-Ausreißers P < 1,1 × 10 –7 , die meisten Personen trugen mindestens ein RV in der Nähe des Ausreißergens (82 bis 94 %). Bei näherer Betrachtung von RVs mit funktionalen Annotationen (aus den in Abb. 1C aufgeführten Annotationen) stellten wir fest, dass unterexprimierte eOutliers am besten interpretierbar waren, wobei 88 % der mit Ausreißern assoziierten RVs eine zusätzliche funktionale Annotation aufwiesen, während aseOutliers den niedrigsten Anteil bei . aufwiesen 56% (Abb. 1D). Diese Analyse liefert weitere Einblicke in die Erwartungen an kausale RV-Typen, wenn bei einer Person ein Ausreißereffekt einer bestimmten Größenordnung beobachtet wird.

Umgekehrt trat ein großer Teil der Gene mit nahegelegenen seltenen genetischen Varianten nicht als Ausreißer auf, selbst bei den prädiktivsten Klassen wie den Funktionsverlustvarianten. Der größte Anteil an Varianten, die zu einem Ausreißerstatus führten, waren seltene Spleißdonor- und Spleißakzeptor-Varianten, von denen nur 7,2 bzw. 6,8 % zu einem sOutlier führten (Abb. 1E und Abb. S11). Obwohl einige transkriptomische Effekte möglicherweise übersehen wurden, verstärkt die geringe Häufigkeit, mit der RVs dieser Klassen zu großen Transkriptomänderungen führten, die Nützlichkeit der Einbeziehung funktioneller Daten in die Varianteninterpretation selbst für spezifische Variantenklassen, die bereits in der klinischen Interpretation verwendet wurden.

Die genomische Position von RVs sagt den Einfluss auf die Expression voraus

Obwohl wir hauptsächlich RVs untersucht haben, die entweder innerhalb eines Ausreißergens oder in einem umgebenden 10-kb-Fenster vorkommen, kann die Genregulation in größeren Abständen erfolgen (19, 20). Da wir die stärksten Anreicherungen für die Varianten mit der niedrigsten Häufigkeit beobachteten, kreuzten wir Singleton-Varianten [(SVs), d.21)]. Die SNV-Anreicherungen nahmen bei größerer Entfernung vom Gen schnell ab, blieben jedoch für eOutliers auf 200 kb schwach angereichert. Das gleiche galt für seltene Indels, mit Anreicherung bei 200 kb nur für sOutliers. SVs blieben über viel längere Distanzen angereichert, wobei sie 2,33-fach bis zu 800 kb bis 1 Mb stromaufwärts und bis zu 600 kb stromabwärts des Genkörpers angereichert wurden (Fig. 2A und Fig. S12A).

(EIN) Relatives Risiko von SNVs und Indels (nicht in gnomAD gefunden) und SVs (Singleton in GTEx) in unterschiedlichen Abständen stromaufwärts von Ausreißergenen (bins exclusive) über alle Datentypen hinweg. (B) Anteil von eOutliers mit TSS RVs in Promotormotiven innerhalb von 1000 bp. Unter- und Überbins werden mit einem Median definiert Z Score-Schwellenwert von 3, und die Kontrollen sind alle Personen mit einem Median Z Score <3 für den gleichen Satz von Ausreißergenen. (C) Graphische zusammenfassende Positionsnomenklatur relativ zu beobachteten Donor- und Akzeptor-Spleißstellen. (D) Relatives Risiko (ja-Achse) eines sOutlier (Median LeafCutter-Cluster) P < 1 × 10 –5 ) RV befindet sich an einer bestimmten Position relativ zur Spleißstelle (x-Achse) im Vergleich zu Nicht-Ausreißer-RVs. Die Berechnung des relativen Risikos wurde für Donor- und Akzeptor-Spleißstellen getrennt durchgeführt. (E) Unabhängige Positionsgewichtsmatrizen, die Mutationsspektren von sOutlier zeigen (Median LeafCutter Cluster P < 1 × 10 –5 ) RVs an Positionen relativ zu Spleißstellen mit negativer Junction-Nutzung (d. h. Spleißstellen werden bei Ausreißer-Individuen weniger verwendet als bei Nicht-Ausreißern). (F) Die Junction-Nutzung einer Spleißstelle ist der natürliche Logarithmus des Anteils von Lesevorgängen in einem LeafCutter-Cluster, der der interessierenden Spleißstelle in sOutlier zugeordnet wird (Median LeafCutter-Cluster P < 1 × 10 –5 ) Proben relativ zum Anteil in Nicht-Ausreißer-Proben, aggregiert über Gewebe, indem der Median (16). Kreuzungsnutzung (ja-Achse) der nächstgelegenen Spleißstellen zu RVs, die innerhalb eines Polypyrimidin-Trakts (A – 5, A – 35) liegen, unterteilt nach der Art der Variante (x-Achse).

RVs in Promotorregionen wurden zuvor mit der Ausreißerexpression in Verbindung gebracht (5, 15). Um diese Beobachtungen zu erweitern und die Arten von Transkriptionsfaktor (TF)-Bindungsstellen zu bewerten, die zu Ausreißern führen könnten, haben wir die Anreicherung seltener proximaler Varianten der Transkriptionsstartstelle (TSS) in spezifischen TF-Motiven in der Nähe von Unter- und Über-eAusreißern getestet. Bei under-eOutliers sahen wir eine Anreicherung der Varianten in GABP, ein TF, das Gene aktiviert, die den Zellzyklus, die Differenzierung und andere kritische Funktionen kontrollieren (22). Bei Over-eOutliers haben wir eine Anreicherung von RVs gesehen, die die E2F4 Motiv, ein TF, das als Transkriptionsrepressor beschrieben wurde (23). Sowohl bei Under- als auch Over-eOutliers sahen wir Wohnmobile in YY1, die je nach Kontext entweder als Aktivator oder Repressor wirken können (24) und wurde in Verbindung gebracht mit GABP in koregulatorischen Netzwerken (Abb. 2B und Abb. S12B) (25). Somit können diese natürlich vorkommenden RV-Störungen Informationen darüber liefern, wie spezifische TFs ihre Zielgene stark nach oben oder unten regulieren können.

RVs können mehrere Gene beeinflussen und zu einer neuen Genfusion führen

Wir haben beobachtet, dass RVs auch mehrere Gene in einem Individuum beeinflussen können. Wir fanden eine starke Anreicherung für Multigeneffekte bei eOutliers und in geringerem Maße bei aseOutliers (Abb. S13). Wie erwartet sahen wir keine Anreicherung für nahegelegene sOutlier-Paare, die weniger der Koregulierung unterliegen (26). Innerhalb eines 100-kb-Fensters waren benachbarte eOutlier-Gene 70-mal häufiger als zufällig erwartet, wenn Ausreißerpaare zufällig gezogen würden. Sie waren auch signifikant angereichert für seltene CNVs, Duplikationen und TSS-Varianten in der Nähe eines oder beider Gene im Vergleich zu Individuen, die eine Ausreißerexpression aber nur für eines der Gene aufwiesen (Abb. S13). Wir fanden auch, dass in der Nähe von eOutliers seltene SV-Anreicherungen vorhanden waren, unabhängig davon, ob die SV das Gen selbst überlappten (Abb. S14). Wir beobachteten 27 Beispiele für seltene SVs, einschließlich Deletionen, Duplikationen und Bruchenden, die mit eOutliers in mindestens zwei Genen desselben Individuums assoziiert waren (Abb. S15 und Tabelle S1). Bei einem davon beobachteten wir Hinweise auf ein Fusionstranskript, das aus einer Deletion resultiert, die das Ende des Gens SPTBN1 und den TSS von EML6 umspannt. Diese Deletion führte zu einer Unterexpression von SPTBN1 (Median Z Score = –4,67) und Überexpression von EML6 (Median Z Score = 8,12) im Vergleich zu allen anderen Personen. Als Beleg für das Vorhandensein eines neuen Keimbahn-Fusionstranskripts fanden wir Hinweise auf ein spezifisches Transkript, das sowohl SPTBN1 als auch EML6 in mehreren Geweben für das Individuum mit der Deletion umfasst (Abb. S16). Für diese beiden Gene zeigte dieses Individuum auch ein sOutlier-Signal (Median SPOT P = 0,0005 für EML6 und 0,0035 für SPTBN1). Die Identifizierung von Fusionstranskripten war von besonderem Interesse für die Krebsdiagnose und -prognose (2730), und sowohl EML-Gene als auch SPTBN1 wurden zuvor mit krebsassoziierten Fusionen in Verbindung gebracht (31, 32).

RVs in der Spleiß-Konsensussequenz führen zu Spleiß-Ausreißern

Frühere Studien haben gezeigt, dass RVs, die Spleißstellen stören, zu Ausreißer alternativen Spleißmustern führen (33, 34). Wir haben sOutlier-Aufrufe für jeden LeafCutter-Cluster verwendet (16, 35) um die Anreicherung von spleißbedingten Varianten genauer zu beurteilen. Wir beobachteten eine extreme Anreicherung von RVs in der Nähe von Spleißstellen in sOutliers. Ein sOutlier hatte eine 333-mal höhere Wahrscheinlichkeit als ein Non-Outlier, einen RV innerhalb eines 2-bp-Fensters um eine Spleißstelle herum zu beherbergen (Abb. S17A) (16), wobei das Signal bei größeren Entfernungen abklingt, aber immer noch bis zu 100 bp entfernt angereichert ist (relatives Risiko = 7,43). Um eine Anreicherung der Basenpaarauflösung zu erhalten, haben wir das relative Risiko von sOutlier-RVs berechnet, die sich an bestimmten Positionen relativ zu den beobachteten Donor- und Akzeptor-Spleißstellen befinden (16). Zehn Positionen in der Nähe der Spleißstelle zeigten eine signifikante Anreicherung für RVs in sOutliers im Vergleich zu Kontrollen (Abb. 2, C und D). Diese Positionen entsprachen genau den Positionen, die sich aufgrund ihrer konservierten Rolle beim Spleißen auch als intolerant gegenüber Mutationen erwiesen haben (wir werden diese Positionen als Spleiss-Consensus-Sequenz bezeichnen) (34). Zu den am stärksten angereicherten Positionen innerhalb der Spleißkonsensussequenz gehörten die vier wesentlichen Spleißstellenpositionen (D + 1, D + 2, A – 2, A – 1) (36), die ein durchschnittliches relatives Risiko von 195 aufwies.

sOutliers erfassten ferner die transkriptionellen Konsequenzen sowohl für Varianten, die eine Referenz-Spleiß-Konsensussequenz unterbrachen, als auch für solche, die eine neue Spleiß-Konsensussequenz erzeugten. Personen mit sOutlier-Varianten, bei denen das seltene Allel von der Spleißkonsensussequenz abwich, zeigten eine verringerte Junction-Nutzung der Spleißstelle in der Nähe der Variante, während Personen mit Varianten, bei denen das seltene Allel eine Spleißkonsensussequenz erzeugte, eine erhöhte Junction-Nutzung der Spleißstelle zeigten in der Nähe der Variante relativ zu Nicht-Ausreißern (Abb. 2E und Abb. S17B und S18) (16). Wir sahen ein ähnliches Anreicherungsmuster nach der Trennung von annotierten und neuen (nicht annotierten) Spleißstellen (Abb. S19). sOutliers wurden auch für RVs angereichert, die sich im Polypyrimidin-Trakt (PPT), einer hochkonservierten, pyrimidinreichen Region, befinden.

5 bis 35 bp stromaufwärts von Akzeptor-Spleißstellen (37). Ein RV war 6,25-mal wahrscheinlicher im PPT in der Nähe eines sAusreißers im Vergleich zu einem Nicht-Ausreißer. sAusreißer mit einem RV, der eine Position im PPT von einem Pyrimidin zu einem Purin änderte (dh ein bestehendes PPT zerstörte), zeigten eine verringerte Verwendung der Verbindungsstelle der Spleißstelle in der Nähe der Variante, während das Gegenteil für Varianten zutraf, die eine Position im veränderten PPT von Purin zu Pyrimidin (Abb. 2F und Abb. S20).

RVs in gewebespezifischen regulatorischen Regionen können zu einer gewebespezifischen Ausreißerexpression führen

Obwohl Multitissue-Ausreißer eine verbesserte Leistung zur Erkennung von RV-Effekten bieten, haben wir auch RVs von Ausreißern bewertet, die in einzelnen Geweben erkannt wurden. Einzelgewebemessungen unterliegen größeren Schwankungen als Wiederholungsmessungen über Gewebe hinweg, sind jedoch für die meisten experimentellen Designs repräsentativ. Zuerst führten wir eine Replikationsanalyse für alle Individuen mit verfügbaren Daten für die drei Methoden durch, um den Grad zu bewerten, in dem der Ausreißerstatus, der in einem Gewebe eines Individuums festgestellt wurde, in anderen Geweben repliziert wurde (16). Im Durchschnitt fanden wir, dass der eOutlier-, aseOutlier- und sOutlier-Status in einem Entdeckungsgewebe in 5,1, 10,7 bzw. 8,7 % der Fälle in einem Testgewebe nachgewiesen wurde (Abb. 3A und Abb. S21). Dies stimmt mit anderen Ergebnissen überein, dass die Messungen von ASE über alle Gewebe hinweg konsistenter sind (18). Betrachtet man klinisch zugängliche Gewebe, nämlich Vollblut, Fibroblasten und lymphoblastoide Zellen, so ergaben sich durchschnittliche Replikationsraten für alle anderen Gewebe von 14,1, 20,9 und 15,0 % für eOutliers, aseOutliers bzw. sOutliers (Abb. S22). Sowohl die höhere Replikationsrate für aseOutliers als auch die Zunahme der Ausreißerreplikation in nicht zugänglichen Geweben bei Berücksichtigung von mehr als einer zugänglichen Messung sind aufschlussreich für die Analyse funktioneller Daten aus leicht zugänglichen Geweben, um Krankheitszustände zu verstehen, die für andere Gewebe am relevantesten sind.

(EIN) Mediane Replikation der pro Gewebe identifizierten Ausreißer über jedes andere Gewebe für jeden Ausreißertyp. (B) Schätzung des relativen Risikopunkts für nahegelegene seltene SNVs für Ausreißer in allen Geweben einzeln. (C) Relative Risikoanreicherung für wahrscheinlich genstörende RVs in der Nähe von Einzelgewebe-Ausreißern bei einem Schwellenwert von |Z| > 4 (entspricht SPOT oder ANEVA-DOT P < 0.000063), mit einem Punkt pro Tissue. (D) Verteilung der Anzahl von Geweben mit abweichender Expression, die den Expressionsausreißern zugrunde liegt, definiert durch Median Z Score (eOutliers) oder Mahalanobis Distanz P Wert (Korrelation). (E) Relatives Risiko von Korrelationsausreißern aufgrund eines einzelnen Gewebes, definiert als signifikante Korrelationsausreißer, bei denen eine Ausdrucksänderung in dem durch die Punktfarbe angegebenen Grad nur in einem einzelnen Gewebe beobachtet wird (16), die ein RV in Enhancern tragen, die zu diesem Gewebe innerhalb eines 500-kb-Fensters des Ausreißergens annotiert sind. Nicht übereinstimmend sind als alle gewebespezifischen Enhancer-Regionen definiert, unabhängig von Ausreißergewebe.

Als nächstes bewerteten wir die Fähigkeit von Einzelgewebe-Ausreißern jeder Methode, RVs in der Nähe von Ausreißergenen zu priorisieren. Einzelgewebe aseOutliers waren bei nahegelegenen RVs am stärksten angereichert, gefolgt von sOutliers und dann eOutliers über alle Ausreißer-Cutoff-Schwellenwerte (Abb. 3B und Abb. S21 und S23A). Wir beobachteten auch eine Anreicherung von Varianten, die wahrscheinlich einen Nonsense-vermittelten Zerfall bei Einzelgewebe-eOutliers, aseOutliers und sOutliers auslösen (Abb. 3C und Abb. S23B). Darüber hinaus fanden wir, dass Einzelgewebe-sOutliers immer noch eine starke Anreicherung für RVs in der Spleißkonsensussequenz und im PPT zeigten (Abb. S24).

Abgesehen von seltenen SVs, die insbesondere bei vergleichbaren Schwellenwerten mit Multitissue-eOutliers angereichert wurden, zeigen Singletissue-eOutliers weitaus schwächere Anreicherungen im Vergleich zu Multitissue-Ausreißern für nahegelegene seltene SNVs und Indels über alle Schwellenwerte (Abb. S25). Um die Entdeckung gewebespezifischer Ausreißer zu verbessern, haben wir die Breite der verfügbaren Gewebedaten genutzt und beobachtete Korrelationsmuster zwischen Geweben verwendet, um Ausreißer zu erkennen, die von der erwarteten Kovarianz der Expression in einer Teilmenge von Geweben abweichen (16). Ein ähnlicher Ansatz wurde implementiert, um funktionelle RVs auf der Grundlage der Korrelation der Expression zwischen den Genen in einem einzelnen Gewebe zu identifizieren (5). Wir fanden heraus, dass mit diesem Ansatz identifizierte Ausreißer häufig durch Expressionsänderungen in einem oder wenigen Geweben im Vergleich zu Multitissue-eAusreißern basierend auf dem Median getrieben wurden Z Partituren (Abb. 3D). Die korrelativen gewebespezifischen Ausreißer wurden auch für nahe RVs in einem 10-kb-Fenster um das Gen herum angereichert (Abb. S26C). Diese Ausreißer wurden jedoch auch um RVs in Enhancern angereichert, die in den Geweben aktiv waren, die den Ausreißereffekt (Tabelle S2), bestimmt durch Einzelgewebe Z Score und innerhalb eines 500-kb-Fensters um das Gen herum (Fig. 3E). Bemerkenswerterweise wurden diese gewebespezifischen Ausreißer für seltene Variationen von Enhancern, die in anderen, nicht übereinstimmenden Geweben annotiert wurden, verringert.

Priorisierung von RVs durch Integration genomischer Annotationen mit verschiedenen persönlichen transkriptomischen Signalen

Um verschiedene Transkriptomsignale in eine Methode zur Priorisierung von RVs zu integrieren, haben wir Watershed entwickelt, ein unbeaufsichtigtes probabilistisches grafisches Modell, das Informationen aus genomischen Annotationen eines persönlichen Genoms (Tabelle S3) mit mehreren Signalen eines passenden persönlichen Transkriptoms integriert. Watershed bietet Scores, die für die persönliche Genominterpretation oder für die Katalogisierung potenziell bedeutsamer seltener Allele verwendet werden können, indem die spätere Wahrscheinlichkeit quantifiziert wird, dass eine Variante einen funktionellen Effekt auf jeden transkriptomischen Phänotyp hat, basierend auf der Gesamtgenomsequenzierung (WGS) und der RNA-Sequenzierung ( RNA-seq)-Signale (Fig. 4A). Das Watershed-Modell kann an jede verfügbare Sammlung molekularer Phänotypen angepasst werden, einschließlich verschiedener Assays, verschiedener Gewebe oder verschiedener abgeleiteter Signale. Darüber hinaus lernt Watershed automatisch Markov-Random-Field-(MRF)-Kantengewichte, die die Stärke der Beziehung zwischen den verschiedenen enthaltenen Geweben oder Phänotypen widerspiegeln, die es dem Modell zusammen ermöglichen, funktionale Effekte genau vorherzusagen.

(EIN) Grafische zusammenfassende Plattennotation für das Watershed-Modell, wenn es auf drei Median-Ausreißersignale angewendet wird (Ausdruck, ASE und Spleißen). (B) Symmetrische Heatmap, die erlernte Watershed-Kantenparameter (Gewichte) zwischen Paaren von Ausreißersignalen nach dem Training von Watershed auf drei Median-Ausreißersignalen zeigt. (C) Der Anteil der RVs mit einer Watershed-posterior-Wahrscheinlichkeit >0,9 (rechts) und einer GAM-Wahrscheinlichkeit größer als ein Schwellenwert, der so eingestellt ist, dass er der Anzahl der Watershed-Varianten für jedes Ausreißersignal (links) entspricht, die zu einem Ausreißer bei einem Median . führen P-Wertschwelle von 0,0027 über drei Ausreißersignale (Farben). Watershed- und GAM-Modelle wurden an ausgehaltenen Personenpaaren ausgewertet. (D) Precision-Recall-Kurven zum Vergleich der Leistung von Watershed, RIVER und GAM (Farben) unter Verwendung von gehaltenen Personenpaaren für drei mittlere Ausreißersignale. (E) Symmetrische Heatmap, die gelernte Gewebe-Watershed-Kantenparameter (Gewichte) zwischen Paaren von Gewebe-Ausreißersignalen zeigt, nachdem Gewebe-Watershed auf eOutliers über einzelne Gewebe hinweg trainiert wurde. Die Zuordnung von Gewebefarbe zu Gewebename ist in Abb. 1 zu finden. S21D. (F) Fläche unter Präzisions-Recall-Kurven [AUC(PR) ja-Achse] in einem einzigen Gewebe zwischen Gewebe-GAM, Gewebe-RIVER und Gewebe-Watershed (x-Achse) bei Anwendung auf Ausreißer über einzelne Gewebe in allen drei Ausreißersignalen (Farben). Präzisions-Recall-Kurven in jedem Gewebe wurden unter Verwendung von gehaltenen Individuenpaaren erzeugt.

Wir haben Watershed zuerst auf die GTEx v8-Daten angewendet, indem wir die drei hier untersuchten Ausreißersignale, Expression, ASE und Spleißen (Abb. 4A) verwendet haben (16), für die jeder zuerst aggregiert wurde, indem der Median über die Gewebe für das entsprechende Individuum genommen wurde. In Übereinstimmung mit bestehenden Beweisen für Ähnlichkeiten zwischen Ausreißersignalen (Abb. S9) waren die gelernten Watershed-Kantenparameter zwischen ASE und Ausdruck am stärksten, gefolgt von ASE und Spleißen, aber strikt positiv für alle Paare von Ausreißersignalen (dh jedes Ausreißersignal war informativ für alle anderen Signale Fig. 4B). Um unser Modell zu evaluieren, verwendeten wir zurückgehaltene Paare von Individuen, die den gleichen RV teilten, machten Watershed-Vorhersagen beim ersten Individuum und bewerteten diese Vorhersagen unter Verwendung des Ausreißerstatus des zweiten Individuums als Label (15, 16). Watershed übertrifft Methoden, die allein auf der Genomsequenz basieren [unser genomisches Annotationsmodell (GAM) und kombinierte annotationsabhängige Depletion (CADD)] Abb. 4C und Abb. S27] (38, 39). Wir verglichen auch die Leistung von Watershed mit RIVER [RNA-informierte Variantenwirkung auf die Regulation (15)], eine Vereinfachung des Watershed-Modells, bei dem jedes Ausreißersignal unabhängig behandelt wird. Wir fanden heraus, dass die explizite Modellierung der Beziehung zwischen verschiedenen molekularen Phänotypen einen Leistungsgewinn für Watershed lieferte (Abb. 4D, Abb. S28 und S29 und Tabelle S4) (16). Wir beobachteten, dass selbst die prädiktivsten genomischen Annotationen nur in 2,8, 7,9 bzw. 14,3% der Fälle zu eOutliers, aseOutliers und sOutliers führten (Abb. 1E und 4C). Die Integration transkriptomischer Signale mit genomischen Annotationen von Watershed (bei einem hinteren Schwellenwert von 0,9) erkannte jedoch SNVs, die zu eOutliers, aseOutliers und sOutliers mit einer größeren Häufigkeit von 11,1, 33,3 bzw. 71,4 % der Zeit führten (Abb. 4C und Abb. ). .S30).

Wir haben das Watershed-Framework weiter erweitert, um Varianten auf der Grundlage ihrer vorhergesagten gewebespezifischen Auswirkungen zu priorisieren. Wir trainierten drei „Tissue-Watershed“-Modelle (eines für Expression, ASE und Spleißen separat), in denen jedes Modell die Effekte in allen Geweben gemeinsam betrachtet, Informationen in der MRF teilt und schließlich 49 gewebespezifische Scores für . ausgibt jedes Wohnmobil (Abb. S29 und S31) (16). Wir beobachteten, dass die für jedes der drei Gewebe-Watershed-Modelle gelernten Parameter bekannten Mustern der Gewebeähnlichkeit ähnelten (Abb. 4E und Abb. S32) (18). Darüber hinaus übertraf das Gewebe-Watershed-Modell unter Verwendung von ausgehaltenen Individuen ein RIVER-Modell, bei dem jedes Gewebe völlig unabhängig behandelt wird (P = 2.00 × 10 −5 , P = 2,00 × 10 -5 , und P = 5.90 × 10 −3 for expression, ASE, and splicing, respectively one-sided binomial test Fig. 4F and figs. S33 and S34) and a collapsed RIVER model trained with single median outlier statistics (P = 0.0577, P = 0.251, and P = 0.00128 for expression, ASE, and spicing, respectively one-sided binomial test figs. S35 and 36). Critically, integrative models that incorporated transcriptomic signal and genomic annotations from a single tissue still outperformed methods based only on genome sequence annotations (Fig. 4F), supporting the benefit of collecting even a single RNA-seq sample to improve personal genome interpretation.

Replication and experimental validation of predicted RV transcriptome effects

We first assessed the replication of “candidate causal RVs” previously identified by the SardiNIA Project (6), using GTEx Watershed prioritization. Of five SardiNIA candidate causal RVs that were also present in a GTEx individual, four had high (>0.7) GTEx Watershed expression posterior probabilities (table S5). Next, we tested replication of GTEx RVs, prioritized by Watershed, in an independent cohort evaluating 97 whole-genome and matched transcriptome samples from the Amish Study of Major Affective Disorders (ASMAD) (40). We evaluated GTEx RVs also present in this cohort at any frequency, quantifying eOutlier, aseOutlier, and sOutlier signal in each ASMAD individual harboring one of the GTEx variants (16). For all three phenotypes, ASMAD individuals with variants having high (>0.8) Watershed posterior probability based on GTEx data had significantly more extreme outlier signals at nearby genes compared with individuals with variants having low (<0.01) GTEx Watershed posterior probability (expression: P = 2.729 × 10 −6 , ASE: P = 2.86 × 10 −3 , and splicing: P = 5.86 × 10 −13 Wilcoxon rank-sum test fig. S37). Every variant with a high GTEx Watershed splicing posterior probability (>0.8) resulted in an sOutlier (P ≤ 0.01) in the ASMAD cohort. Furthermore, ASMAD individuals with variants having high (>0.8) GTEx Watershed posterior probability had significantly larger outlier signals relative to equal size sets of variants prioritized by GAM (expression: P = 0.00129, ASE: P = 0.0287, and splicing: P = 0.00058 Wilcoxon rank-sum test fig. S37). Overall, RVs prioritized by Watershed using GTEx data displayed evidence of functional effects in ASMAD individuals.

We further applied both a massively parallel reporter assay (MPRA) and a CRISPR-Cas9 assay to assess the impact of Watershed-prioritized RVs. We experimentally tested the regulatory effects of 52 variants with moderate Watershed expression posterior (≥0.5) and 98 variants with low Watershed expression posterior (<0.5) using MPRA (16). We observed increased effect sizes for RVs with high Watershed expression posterior relative to variants with low expression posterior (P = 0.025 one-sided Wilcoxon rank-sum test fig. S38 and table S6). Next, we assessed the functional effects of 20 variants by editing them into inducible-Cas9 293T cell lines. These included 14 rare stop-gained variants and six non-eQTL common variants as negative controls. Of the 14 rare stop-gained variants, 13 had expression or ASE Watershed posterior >0.8, with the remaining variant [previously tested in (41)] having a posterior of 0.22. All control variants had Watershed posteriors <0.03. Of the 13 variants with a Watershed posterior >0.8, 12 showed a significant decrease in expression of the rare allele (P < 0.05, Bonferroni corrected fig. S39 and table S7) (16).

Aberrant expression informs RV trait associations

We found that each individual had a median of three eOutliers, aseOutliers, and sOutliers (median outlier P < 0.0027) with a nearby RV. When filtering by moderate Watershed posterior probability (>0.5) of affecting expression, ASE, or splicing, individuals had a median of 17 genes with RVs predicted to affect expression, 27 predicted to affect ASE, and nine predicted to affect splicing (Fig. 5A). From the set of outlier calls, we found multiple instances of RVs influencing well-known and well-studied genes, including APOE und FAAH (table S8). In particular, for APOE, which has been associated with numerous neurological diseases and psychiatric disorders (42), we found two aseOutlier individuals both carrying a rare, missense variant, rs563571689, with ASE Watershed posteriors >0.95, not previously reported. Zum FAAH, which has been linked to pain sensitivity in numerous contexts (43, 44), we found two eOutlier individuals with a rare 5′ untranslated region variant, rs200388505, with ASE and expression Watershed posteriors >0.9.

(EIN) Distribution of the number of outlier genes, outlier genes with a nearby RV, and genes with a high Watershed posterior variant per data type. We added one to all values so that individuals with 0 are included. (B) Distribution of effect sizes, transformed to a percentile, for the set of GTEx RVs that appear in UKBB and are not outlier variants, those that are outlier variants, and those outlier variants that fall in colocalizing genes for the matched trait across 34 traits. Percentiles were calculated on the set of rare GTEx variants that overlap UKBB. The set of genes was restricted to those with at least one outlier individual in any data type and a nearby variant included in the test set (4787 variants and 1323 genes). P values were calculated from a one-sided Wilcoxon rank-sum test. (C) Proportion of variants filtered by Watershed posterior that fell in the top 25% of effect sizes for a colocalized trait (red) and the proportion of randomly selected variants of an equal number that also fall in these regions over 1000 iterations (black). (D) Manhattan plot (top) across chromosome 9 for asthma in the UKBB, filtered for non–low-confidence variants, with two high-Watershed variants, rs149045797 and rs146597587, shown in pink and the lead colocalized variant, rs3939286, shown in blue. The variants’ effect size ranks were similarly high for both self-reported and diagnosed asthma, but the summary statistics are shown for asthma diagnosis here. The UKBB MAF versus absolute value of the effect size for all variants within 10 kb of the Watershed variant is also shown (bottom). (E) Manhattan plot across chromosome 22 for self-reported high cholesterol in the UKBB, filtered to remove low confidence variants, with the high-Watershed variant rs564796245 shown in pink. The UKBB MAF versus absolute value of the effect size for all variants within 10 kb of the Watershed variant is also shown (bottom).

To assess whether identified rare functional variants from GTEx associate with traits, we intersected this set with variants present in the UKBB (12). We focused on a subset of 34 traits for which GWAS association for a UKBB trait had evidence of colocalizations with eQTLs and/or alternative splicing QTLs (sQTLs) in any tissue (table S9) (16, 45). GTEx has demonstrated that genes with RV associations for a trait are strongly enriched for their eQTLs colocalizing with GWAS signals for the same trait (18), indicating that QTL evidence can be used to guide RV analysis. Furthermore, RVs near GTEx outliers had larger trait association effect sizes than background RVs near the same set of genes in the UKBB data (P = 3.51 × 10 −9 one-sided Wilcoxon rank-sum test), with a shift in median effect size percentile from 46 to 53%. Notably, outlier variants that fell in or nearby genes with an eQTL or sQTL colocalization had even larger effect sizes (median effect size percentile 88%) than nonoutlier variants (P = 1.93 × 10 −5 one-sided Wilcoxon rank-sum test) or outlier variants falling near any gene not matched to a colocalizing trait (P = 4.88 × 10 −5 one-sided Wilcoxon rank-sum test Fig. 5B).

Although most variants tested in UKBB had low Watershed posterior probabilities of affecting the transcriptome (fig. S40A), we hypothesized that filtering for those variants that do have high posteriors would yield variants in the upper end of the effect size distribution for a given trait. For each variant tested in UKBB, we took the maximum Watershed posterior per variant and compared this with a genomic annotation-defined metric, CADD (38, 39). We found that Watershed posteriors were a better predictor of variant effect size than CADD scores for the same set of RVs in a linear model (Table 1). Across different Watershed posterior thresholds, we found that the proportion of variants falling in the top 25% of RV effect sizes in colocalized regions exceeded the proportion expected by chance (Fig. 5C). Whereas filtering by CADD score did return some high effect size variants, this proportion declined at the highest thresholds (fig. S40D). Furthermore, there was very little overlap between variants with high Watershed posteriors and high CADD variants (fig. S40D), with CADD variants more likely to occur in coding regions and Watershed variants more frequent in noncoding regions (fig. S40D). Thus, the approaches largely identified distinct and complementary sets of variants for these traits.

Shown are the coefficient estimates and 95% confidence intervals from separate linear models with variant effect size percentile as the response and CADD score or Watershed posterior (scaled to have a mean of 0 and an SD of 1 so that values are of comparable range) as the predictor for all tested variants in colocalized regions (n = 5277).

We identified 33 rare GTEx variant trait combinations in which the variant had a Watershed posterior >0.5 and fell in the top 25% of variants by effect size for the given trait (table S10). We highlight two such examples, for asthma and high cholesterol (Fig. 5, D and E), showing that although RVs usually do not have the frequency to obtain genome-wide significant P values, when they are prioritized by the probability of affecting expression, we could identify those with greater estimated effect sizes on the trait (table S11). In the case of asthma, the RV effect sizes in UKBB were three times greater than the lead colocalized variant. These variants included rs146597587, which is a high-confidence loss-of-function splice acceptor with an overall gnomAD AF of 0.0019, and rs149045797, an intronic variant with a frequency of 0.0019, both of which were associated with the gene IL33, the expression of which has been implicated in asthma (46, 47). Previous work has identified the protective association between rs146597587 and asthma (48, 49), and we found that this is potentially mediated by outlier allelic expression of IL33 leading to moderate decreases in total expression, with median Z scores ranging from –1.08 to –1.77 in individuals with the variant, and median single-tissue Z scores across the six individuals exceeding –2 in 10 tissues. An asthma association had also been reported recently for the other high Watershed asthma-associated variant rs149045797 and was in perfect linkage disequilibrium with rs146597587 (50). An additional high Watershed variant, rs564796245, an intronic variant in TTC38 with a gnomAD AF of 0.0003, had a high effect size for self-reported high cholesterol in the UKBB but was not previously reported. We were able to test this variant against four related blood lipids traits in the MVP (51). We found that for these traits, which included high-density lipoprotein (HDL), low-density lipoprotein, total cholesterol, and triglycerides, among rare (gnomAD AF <0.1%) variants within a 250-kb window of rs564796245, this variant was in the top 5% of variants by effect size for HDL specifically, it was in the top 1% (fig. S41). We also assessed this variant’s association with the same four traits in the JHS (14), an African American cohort in which four individuals carried the RV. Here, we found that the direction of effect was consistent with MVP and UKBB for all four traits (tables S11 and S12), and the variant fell in the top 28th to 38th percentile of all rare (gnomAD AF <0.1%) variants in this region (fig. S42). Only four of the variants tested in UKBB had Watershed posterior probabilities >0.9 for colocalized genes, but of those, three showed high effect sizes for a relevant trait (table S10).


What do the new ‘gay genes’ tell us about sexual orientation?

Didn’t we already know there were “gay genes”?
We have known for decades that sexual orientation is partly heritable in men, thanks to studies of families in which some people are straight and some people are gay. In 1993, genetic variations in a region on the X chromosome in men were linked to whether they were heterosexual or homosexual, and in 1995, a region on chromosome 8 was identified. Both findings were confirmed in a study of gay and straight brothers in 2014. However, these studies didn’t home in on any specific genes on this chromosome.

What’s new about the latest study?
For the first time, individual genes have been identified that may influence how sexual orientation develops in boys and men, both in the womb and during life. Alan Sanders at North Shore University, Illinois, and his team pinpointed these genes by comparing DNA from 1077 gay and 1231 straight men. They scanned the men’s entire genomes, looking for single-letter differences in their DNA sequences. This enabled them to home in on two genes whose variants seem to be linked to sexual orientation.

What genes did they find and what do they do?
One of the genes, which sits on chromosome 13, is active in a part of the brain called the diencephalon. Interestingly, this brain region contains the hypothalamus, which was identified in 1991 as differing in size between gay and straight men. This was discovered by neuroscientist Simon LeVay, who says he is excited that the gene discovery seems to fit with what he found.

Werbung

Other research has found that this gene, called SLITRK6, is active in the hypothalamus of male mice fetuses a few days before they are born. “This is thought to be a crucial time for sexual differentiation in this part of the brain,” says LeVay. “So this particular finding is a potential link between the neuroanatomy and molecular genetics of sexual orientation.

What is the other gene?
This gene is found on chromosome 14 and is mainly active in the thyroid, but also the brain. Namens TSHR, it makes a type of receptor protein that recognises and binds to a hormone that stimulates the thyroid. In this way, the gene plays an important role in controlling thyroid function.

Die Tatsache, dass TSHR seems to be involved in sexual orientation fits with evidence that thyroid function seems to be linked to sexuality. Zum Beispiel, TSHR function is disrupted in a genetic condition called Grave’s disease, which causes the thyroid gland to become over-active, accelerating metabolism and leading to weight-loss. Grave’s disease is more common in gay than straight men, and some research suggests that gay men tend to be thinner – which might possibly be a result of thyroid overdrive.

Are all men who have the “gay” variants of these genes gay?
No, says Sanders, because many other factors play a role, including the environment. “There are probably multiple genes involved, each with a fairly low effect,” he says. “There will be men who have the form of gene that increases the chance of being gay, but they won’t be gay.”

Because many genes and other factors seem likely to play a role in sexual orientation, this may explain why some people are bisexual or see sexual orientation as a spectrum.

What about women who are gay? Are there “lesbian genes”?
Our biological understanding of homosexuality in women lags behind. Some researchers say this is partly because women who have sex with women tend to be more fluid in their sexual orientation.

There have been studies suggesting that there is a genetic element to homosexuality in women, but more research has been done in men, says Sanders.

Why should we care about the genetics of being gay?
The latest findings open the prospect to identifying the whole pathway of genes involved in both homosexual and heterosexual orientation, says Dean Hamer at the US National Institutes of Health, who led the study that pinpointed chromosome X back in 1993. “It adds yet more evidence that sexual orientation is not a ‘lifestyle choice’. But the real significance is that it takes us one step closer to understanding the origins of one of the most fascinating and important features of human beings.”

Journal reference: Nature Scientific Reports, DOI: 10.1038/s41598-017-15736-4


Verweise

Edwards Stacey L, Beesley J, French Juliet D, Dunning Alison M. Beyond GWASs: illuminating the dark road from association to function. Am J Hum Genet. 201393(5):779–97.

Cavalli M, Pan G, Nord H, et al. Allele-specific transcription factor binding to common and rare variants associated with disease and gene expression. Hum Genet. 2016135:485–97.

MacArthur J, Bowler E, Cerezo M, et al. The new NHGRI-EBI catalog of published genome-wide association studies (GWAS catalog). Nukleinsäuren Res. 201745(D1):D896–901.

The ENCODE Project C. An integrated encyclopedia of DNA elements in the human genome. Natur. 2012489(7414):57–74.

Maurano MT, Humbert R, Rynes E, et al. Systematic localization of common disease-associated variation in regulatory DNA. Wissenschaft. 2012337(6099):1190–5.

Younesy H, Möller T, Heravi-Moussavi A, et al. ALEA: a toolbox for allele-specific epigenomics analysis. Bioinformatik. 201430(8):1172–4.

Yang XD, Xiang DX, Yang YY. Role of E3 ubiquitin ligases in insulin resistance. Diabetes Obes Metab. 201618(8):747–54.

Marfella R, D’Amico M, Di Filippo C, et al. The possible role of the ubiquitin proteasome system in the development of atherosclerosis in diabetes. Cardiovasc Diabetol. 20076:35.

Magee N, Zhang Y. Role of early growth response 1 in liver metabolism and liver cancer. Hepatoma Res. 20173(11):268.

Gokey NG, Lopez-Anido C, Gillian-Daniel AL, Svaren J. Early growth response 1 (Egr1) regulates cholesterol biosynthetic gene expression. J. Biol.Chem. 2011286(34):29501–10.

Shen N, Yu X, Pan F-Y, Gao X, Xue B, Li C-J. An early response transcription factor, Egr-1, enhances insulin resistance in type 2 diabetes with chronic hyperinsulinism. J. Biol.Chem. 2011286(16):14508–15.

Wang F, Kuang Y, Salem N, Anderson PW, Lee Z. Cross-species hybridization of woodchuck hepatitis viral infection-induced woodchuck hepatocellular carcinoma using human, rat and mouse oligonucleotide microarrays. J Gastroenterol Hepatol. 200924(4):605–17.

Pollak NM, Hoffman M, Goldberg IJ, Drosatos K. Krüppel-like factors: crippling and uncrippling metabolic pathways. JACC. 20183(1):132–56.

Kumadaki S, Karasawa T, Matsuzaka T, et al. Inhibition of ubiquitin ligase F-box and WD repeat domain-containing 7α (Fbw7α) causes hepatosteatosis through Krüppel-like factor 5 (KLF5)/peroxisome proliferator-activated receptor γ2 (PPARγ2) pathway but not SREBP-1c protein in mice. J. Biol.Chem. 2011286(47):40835–46.

Bernon C, Carré Y, Kuokkanen E, et al. Overexpression of Man2C1 leads to protein underglycosylation and upregulation of endoplasmic reticulum-associated degradation pathway. Glycobiology. 201121(3):363–75.

Andersson R, Gebhard C, Miguel-Escalada I, et al. An atlas of active enhancers across human cell types and tissues. Natur. 2014507:455.

Hynds RE, Vladimirou E, Janes SM. The secret lives of cancer cell lines. Dis Model Mech. 201811(11):dmm037366.

Brodt P. Role of the microenvironment in liver metastasis: from pre- to prometastatic niches. Clin Cancer Res. 201622(24):5971.

McGranahan N, Rosenthal R, Hiley CT, et al. Allele-specific HLA loss and immune escape in lung cancer evolution. Zelle. 2017171(6):1259–71 e11.

Kassel R, Cruise MW, Iezzoni JC, Taylor NA, Pruett TL, Hahn YS. Chronically inflamed livers up-regulate expression of inhibitory B7 family members. Hepatologie. 200950(5):1625–37.

Amiot L, Vu N, Samson M. Biology of the immunomodulatory molecule HLA-G in human liver diseases. J Hepatol. 201562(6):1430–7.

Kundaje A. A comprehensive collection of signal artifact blacklist regions in the human genome. 2013. ENCODE [hg19-blacklist-READMEdoc - EBI] Available online at: https://sites.google.com/site/anshulkundaje/projects/blacklists.

Boyle AP, Hong EL, Hariharan M, et al. Annotation of functional variation in personal genomes using RegulomeDB. Genom-Res. 201222(9):1790–7.

Ernst J, Kellis M. ChromHMM: automating chromatin state discovery and characterization. Nat-Methoden. 20129(3):215–6.


The Gene for Big Brains

Scientists, led by Max Planck Institute’s Wieland Huttner, have identified a gene that triggers a human embryo to grow the vast supply of brain cells that largely forms the foundation for our braininess.1 The same gene is found in modern humans, Neanderthals, and Denisovans. Called ARHGAP11B, Huttner says this is “the first human-specific gene where we could show that it contributes to the pool of basal brain stem cells and can trigger a folding of the neocortex. In that way, we managed to take the next step in tracing evolution.”2

Searching for the link between this human gene and the genes of our supposed ape cousins, Marta Florio and colleagues on a team led by Huttner report in Wissenschaftliche Fortschritte that the nucleotide sequence in human-specific ARHGAP11B differs from a similar gene in apes by just one nucleotide.3 A nucleotide is the equivalent of a letter in the genetic language. That difference in spelling might well be the genetic basis for one of the greatest physical differences between apes and humans.

Florio’s team genetically engineered a form of ARHGAP11B with a spelling error. They believe this misspelled human gene is the ancestral form of ARHGAP11B because it is spelled like a similar gene in the chimpanzee, which they firmly believe to be the human’s cousin. When tested on mouse embryos,4 this “ancestral” gene was unable to trigger proliferation of basal progenitor cells. (Basal progenitor cells are the cells that differentiate into neurons as embryonic development continues.) This simple spelling error nips any big-brained potential in the bud. Therefore, Florio’s team concludes that the ability of the human ARHGAP11B gene to stimulate stem cell production in a human embryo’s brain evolved “from a change that is tiny on a genomic scale but substantial in its functional and evolutionary consequences.”5


Keep this in mind

Gene sequencing is already contributing to the development of better, more targeted, and potentially safer medicines. Its use to inform treatment decisions, reduce the use of less effective treatments, and possibly reduce the risk of relapse or provide functional cures is revolutionary.

In the future, we may see more blurring of the lines separating gene-sequencing system manufacturers like Illumina, drug developers like Novartis, and genetic services companies like Guardant. We're already seeing collaborations that cut across these individual market segments, such as Grail, a company spun out of Illumina that's using gene sequencing to develop next-generation cancer tests that could catch disease at its earliest stage. Since these companies may wind up competing more aggressively with one another in the future, investors will want to keep close tabs on this market.


Considering interactions between genes, environments, biology, and social context

Kristen Jacobson received her Ph.D. in Human Development and Family Studies from the Pennsylvania State University in 1999. She spent a year as a postdoctoral scholar in psychiatric genetics under the direction of Dr. Kenneth Kendler at the Virginia Institute for Psychiatric and Behavioral Genetics, where she later served as faculty from 2000-2005. Dr. Jacobson is currently an Assistant Professor of Psychiatry at the University of Chicago, and serves as the Associate Director for Twin Projects and the Associate Director of the Clinical Neuroscience and Psychopharmacology Research Unit. Dr. Jacobson is a collaborator on a number of twin studies of children, adolescents, and adults, and is currently conducting a multidisciplinary, multi-level study of adolescent development, From Neighborhoods to Neurons and Beyond, funded by an NIH New Innovator Award . She is editor of a special issue of Behavior Genetics entitled Pathways between Genes, Brain, and Behavior (expected publication January, 2010). New areas of research involve pilot studies of epigenetics in both mice and humans.

Bronfenbrenner’s bioecological model (Bronfenbrenner & Ceci, 1994) highlights the need to consider interactions between individual, family, peer, school, and community characteristics in understanding individual differences in human development. In order to obtain a complete understanding of the processes involved in individual differences, multidisciplinary studies that measure risk and protective factors at multiple levels of analysis are required. With recent advances in human molecular genetics, the need to integrate environmental measures into genomic studies is of even greater importance. While the mapping of the human genome and the corresponding availability of genome-wide association analysis (GWAS) techniques has led to a flurry of research activity trying to discover “genes for” particular disorders and traits, a significant body of research, both historic as well as quite recent, cautions that efforts to uncover specific genetic variants that ignore the effects of social and contextual environments in genetic studies of individual differences in human behavior and traits may be futile. This essay briefly reviews some of the most interesting work regarding the interplay of genes and environments on individual differences in human development.

Natur gegen Nurture

For years, behavioral genetic studies using twin or adoptive samples have been considered the gold standard for assessing the joint effects of nature and nurture in accounting for individual differences in human behaviors and traits. Decades of behavioral genetic research have demonstrated the importance of genetically-influenced characteristics on individual differences in child, adolescent, and adult behaviors and traits. At the same time, behavioral genetic studies have revealed that generally over half of the variation in individual behaviors and traits is due to environmental factors, typically environmental factors that are unique across people within the same family or that have different effects on behavior (i.e., nonshared environmental influence).

Genetic influence has been found on “environmental” measures, suggesting the presence of gene à environment correlations. Gene à environment correlations arise because exposure to certain risk and protective environments is not random, but rather is influenced by inherited characteristics of the individual, and also because children “inherit” both genes and environments from their parents. The role of genes and environments in mediating pathways between risk and behavior is complex, however. For example, recent quasi-longitudinal work using twins to understand the relationship between peer group deviance and adolescent problem behavior found that while genetic factors accounted for most of the relationship between earlier problem behavior and later peer group deviance (consistent with genetic characteristics of an individual relating to peer selection), the relationship between prior peer group deviance and later problem behavior was largely environmentally mediated (consistent with peer influence effects (Kendler, Jacobson, Myers, & Eaves, 2008).

Natur und Nurture

While the nature versus nurture debate may have attenuated in recent years with consensus from many fields regarding the importance of both genes and environments, other areas of research have further identified interactions between nature and nurture as important components of individual differences. A host of adoption studies in the 1980s and 1990s have shown that genetic liability to antisocial behavior (as indexed through biological parent psychopathology and substance abuse) is only associated with the development of adult criminality and aggression under adverse adoptive environmental conditions, indicating that neither nature nor nurture was sufficient in and of itself to cause pathology (Cadoret, Yates, Troughton, Woodworth, & Stewart, 1995 Cloninger & Gottesman, 1987).

Alternatively, gene X environment (gXe) interactions may be implicated when the relative importance of genetic influence on behaviors and traits as measured through standard twin designs varies across social and ecological context. For example, a study by Rowe, Almeida, and Jacobson (1999) integrated genetically-informative regression models within a hierarchical linear modeling design to show that levels of parental warmth, measured at the aggregate school level, moderated the heritability (i.e., proportion of individual differences due to genetic factors) of adolescent aggression. Heritabilities of delinquent behavior are increased among adolescents living in families with high rates of dysfunction (Button, Scourfield, Martin, Purcell, & McGuffin, 2005), while the heritability of adolescent smoking decreases with higher levels of parental monitoring (Dick et al., 2007). Family and personal religiosity has been shown to decrease the importance of genetic variance on adolescent substance use behaviors (Koopmans, Slutske, Heath, Neale, & Boomsma, 1999 Timberlake et al., 2006), and urban-rural differences in the heritability of adolescent alcohol use were found to be mediated by contextual factors such as alcohol sales and neighborhood migration (Dick, Rose, Viken, Kapiro, & Koskenvuo, 2001). These latter areas of research may be of particular importance in generalizing results from prior twin studies to minority individuals or individuals in socially and economically disadvantaged environments, as most large-scale twin registries are based on primarily middle-class, Caucasian or Asian samples.

More recently, attention has turned to using measured genotypes and measured environments to investigate ”classic” gXe interactions for a number of important behaviors. Caspi et al.(2002) have elucidated an important and highly replicated (Kim-Cohen et al., 2006) gXe interaction using measured genotype (MAO-A gene) and environmental risk (child abuse) variables, demonstrating that the relationship between child maltreatment and various indices of aggressive and antisocial behavior is attenuated among individuals with the high MAO-A activity genotype.

Another highly replicated interaction has been found between a serotonin transporter gene (5-HTTPLR) and stressful life events in predicting depression (Canli & Lesch, 2007). Further studies have found interactions between the 5-HTTPLR genotype and socioeconomic status (SES) for aggression in preadolescents (Nobile et al., 2007), between the 5-HTTPLR genotype and lab-induced stress for lab measures of aggression in adult males (Verona, Joiner, Johnson, & Bender, 2006) and between life stress and the 5-HTTPLR genotype for individual differences in amygdala activation (Canli et al., 2006). There is also emerging evidence for environmental modification of dopaminergic genes related to impulsivity and aggression, with studies finding significant interactions among the DRD4-7 repeat polymorphism and caregiver quality in predicting higher levels of aggression and impulsive traits in infants and preschoolers (Bakermans-Kranenburg & van Ijzendoorn, 2006 Sheese, Voelker, Rothbart, & Posner, 2007), and interactions between SES and the DRD4 gene for aggression in pre-adolescents (Nobile et al., 2007). Thus, genes implicated in multiple neurotransmitter pathways work in conjunction with a host of social and environmental experiences to alter individual differences across multiple behaviors and traits.

Additional Gene-Environment Interplay

While the above section concerns statistical interactions between genes and environments which may represent genetic sensitivity to environmental stressors, or, alternatively, environmental exacerbation of genetic effects, another potentially important avenue for research concerns the dynamic interplay between genes and environments, that is, genetic influence on Umgebungen and environmental influences on genes. By now, it is fairly common knowledge that when measures of family environment are treated as ‘phenotypes’ in traditional behavioral genetic models, significant genetic influences on these measures are often detected (Plomin & Bergeman, 1991). Decades of behavioral genetic studies have provided considerable evidence for significant genetic influence for measures such as various dimensions of parenting, indices of SES such as income and educational level, social support, and stressful life events (see Kendler & Baker [2007] for a recent review). What has been slower to develop, however, is the notion that environmental influences and experiences can have profound effects on genetic influence. While the underlying DNA structure and sequence individuals are born with does not change over time, a newer area of research in epigenetics is beginning to identify factors that may alter gene expression and function across the lifespan.

Epigenetics, defined formally as changes in gene expression caused by mechanisms other than changes in the underlying DNA sequence, offers an exciting new frontier in the study of human psychiatric and medical diseases, and psychological behaviors and traits. Epigenetic mechanisms include DNA methylation and chromatin remodeling, the latter via post-translational modifications (e.g. methylation, acetylation, phosphorylation and ubiquitylation) to histone proteins which form the scaffold for the DNA helix. Although some epigenetic processes are essential to organism function (e.g., differentiation of cells in the developing embryo during morphogenesis), other epigenetic processes can have major adverse effects on health and behavioral outcomes. While some epigenetic changes only occur within the course of one individual organism's lifetime, animal models suggest that other epigenetic changes can be inherited from one generation to the next (see Champagne [2008] for a review), contributing, in part, to the heritability of behavioral traits and psychiatric disease.

However, a growing field of research suggests that environmental experiences, particularly those related to stress, have the capacity to alter biological and genetic mechanisms associated with increased risk of problem behavior. Again, the notion that environmental experience can change biological processes has important historical precedence. Harlow’s seminal deprivation studies of non-human primates have shown that disruptions in early rearing environments have the capacity to disrupt psychobiological regulatory functions, leading to behavioral changes. Other important animal research has begun to identify the precise mechanisms by which social environmental factors can alter epigenetic programming. Relatively recent research using animal models offers an elegant demonstration of how early environmental stressors can alter neurobiological responsivity to future stressful conditioning (Meaney, 2001). Meaney’s model highlights how individual differences in maternal behaviors can cause regulatory changes in the corticotropin releasing hormone (CRH) system at the level of the central nucleus of the amygdala, and how these changes relate further to changes in adrenocortical and autonomic effects of later stressful events. Importantly, his work suggests that these effects can be altered through intervention (Weaver et al., 2005). Differences in early maternal care have also been associated with differences in methylation of the glucocorticoid receptor gene promoter in the hippocampus (Meaney & Szyf, 2005). Most critically, a recent comparison of post-mortem brain tissue from a sample of patients with a history of child abuse and/or neglect and who died by suicide indicated DNA hypermethylation of the rRNA promoter region in the hippocampus relative to controls who experienced sudden, accidental death (McGowan et al., 2008), supporting the hypothesis that epigenetic changes due to social and environmental experiences are related to behavioral traits.

Other studies of monozygotic twins have identified variations in DNA methylation levels in certain target gene promoter regions. Because identical twins share identical genomes and experience many of the same family environmental factors, this indicates that environmental experiences that are not shared among children in the same family have an important causal role in gene expression, and may further be related to behavioral differences among identical twin pairs. Importantly, within-pair differences in DNA methylation and histone acetylation patterns were increased in older twin pairs, especially those who had different lifestyles and had spent fewer years of their lives together, strongly supporting epigenetic processes as a part of nonshared environmental influence on individual differences (Fraga et al., 2005). This suggests that epigenetic processes represent a fundamental gene-environment interface in the development and ongoing plasticity of the human brain.

Schlussfolgerungen

While there is no doubt that genetic studies of individual behaviors and traits will increase our understanding of both normal human variation and pathological disorders, there is increasing recognition that the interplay between genes and environments is remarkably complex. Not only are both genes and environments important for both normal and abnormal human development, but genes and environments operate interactively to produce both risk and resilience to specific behavioral and psychiatric disorders. More importantly, emerging lines of research from epigenetics suggest that not only can nature alter nurture, but nurture, in turn, has the power to modify nature. Thus, genomic studies that incorporate a range of social and environmental influences will further our understanding of the complex dance between nature and nurture in human development.

Bakermans-Kranenburg, M. J., & van Ijzendoorn, M. H. (2006). Gene-environment interaction of the dopamine d4 receptor (drd4) and observed maternal insensitivity predicting externalizing behavior in preschoolers. Dev Psychobiol, 48(5), 406-409.

Bronfenbrenner, U., & Ceci, S. J. (1994). Nature-nurture reconceptualized in developmental perspective: A bioecological model. Psychol Rev, 101(4), 568-586.

Button, T. M., Scourfield, J., Martin, N., Purcell, S., & McGuffin, P. (2005). Family dysfunction interacts with genes in the causation of antisocial symptoms. Behav Genet, 35(2), 115-120.

Cadoret, R. J., Yates, W. R., Troughton, E., Woodworth, G., & Stewart, M. A. (1995). Genetic-environmental interaction in the genesis of aggressivity and conduct disorders. Arch Gen Psychiatry, 52(11), 916-924.

Canli, T., & Lesch, K.-P. (2007). Long story short: The serotonin transporter in emotion regulation and social cognition. Nat Neurosci, 10(9), 1103.

Canli, T., Q. M., Omura, K., Congdon, E., Haas, B.W., Amin, Z., Herrmann, M.J., et al. (2006). Neural correlates of epigenesis. Proc Natl Acad Sci, 103, 16033-16038.

Caspi, A., McClay, J., Moffitt, T. E., Mill, J., Martin, J., Craig, I. W., et al. (2002). Role of genotype in the cycle of violence in maltreated children. Wissenschaft, 297(5582), 851-854.

Champagne, F. A. (2008). Epigenetic mechanisms and the transgenerational effects of maternal care. Front Neuroendocrinol, 29(3), 386-397.

Cloninger, C. R., & Gottesman, I. (1987). Genetic and environmental factors in antisocial behavior disorder. In S. A. Mednick, T. E. Moffitt & S. A. Stack (Eds.), The causes of crime: New biological approaches (pp. 99-102). Cambridge: Cambridge University Press.

Dick, D. M., Rose, R. J., Viken, R. J., Kaprio, J., & Koskenvuo, M. (2001). Exploring gene-environment interactions: Socioregional moderation of alcohol use. J Abnorm Psychol, 110(4), 625-632.

Dick, D. M., Viken, R., Purcell, S., Kaprio, J., Pulkkinen, L., & Rose, R. J. (2007). Parental monitoring moderates the importance of genetic and environmental influences on adolescent smoking. J Abnorm Psychol, 116(1), 213-218.

Fraga, M. F., Ballestar, E., Paz, M. F., Ropero, S., Setien, F., Ballestar, M. L., et al. (2005). Epigenetic differences arise during the lifetime of monozygotic twins. Proc Natl Acad Sci U S A, 102(30), 10604-10609.

Kendler, K. S., & Baker, J. H. (2007). Genetic influences on measures of the environment: A systematic review. Psychol Med, 37(5), 615-626.

Kendler, K. S., Jacobson, K., Myers, J. M., & Eaves, L. J. (2008). A genetically informative developmental study of the relationship between conduct disorder and peer deviance in males. Psychol Med, 38(7), 1001-1011.

Kim-Cohen, J., Caspi, A., Taylor, A., Williams, B., Newcombe, R., Craig, I. W., et al. (2006). MAOA, maltreatment, and gene-environment interaction predicting children's mental health: New evidence and a meta-analysis. Mol Psychiatry, 11(10), 903-913.

Koopmans, J. R., Slutske, W. S., Heath, A. C., Neale, M. C., & Boomsma, D. I. (1999). The genetics of smoking initiation and quantity smoked in dutch adolescent and young adult twins. Behav Genet, 29(6), 383-393.

McGowan, P. O., Sasaki, A., Huang, T. C., Unterberger, A., Suderman, M., Ernst, C., et al. (2008). Promoter-wide hypermethylation of the ribosomal rna gene promoter in the suicide brain. Plus eins, 3(5), e2085.

Meaney, M. J. (2001). Maternal care, gene expression, and the transmission of individual differences in stress reactivity across generations. Annu Rev Neurosci, 24, 1161-1192.

Meaney, M. J., & Szyf, M. (2005). Maternal care as a model for experience-dependent chromatin plasticity? Trends Neurosci, 28(9), 456-463.

Nobile, M., Giorda, R., Marino, C., Carlet, O., Pastore, V., Vanzin, L., et al. (2007). Socioeconomic status mediates the genetic contribution of the dopamine receptor d4 and serotonin transporter linked promoter region polymorphisms to externalization in preadolescence. Development and Psychopathology, 19(4), 1147-1160.

Plomin, R., & Bergeman, C. S. (1991). The nature of nurture: Genetic influence on "environmental" measures. Behavioral & Brain Sciences, 14, 373-427.

Rowe, D. C., Almeida, D. M., & Jacobson, K. C. (1999). School context and genetic influences on aggression in adolesceence. Psychological Science, 10, 277-280.

Sheese, B., Voelker, P., Rothbart, M., & Posner, M. (2007). Parenting quality interacts with genetic variation in dopamine receptor d4 to influence temperament in early childhood. Developmental Psychopathology, 19, 1039-1046.

Timberlake, D. S., Rhee, S. H., Haberstick, B. C., Hopfer, C., Ehringer, M., Lessem, J. M., et al. (2006). The moderating effects of religiosity on the genetic and environmental determinants of smoking initiation. Nicotine Tob Res, 8(1), 123-133.

Verona, E., Joiner, T. E., Johnson, F., & Bender, T. W. (2006). Gender specific gene-environment interactions on laboratory-assessed aggression. Biol Psychol, 71(1), 33-41.

Weaver, I. C., Champagne, F. A., Brown, S. E., Dymov, S., Sharma, S., Meaney, M. J., et al. (2005). Reversal of maternal programming of stress responses in adult offspring through methyl supplementation: Altering epigenetic marking later in life. J Neurosci, 25(47), 11045-11054.


Schau das Video: DNA Sequencing (Januar 2022).