Information

Warum haben Housekeeping-Gene keine TATA-Box-Regionen in ihren Promotorsequenzen?


Housekeeping-Gene sind Gene, die kontinuierlich transkribiert werden. Wie alle anderen Gene haben sie Promotorsequenzen, aber sie haben keine TATA-Box-Sequenzen, die verwendet werden, um anzugeben, von wo aus die Transkription beginnen wird.

Warum haben Housekeeping-Gene keine TATA-Box in ihren Promotorsequenzen?


Zwei mögliche Antworten:

Zunächst wurde festgestellt, dass TATA-Boxen ein erhöhtes "Rauschen" bei der Genexpression verursachen, so dass die Expression von Genen, die eine TATA-Box aufweisen, sehr variabel ist. Siehe zum Beispiel diese Rezension.

Eine andere Reihe von Ergebnissen legt (hier) nahe, dass TATA nur als Expressionsverstärker wirkt.

Unabhängig davon, ob TATA die Expression amplifiziert oder auch die Expressionsvarianz erhöht, ist dies nicht für Housekeeping-Gene geeignet, die in der Regel eine niedrige und konstante Expression aufweisen.


Das TATA-Box-Element (und der Begriff der Haushaltsgene) sind klassische Lehrbuchbeispiele für den Versuch, komplexe Biologie auf vereinfachte Weise zu erklären.

Tatsächlich haben die meisten Säugetiergene kein TATA-Box-Element und die meisten Transkriptionsstartstellen (TSSs) sind über einen größeren Bereich am 5'-Ende des Gens verteilt. Jedes TSS trägt zu Unterschieden in der Genexpressionsstärke und dem Genprodukt bei. Dieses Phänomen wurde ausführlich unter Verwendung der Cap-Analyse der Genexpression (CAGE) untersucht. Eine kurze Zusammenfassung der wichtigsten Ergebnisse finden Sie hier auf der Rikens-Website.

Sandelin und Carninci et al. haben hier einen ausgezeichneten Überblick über die Ergebnisse der ersten CAGE-Experimente geschrieben und wie dies den klassischen Lehrbuch-Promotorstrukturen der Natur widerspricht.

Darüber hinaus wurde die CAGE-Technologie verwendet, um zelltypspezifische Enhancer zu kartieren, die enorm zur korrekten Genregulation beitragen, Anderson et al. Natur.

Ich weiß, dass diese Antwort Ihre Frage nicht direkt anspricht, sondern viele neue Fragen aufwirft.


Schnell googeln Sie die Online-Version von Lodish et al Molekulare Zellbiologie. 4. Auflage.

Aus der TATA-Box fungieren Initiatoren und CpG-Inseln als Promotoren im eukaryotischen DNA-Abschnitt:

Diese Gene, die im Allgemeinen mit geringen Raten transkribiert werden (z. B. Gene, die für die Enzyme des Zwischenstoffwechsels kodieren, oft als „Haushaltsgene“ bezeichnet), enthalten keine TATA-Box oder einen Initiator

Auch aus transkriptionellen regulatorischen Sequenzen des Housekeeping-Gens für humane Triosephosphat-Isomerase (Boyer et al, J Bio Chem 1989):

Im Gegensatz zu fakultativen Genpromotoren zeichnen sich diese Promotoren durch […] und insbesondere das Fehlen einer entsprechend positionierten TATA-Box aus […] Aufgrund dieser strukturellen Unterschiede besteht die Möglichkeit, dass Die Initiierung des Housekeepings und der fakultativen Gentranskription erfolgt über unterschiedliche Mechanismen.

Ich kann mir vorstellen, dass Sie weitere Informationen googeln können, aber es scheint mir, dass der Grund für das Fehlen von TATA die Notwendigkeit einer konstanten Expression auf niedrigem Niveau (daher kein starker Promotor) und eines separaten Regulationsmechanismus (daher eine gemeinsame Struktur) ist. Der letzte Punkt könnte sich aus dem Redundanzargument ergeben: Wenn die Regulation von TATA-haltigen Genen fehlerhaft wird, bleibt die Regulation der Housekeeping-Gene gleich, weil sie etwas unabhängig ist.

Sie sollten sich jedoch bewusst sein, dass Ihre ursprüngliche Annahme zumindest umstritten ist (aus demselben J Bio Chem-Papier):

Im Gegensatz zu den meisten bisher beschriebenen Housekeeping-Genpromotoren trägt der humane TPI-Promotor ein kanonisches TATA-Element (5' TATATAA 3'), das die Positionen -27 bis -21 überspannt. Die LS-Mutagenese hat gezeigt, dass diese TATA-Box stellt eindeutig ein Bedienelement dar, dessen Integrität für die Aufrechterhaltung sowohl der Treue als auch der Häufigkeit der TPI-Gen-Transkriptionsinitiation wesentlich ist.


Die Verwendung eines Gens zur Herstellung eines Proteins nennt man Genexpression. Es umfasst die Synthese des Proteins durch die Prozesse der Transkription von DNA in mRNA und Translation von mRNA in ein Protein. Es kann auch die weitere Verarbeitung des Proteins nach der Synthese umfassen.

Die Genexpression wird reguliert, um sicherzustellen, dass die richtigen Proteine ​​hergestellt werden, wann und wo sie benötigt werden. Die Regulation kann zu jedem Zeitpunkt in der Expression eines Gens erfolgen, vom Beginn der Transkriptionsphase der Proteinsynthese bis zur Prozessierung eines Proteins nach der Synthese. Die Regulation der Transkription ist einer der kompliziertesten Teile der Genregulation in eukaryontischen Zellen und steht im Mittelpunkt dieses Konzepts.


Kanal 3-4

Die 5' > 3' Polymeraseaktivität von DNA Pol umfasst die folgende Ereignissequenz:

- Primer liefert den Anfangsstrang, der durch DNA-Poly verlängert werden kann. Primase stellt RNA-Primer her, keine DNA-Primer!

DNA Pol kann dNTPs entweder zu RNA-Primern oder DNA-Primern hinzufügen, aber Zellen verwenden immer und nur RNA-Primer, um die eigentliche DNA-Replikation zu beginnen.

- Helicase katalysiert das Aufwickeln von dsDNA in zwei separate Stränge. Helicase reist entlang der DNA und wickelt sie dabei ab.

Dies bedeutet, dass immer neue Mononukleotide am 3'-Ende der wachsenden Polynukleotidkette hinzugefügt werden.

DNA Pol a - bildet das Primosom mit Primase, um 8-12 nt RNA-Primer zu synthetisieren, gefolgt von den ersten 40 nts des Okazaki-Fragments während der Replikation im Replisom

DNA Pol d - Haupt-DNA-Pol für die Fertigstellung von Okazaki-Fragmenten (nachdem Primase den RNA-Primer festgelegt und DNA-Pol α die ersten 40 nts synthetisiert hat) im Replisom

Sorgt dafür, dass jeder neue Strang schnell beginnt

2. Viele RPA - um als SSBs zu fungieren, meist auf nachlaufenden Strängen

3. Ein Primase-DNA Pol a (Primosom) – um die Synthese des RNA-Primers zu katalysieren + 1. 40 nts für Okazaki-Fragmente des nachlaufenden Strangs

4. Ein DNA-Pol d – um die Synthese des Rests jedes nacheilenden Strangs zu katalysieren

5. Ein DNA Pol ε - um die Synthese jedes Leitstrangs zu katalysieren

6. Zwei PCNA - als Gleitklemmen für DNA Pol d und DNA Pol e

7. Ein RF-C - dient als Klemmlader für den nacheilenden DNA-Strang Pol d

Es wird angenommen, dass die T-Schleife an den Enden der linearen Chromosomen diese vor der Verdauung durch zelluläre Exonukleasen schützt.

Binden: DNA-Sequenzelemente, die als Transkriptionsfaktor-Stellen bezeichnet werden

Wo sie binden: in Promotorregionen

Wirkung: einige aktivieren die Transkription (erhöhen den Promotor-Escape), einige unterdrücken (verringern den Promotor-Escape)

Ihre Wirkung: meist direkter Kontakt mit basalen Transkriptionsfaktoren oder RNA-Polymerase

2. Aktivatoren
Binden: DNA-Sequenzelemente, die als Enhancer-Sites bezeichnet werden

Wo sie binden: entfernt vom Promotor, stromaufwärts oder stromabwärts

Wirkung: Promotor-Escape erhöhen und Transkription aktivieren

Ihre Wirkung: DNA zwischen Enhancer-Stelle und Promotor wird ausgeschleift, um den Aktivator mit der Transkriptionsmaschinerie in Kontakt zu bringen

3. Repressoren
Bindung: DNA-Sequenzelemente, sogenannte Silencer-Sites
Wo sie binden: entfernt vom Promotor, stromaufwärts oder stromabwärts
Wirkung: Promotor-Escape verringern und Transkription hemmen
Ihre Wirkung: DNA zwischen Silencer-Stelle und Promotor wird ausgeschleift, um den Repressor mit der Transkriptionsmaschinerie in Kontakt zu bringen

4. Koaktivatoren
Binden: binden nicht DNA-Sequenzelemente binden andere Transkriptionsregulatoren

Wo sie binden: überall dort, wo Transkriptionsfaktoren, Aktivatoren und Inhibitoren gebunden sind

Wirkung: dienen als Adaptermoleküle, um einige Aktivatoren und einige Repressoren mit der Transkriptionsmaschinerie zu verbinden, bewirken jedoch nicht selbst die Transkription


Einführung

100 bp-Sequenz, die die Transkriptionsstartstelle (TSS) eines Gens umgibt, die den Zusammenbau der Transkriptionsmaschinerie und die Pol II-Transkription erleichtert (Smale & Kadonaga, 2003, Haberle & Stark, 2018). Die Pol-II-Transkription kann gewebespezifisch durch Aktivierungssignale von Enhancer-Sequenzen stimuliert werden (Banerji et al, 1981 Spitz & Furlong, 2012 ), aber ein Core-Promotor kann in Abwesenheit eines Aktivierungssignals auch basale oder Hintergrundniveaus der Transkription erzeugen (Kim et al, 1994 Verrijzer & Tjian, 1996 Juven-Gershon et al, 2006). Idealerweise erzeugt ein Promotor im inaktiven Zustand nur eine minimale Hintergrundexpression, spricht stark auf Enhancer an und produziert zuverlässig das gewünschte Transkriptionsniveau im aktiven Zustand.

Ein zentrales Promotorelement, das die Pol II-Initiation stark fördert, ist die TATA-Box (Patikoglou et al, 1999 Reeve, 2003 ), ein uraltes Kernelement, das in Archaeen, Pilzen, Pflanzen und Tieren vorkommt (Patikoglou et al, 1999 Reeve, 2003). TATA wird vom TATA-bindenden Protein (TBP) gebunden und hilft beim Aufbau des Präinitiationskomplexes (Nikolov et al, 1992 Kim et al, 1993 Patikoglo et al, 1999). Nach Initiierung der Transkription kann Pol II dann 30–50 bp stromabwärts des TSS pausieren, bevor es in die produktive Elongation entlassen wird (Adelman & Lis, 2012).

Basierend auf der Arbeit in Drosophila, beeinflussen die Kernpromotorelemente nicht nur die Pol II-Initiation, sondern auch die Pol II-Pausierung. Promotoren mit sehr stabil pausiertem Pol II sind angereichert mit nachgeschalteten pausierenden Elementen wie dem Pause Button (PB) und dem Downstream Promoter Element (DPE) (Burke & Kadonaga, 1997 Lim et al, 2004 Hendrix et al, 2008 Gärtner et al, 2012 Shao & Zeitlinger, 2017). TATA-Promotoren zeigen oft minimale Pol II-Pausen, aber die Beweise sind widersprüchlich und basieren überwiegend auf kultivierten Zellen (Gilchrist et al, 2010 Chen et al, 2013 Shao & Zeitlinger, 2017 Krebs et al, 2017). Der Austausch von Kernpromotorelementen oder des gesamten Promotors ändert die Menge und Dauer der Pol II-Pausen Drosophila Embryonen und kultivierte Zellen (Lagha et al, 2013 Shao et al, 2019 ).

Die Menge von Pol II, die an einem Promotor pausiert, scheint die Expressionseigenschaften zu beeinflussen. Promotoren mit hoher Besetzung von pausiertem Pol II sind unter Genen, die während der Entwicklung stark reguliert werden (Muse et al, 2007 Zeitlinger et al, 2007 Gärtner et al, 2012 ) und vermitteln eine synchronere Genexpression zwischen Zellen (Boettiger & Levine, 2009 Lagha et al, 2013). Ohne eine rechtzeitige Genaktivierung können koordinierte zelluläre Verhaltensweisen wie die Gastrulation möglicherweise nicht richtig ablaufen (Lagha et al, 2013). TATA-Promotoren hingegen sind oft mit einer höheren Expressionsvariabilität verbunden (Raser & O'Shea, 2004 Blake et al, 2006 Tirosh et al, 2006 Lehner, 2010 Hornung et al, 2012 Li & Gilmour, 2013 Sigalova et al, 2020). Die Expressionseigenschaften von TATA-Promotoren in sich entwickelnden Embryonen sind jedoch weniger verstanden.

Bei Metazoen sind Gene mit TATA-Elementen besonders unter Effektorgenen angereichert, den Genen, die für die Struktur und Funktion von differenzierten Geweben verantwortlich sind (Schug et al, 2005 Carninci et al, 2006 FitzGerald et al, 2006 Engström et al, 2007 Lenhard et al, 2012 FANTOM-Konsortium et al, 2014). Effektorgene werden hauptsächlich in späteren Stadien der Embryogenese exprimiert, wenn Zellen beginnen, sich in morphologisch verschiedene Gewebe zu differenzieren (Erwin & Davidson, 2009). Diese Stadien sind typischerweise nicht gut untersucht, und daher ist nicht klar, ob TATA-Promotoren Effektorgenen unterschiedliche Expressionseigenschaften verleihen.

Hier haben wir systematisch die Beziehung zwischen Promotortypen und Genexpression in differenzierten Geweben der späten Drosophila Embryo, in dem sowohl TATA- als auch pausierte Promotoren aktiv sind. Wir kartierten die Genexpressionsprogramme aller Zelltypen mittels Einzelzell-RNA-seq (scRNA-seq) und bestimmten die Besetzung von Pol II gewebespezifisch. Unsere Analyse ergab große Unterschiede in der Pol II-Pausierung zwischen den Promotoren von Effektorgenen und zeigte, dass TATA-Promotoren unter den Effektorgenen mit minimaler Pol II-Pausierung stark angereichert sind. Bemerkenswerterweise zeigte scRNA-seq, dass TATA-Gene eine höhere Expressionsvariabilität, aber eine niedrigere Hintergrundexpression aufweisen als pausierte Promotoren und dass diese Eigenschaft mit einer geringeren Zugänglichkeit des Chromatins korreliert. Wir schlagen vor, dass verschiedene Promotortypen für unterschiedliche Expressionseigenschaften optimal sind und diskutieren die Mechanismen, durch die diese Unterschiede in der Promotorfunktion auftreten.


6.3 Suche nach einer Konsensussequenz

Abbildung 6.5: So suchen Sie nach einer Konsensussequenz: 1) Ändern Sie die Kurzes Spiel Beweisspur von verstecken zu Pack. 2) Klicke Aktualisierung. 3) Eine neue Beweisspur wird geöffnet. 4) Klicken Sie auf das graue Rechteck, um die Seite mit den Spureinstellungen zu öffnen. Siehe nun Abbildung unten.

Geben Sie schließlich eine beliebige Sequenz (d. h. ATG) in das Suchfenster (1) ein, das auf der Seite „Track Settings“ für Short Match (Abbildung 6.6) bereitgestellt wird, und klicken Sie dann auf „Submit“ (2).

Abbildung 6.6: 1) Geben Sie eine Konsensussequenz in das dafür vorgesehene Fenster ein. 2) Klicken Sie auf Senden.

In Abbildung 6.7 suchte ich nach dem Inr Konsensussequenz, BBCA(+1)BW, in der genomischen Region, die das menschliche Gen (CCT2) TSS umgibt. Jede Übereinstimmung wird in der Beweisleiste für kurze Übereinstimmungen als dicke schwarze Linie angezeigt. Die Position (d. h. 69 979 214) und Ausrichtung (- oder +) jeder Übereinstimmung wird links von jeder Zeile geschrieben. In diesem Beispiel ist der mutmaßliche 43 Inr derjenige, der mit einem roten Sternchen markiert ist. Was ist mein Beweis? Dies ist die einzige Inr-Konsensussequenz, die das vorhergesagte und experimentell definierte TSS an Position 69.979.236 umfasst. Es wird auch auf dem Plusstrang der genomischen DNA gefunden und CCT2 ist ein Plusstrang-Gen. Schließlich wird das „A“ der Konsensussequenz am vorhergesagten . positioniert und experimentell definiertes TSS (siehe roter Kreis in Abbildung 6.7).

Abbildung 6.7: Horizontale schwarze Balken innerhalb des „Short Match“-Evidenztracks beschreiben die Position jeder Konsensussequenz (BBCA(+1)BW), die in dieser genomischen Region gefunden wurde. Informationen über die genaue Nukleotidposition und -orientierung werden links bereitgestellt (siehe links eingerahmter Konsensus). Das mutmaßliche Inr für CCT2 ist mit einem roten Sternchen hervorgehoben. Diese Konsensussequenz befindet sich auf dem Plus-Strang (wie CCT2) und ist direkt unterhalb des experimentell definierten TSS bei 69 979 236 mit dem A an der mutmaßlichen +1-Position positioniert.


Jetzt schau, was passiert, wenn ich nach dem Entarteten suche Inr Konsensussequenz (YR). Dies ist eine extrem kurze Konsensussequenz, und es wird erwartet, dass so viele zufällig in jeder genomischen Region vorhanden sind. Alle von Short Match gefundenen Motive sind jedoch als + Strang gekennzeichnet. Sie sollten intuitiv wissen, dass dies unmöglich ist. Es MÜSSEN auch YR-Sequenzen auf dem unteren Strang sein. Tatsächlich ist Y (C/T) komplementär zu R (G/A). Wenn also eine YR-Sequenz auf dem Plus-Strang gefunden wird, wird eine YR-Sequenz immer finden Sie auf dem unteren Strang. Dies können Sie in Abbildung 6.8 selbst sehen. Denken Sie daran, den unteren Strang von rechts nach links zu lesen (5' bis 3'). Zum Beispiel ist ein CA-Dinukleotid im oberen Strang eine YR-Konsensussequenz, aber auch seine komplementäre Sequenz im unteren Strang: TG.

Abbildung 6.8: Ausgewählte YR-Konsensussequenzen, die durch den Short Match-Evidenztrack identifiziert wurden, sind rot umrandet. Denken Sie daran, Y = C oder T, während R = G oder A. Wenn Sie die Sequenz des oberen Strangs (von links nach rechts) lesen, können Sie bestätigen, dass es sich jeweils um eine YR-Konsensussequenz handelt. Wenn Sie die Sequenz (von rechts nach links) für genau dieselbe Position im Minusstrang lesen, sehen Sie, dass es sich ebenfalls um eine YR-Sequenz handelt. Warum bezeichnen sie alle YR Short Matches als Plus-Strang? Bequemlichkeit? Ich weiß nicht.

6.3.1 Testen Sie Ihr Verständnis

Für die folgenden Fragen beginnen Sie mit dem Sitzungslink „TSS-Seq“, zoomen Sie in die Region, die den BBS1-TSS enthält, und ändern Sie dann die Short Match-Beweisspur von „verstecken“ auf „packen“. Denken Sie daran, dass der Core-Promotor als die Region definiert ist, die das TSS plus 40 nt stromaufwärts und stromabwärts (insgesamt 80 nt) enthält.

  • Verwenden Sie den ShortMatch-Evidenztrack, um nach einer kanonischen TATA-Box-Konsensussequenz (TATAWAW) innerhalb der BBS1-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche auf dem Plus-Strang?
    Sind irgendwelche der Plusstrang-Motive ungefähr 30 nt stromaufwärts des vorhergesagten TSS positioniert, wie erwartet?
  • Verwenden Sie den Short Match-Evidenz-Track, um nach einer kanonischen Inr-Konsensussequenz (BBCABW) innerhalb der BBS1-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche auf dem Plus-Strang?
    Umspannen eines der Plusstrang-Motive die TSS wie erwartet?
  • Wenn KEINE BBCABW-Konsensussequenz gefunden wird, die das TSS von BBS1 überspannt, gibt es eine degenerierte Inr-Konsensussequenz (YR), die das TSS wie erwartet überspannt?
  • Verwenden Sie den Short Match-Evidenztrack, um nach einer kanonischen MTE-Konsensussequenz (CSARCSSAACGS) innerhalb der BBS1-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche auf dem Plus-Strang?
    Sind irgendwelche der Plusstrang-Motive wie erwartet stromabwärts des TSS positioniert?
  • Verwenden Sie den Short Match-Evidenz-Track, um nach einer kanonischen DPE-Konsensussequenz (DSWYVY) innerhalb der BBS1-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche auf dem Plus-Strang?
    Sind irgendwelche der Plusstrang-Motive wie erwartet stromabwärts des TSS positioniert?

6.3.2 Testen Sie Ihr Verständnis

Beginnen Sie für die folgenden Fragen mit dem Sitzungslink „TSS-Seq“, zoomen Sie in die Region, die das MYH3-TSS enthält, und ändern Sie dann die Short Match-Beweisspur von „verstecken“ auf „packen“. Denken Sie daran, dass der Core-Promotor als die Region definiert ist, die das TSS plus 40 nt stromaufwärts und stromabwärts (insgesamt 80 nt) enthält. Außerdem ist MYH3 ein Minusstrang-Gen.

  • Verwenden Sie den ShortMatch-Evidenztrack, um nach einer kanonischen TATA-Box-Konsensussequenz (TATAWAW) innerhalb der MYH3-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche im Minus-Strang?
    Sind irgendwelche der Minusstrang-Motive ungefähr 30 nt stromaufwärts des vorhergesagten TSS positioniert, wie erwartet?
  • Verwenden Sie den Short Match-Evidenztrack, um nach einer kanonischen Inr-Konsensussequenz (BBCABW) innerhalb der MYH3-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche im Minus-Strang?
    Umspannen eines der Minusstrang-Motive die TSS wie erwartet?
  • Wenn KEINE BBCABW-Konsensussequenz gefunden wird, die das TSS von MYH3 überspannt, gibt es dann wie erwartet eine degenerierte Inr-Konsensussequenz (YR), die das TSS überspannt?
  • Verwenden Sie den Short Match-Evidenz-Track, um nach einer kanonischen MTE-Konsensussequenz (CSARCSSAACGS) innerhalb der MYH3-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche im Minus-Strang?
    Sind irgendwelche der Minusstrang-Motive wie erwartet stromabwärts des TSS positioniert?
  • Verwenden Sie den Short Match-Evidenztrack, um nach einer kanonischen DPE-Konsensussequenz (DSWYVY) innerhalb der MYH3-Kernpromotorregion zu suchen. Wenn eine oder mehrere gefunden werden,
    Sind wie erwartet irgendwelche im Minus-Strang?
    Sind irgendwelche der Minusstrang-Motive wie erwartet stromabwärts des TSS positioniert?

Biologie, Genomorganisation und Evolution von Parvoviren bei Meeresgarnelen

Arun K.Dhar, . Dilip K. Lakshman, in Fortschritte in der Virusforschung, 2014

3.3.1 In silico Charakterisierung von IHHNV-kodierenden Regionen und Promotoren

Ein Promotor ist eine DNA-Region, die sich im Allgemeinen stromaufwärts eines Gens befindet und seine Transkription erleichtert und reguliert. Ein Core-Promotor ist der minimale Teil des Promotors, der erforderlich ist, um die Transkription richtig einzuleiten. In Eukaryoten ist der Kernpromotor die Region der DNA, die die Initiation der Transkription durch die RNA-Polymerase II steuert, und erstreckt sich im Allgemeinen von etwa Nukleotid –40 bis +40 relativ zur Transkriptionsstartstelle (Juven-Gershon &. Kadonaga, 2010). Transkriptionsfaktor IID (TFIID)-vermittelte Transkription erfordert mehrere präzise Sequenzen, die als Kernpromotorelemente bezeichnet werden, die die Rekrutierung von TFIID und anderen basalen Transkriptionsfaktoren an die DNA-Matrize vermitteln. Zu diesen Kernpromotorelementen gehören die TATA-Box, der Initiator (Inr), das Motiv-10-Element (MTE), das Downstream-Promotorelement (DPE), die TFIIB-Erkennungselemente (BREu und BREd), das Downstream-Kernelement und der X-Kern Promotorelement 1 (XCPE1) (Juven-Gershon & Kadonaga, 2010). Das MTE arbeitet mit dem Inr streng räumlich zusammen. Es gibt Synergien zwischen dem MTE und der TATA-Box sowie zwischen dem MTE und dem DPE (Juven-Gershon, Cheng & Kadonaga, 2006).

Es gibt drei Promotoren (P2, P11 und P61), die sich stromaufwärts des linken, mittleren und rechten ORFs im IHHNV-Genom befinden. Von den P2- und P61-Promotoren wird angenommen, dass sie die Expression der Gene NS (1a und 1b) (kodiert durch den linken ORF) bzw. VP (kodiert durch den rechten ORF) regulieren. Die P2-Promotorregion besitzt die kanonische TATA-Box (TATATAA) (Abb. 3.7), eine GC-reiche Sequenz GCGAGCGCT und eine palindromische Sequenz ACCTATGACGTCATAGGT, die sich stromabwärts der GC-reichen Aktivatorregion, aber stromaufwärts der TATA-Box befinden. Eine Initiation des Transkriptionsmotivs (Inr) CAGT befindet sich 24 Nukleotide stromabwärts der TATA-Box. Es wurde gefunden, dass die Inr-Sequenz eine wichtige Rolle bei der Expression vieler Säuger- und Arthropoden-Promotoren sowohl von TATA-enthaltenden als auch von TATA-losen Typen spielt (Blissard, Kogan, Wei, & Rohrmann, 1992 Cherbas & Cherbas, 1993 Smale & Baltimore, 1989). Es ist bekannt, dass das CAGT-Sequenzmotiv mit zellulären Transkriptionsfaktoren, wie TFIID, interagiert (Smale &. Baltimore, 1989). Zusätzlich zu den TATA- und Inr-Motiven gibt es einen G-Rest an Position +24 von der Transkriptionsinitiationsstelle und ein mutmaßliches DPE ATCC, beginnend an der +28 Nukleotidposition. Der G-Rest an Position + 24 von Drosophila Es wurde berichtet, dass Core-Promotoren zu einem zwei- bis dreifach höheren Niveau an basaler Transkription führen (Kutach &. Kadonaga, 2000). Es gibt eine AP1-Transkriptionsfaktor-Bindungsstelle vier Nukleotide stromabwärts der TATA-Box.

Abbildung 3.7. Vorübergehende Expression des Glühwürmchen-Luciferase-Gens (fluk) in Sf9-Insektenzellkulturen unter der Kontrolle von PSTDNV-Promotoren P2, P11 und P61 und ihre Deletionsversionen. Verschiedene Sequenzmotive, die in diesen Promotoren vorhanden sind, werden zusammengefasst. Die fluk Ausdruck wurde normalisiert auf Renila-Luciferase (rLuc) Ausdruck und die Ebenen von fLuc/rLuc werden als horizontale Balken mit einer willkürlichen Skalierung dargestellt. Die Fehlerbalken repräsentieren die ± S.D. von Wiederholungsassays. Die relativen Luciferasewerte innerhalb jeder Promotor-Deletionsserie (P2, P11 oder P61) mit unterschiedlichen Buchstaben sind signifikant unterschiedlich. Die relativen Luciferasewerte für die Volllängen-Promotoren P2, P11 und P61 unterscheiden sich signifikant voneinander, wie durch X, Y und Z angezeigt.

Die P61-Promotorregion weist keine kanonische TATA-Box auf (Shike et al., 2000). Mehrere Beweislinien führten die Autoren jedoch zu dem Schluss, dass diese Region möglicherweise als Promotor für den rechten IHHNV-ORF dienen könnte. Es gibt eine AT-reiche Stelle (AAATAAAA), eine Inr-Box (CAGT) 24 Nukleotide stromabwärts von der AT-reichen Stelle, ein G-Nukleotid an der +24-Position und ein DPE, das an der +28-Position beginnt (AGATC). In drei Drosophila TATA-lose Promotoren und im menschlichen TATA-losen IRF-1-Promotor hat das GA/TCGDPE-Motiv, das sich etwa 30 Nukleotide stromabwärts der Transkriptionsstartstelle befand, eine wesentliche Promotorfunktion und ist dafür bekannt, den zellulären Transkriptionsfaktor TFIID zu binden (Burke & Kadonaga , 1996). In ähnlicher Weise ist bekannt, dass das Inr-Motiv CAGT mit TFIID wechselwirkt (Antonucci, Wen & Rutter, 1989). Tatsächlich war die TATA-Sequenz stromaufwärts der Inr-Box für eine effiziente Genexpression von . entbehrlich AaeDNV, während die Mutation im Inr-Motiv die Proteinexpression um 93% reduzierte (Ward et al., 2001).

Ähnlich wie der strukturelle P61-Promotor hat der P11-Promotor, der den mittleren ORF steuert, keine kanonische TATA-Box (Dhar, Lakshman, Natarajan, Allnutt, & van Beek, 2007, Shike et al., 2000). Der P11-Promotor hat zwei Tandem-Repeat-CTTTC-Elemente, eine stromabwärts gelegene TATA-ähnliche Box (AAATATCG), ein Initiations-Transkriptionssignal (Inr oder TIS) CATT, drei G's an Position + 22 bis + 24 relativ zu A des Inr und ein stromabwärts gelegenes Promotorelement (DPE) AGACC (Fig. 3.7), die alle den Regeln einer eukaryotischen Promotorregion entsprechen (Kutach &. Kadonaga, 2000). Die AT-reiche Stelle (AAATATCG), die sich in der Nähe der Inr-Box befindet, ersetzt höchstwahrscheinlich das TATA-Element im mittleren ORF-Promotor. Die Rolle der Tandem-Repeat-Elemente CTTTC ist derzeit nicht bekannt. Die Funktionalität des Inr-Elements wird durch die Anwesenheit von G-Nukleotiden bei + 22 bis + 24 und dem DPE verstärkt. Zur Unterstützung der in silico Analyse bestätigte die anschließende Transkriptionskartierung, dass die Transkription des mittleren ORF sowohl am C als auch am A des Inr-Elements beginnt (Dhar et al., 2010). Wenn die Transkription bei Nukleotid C beginnt, werden die zweiten G-Reste unter den drei stromabwärts gelegenen G's zu +24 (Dhar et al., 2010).


Diskussion

Wir berichten hier über die Existenz eines einfachen Motivs, das wir T-Blöcke nennen, das mit einer Periodizität von � bp in einem dominanten Anteil von auftritt C. elegans Kernpromotoren. T-Blöcke können als zusammengesetztes Motiv angesehen werden, das in einer großen Anzahl von Einzelblöcken vorkommt. Das Vorhandensein einer zunehmenden Zahl von T-Blöcken spezifisch im Kernpromotor korreliert mit einer abgestuften Nukleosomenknappheit und einem höheren Expressionsniveau. Unsere Ergebnisse legen nahe, dass T-Blöcke ein wichtiger Faktor bei der Regulierung von sind C. elegans Genexpressionsniveaus. In dieser Diskussion betrachten wir die genomischen und transkriptomischen Einschränkungen, die die Struktur, Funktion und Evolution der Kern-Promotor-T-Blöcke formen können. Welche Einschränkungen wirken sich auf diese DNA-Region aus? Welche evolutionären Kräfte liegen der periodischen Struktur zugrunde? Welcher Mechanismus ist für die abgestufte Korrelation mit dem Expressionsniveau verantwortlich? Warum haben verschiedene Gene eine unterschiedliche Anzahl von T-Blöcken?

Die 100 bp vor dem Beginn der Translation in C. elegans unterliegen starken Einschränkungen, da diese gleichzeitig sowohl die 5′ UTR als auch den Kernpromotor darstellen und folglich ihre zugehörigen regulatorischen Motive enthalten. Dies rührt offenbar von der allgemeinen Kürze der C. elegans 5′ UTR, wie die folgenden Beobachtungen zeigen. Die regulatorischen Elemente, die wir in dieser Region finden, sind bekannte funktionelle Elemente der 5′ UTR: das SL1-Motiv und die Kozak-Sequenz (Abb. 1). Von 15.537 gut nachgewiesenen Genen enthalten �% (12.702) 5′ UTRs der Länge ≤ 60 Basen (Ergänzende Abb. S8). Da der Core-Promotor als die 100-bp-Region definiert ist, die den Transkriptionsstart flankiert, überlappen diese bei kurzen 5′ UTRs (fast) vollständig mit dem stromabwärts gelegenen Teil des Core-Promotors. Frühere Arbeiten haben auch gezeigt, dass in C. elegans die 5′ UTR ist im Allgemeinen kurz (Blumenthal und Steward 1997 Rhoads et al. 2006). Die Nukleosomenbelegung der Region vor dem Start der Translation ist ebenfalls stark gebunden ( 3 ), was die nahe Lage der Transkriptionsstartstelle (TSS) impliziert (Gu und Fire 2010). Darüber hinaus beträgt der Abstand zwischen dem TATA-Box-Motiv und dem Startcodon im Allgemeinen 50 Basen, was einer typischerweise kurzen 5′ UTR entspricht ( 1B ). Eine solche Überlappung zwischen einer kurzen 5′ UTR und dem stromabwärts gelegenen Teil des Kernpromotors erlegt Einschränkungen auf, um die Funktionen der Initiation und der späteren Verarbeitung der Transkription zu kombinieren.

Als Tor zur Transkription sollte der Core-Promotor die Fähigkeit besitzen, Nukleosomen zu entfernen und den Zugang zu RNA-Polymerase II und GTFs zu ermöglichen (Fuda et al. 2009, Juven-Gershon und Kadonaga 2009). Neuere Arbeiten haben zwei Klassen von Promotoren in Bezug auf ihre Nukleosomenbelegung identifiziert: offene und bedeckte Promotoren (Tirosh und Barkai 2008). Zu den verschiedenen Attributen, die mit jeder Gruppe verbunden sind, gehört das Vorhandensein oder Fehlen einer Poly(dA:dT)-Spur, eines Motivs, das zuvor mit Bereichen der niedrigsten Nukleosomenbelegung in vitro in Verbindung gebracht wurde (Rhodes 1979 Prunell 1982 Struhl 1985 Koch und Thiele 1999 Anderson und Widom 2001 Segal ua 2006 Kaplan ua 2009). Unsere Ergebnisse zeigten, dass T-Blöcke mit einer intrinsischen Fähigkeit korreliert sind, auch eine Nukleosomen-Eviktion zu verursachen. Darüber hinaus, ähnlich wie bei Hefe, wo Poly(dA:dT)-Spuren (oft als A-Spuren bezeichnet) mit essentiellen Genen assoziiert sind (Struhl 1985), in C. elegans, eine hohe Anzahl von T-Blöcken in Kernpromotoren von Housekeeping-Genen gefunden wird. Diese Beobachtungen legen nahe, dass T-Blöcke als C. elegans Analog der Poly(dA:dT)-Spur. Obwohl Poly(dA:dT)-Spuren keine Strangpräferenz zeigen, finden wir jedoch eine signifikante Asymmetrie in der Häufigkeit von T-Blöcken über die beiden Stränge des Kernpromotors hinweg. Trotz dieser Asymmetrie korrelieren T-Blöcke, die sich auf dem Rückwärtsstrang befinden, mit ähnlichen Mustern der Nukleosomenvertreibung wie die auf dem Vorwärtsstrang. Ein weiterer Unterschied zwischen den Poly(dA:dT)-Spuren und T-Blöcken sind ihre Längen. Während Poly(dA:dT)-Spuren 15� bp umfassen können (Struhl 1985), werden T-Blöcke als mehrere Blöcke von 𢙓 ununterbrochenen Thyminen verteilt. Die von uns beobachtete Periodizität platziert die T-Blöcke auf derselben Furche der DNA-Helix, während eine höhere Anzahl von Blöcken mit einer höheren Nukleosom-Eviction korreliert. Diese Beobachtung ist angesichts einiger früherer Arbeiten (Satchwell et al. 1986 Hsieh und Griffith 1988 Costanzo et al. 1990 Collings et al. 2010) etwas unerwartet, die die bevorzugte Bindung von Nukleosomen an kurze periodische A/T-Strecken zeigen, die eine DNA-Biegung erzeugen. Unsere Ergebnisse, dass die Nukleosomenbelegung antikorreliert mit A/T-Block-reichen Regionen ist, können daher im Lichte von Berichten über das Fehlen von Nukleosomen in der DNA mit langen A- und T-Abschnitten interpretiert werden (Rhodes 1979 Prunell 1982 Struhl 1985 Koch und Thiele 1999 Segal und Widom 2009), wobei periodische A/T-Strecken als unvollkommene A/T-Strecken angesehen werden können. Die Auflösung dieses Paradoxons erfordert zusätzliche Forschung und kann die charakteristische Wirkung beinhalten, die A/T-Blöcke auf Nukleosomen haben könnten, die aus unterschiedlich modifizierten Histonen bestehen, die in früheren Studien möglicherweise nicht untersucht wurden. Die meisten früheren Arbeiten zur Untersuchung der DNA-Nukleosom-Interaktion riefen Nukleosomen im Allgemeinen hervor, ohne Histonmodifikationen zu unterscheiden. Kernpromotoren aktiv exprimierter Gene sind jedoch von Nukleosomen besetzt, die im Vergleich zu nicht transkribierten Genen unterschiedlich modifiziert sind (Li et al. 2007). Somit könnten Histonmodifikationen einen Einfluss auf die Nukleosomenbindungskapazität der T-Blöcke im Kernpromotor haben.

Die Abhängigkeit von T-Blöcken im Gegensatz zu A-Blöcken ist wahrscheinlich auf die Beteiligung eines Uracil-reichen Motivs für zurückzuführen trans-Spleißen. Trans-Spleißen ist wichtig für den Ausdruck der meisten C. elegans Gene. Frühere Arbeiten haben gezeigt, dass trans-Spleißeffizienz hängt von der Anwesenheit eines Uracil-reichen (U-reichen) Elements stromaufwärts der SL1/SL2-Elemente ab (Graber et al. 2007). Da die 5′ UTR mit dem Kernpromotor überlappt, fungieren anscheinend T-Blöcke als diese U-reichen Elemente. Tatsächlich fanden wir eine hohe Anreicherung beim gleichzeitigen Auftreten der SL1- und T-Block-Motive ( 7A , E ). Darüber hinaus korreliert eine steigende Anzahl von T-Blöcken mit einer Erhöhung der Genauigkeit des SL1-Elements zur kanonischen Form. Somit ist die Einschränkung des U-reichen Elements für den effizienten trans-Spleißen kann die Ursache für eine Asymmetrie in der Verteilung von T- und A-Blöcken innerhalb sein C. elegans Kernpromotoren. Während sowohl T-Blöcke als auch A-Blöcke eine ähnliche Entfernung der Nukleosomen verursachen können, ist nur eine U-reiche und keine A-reiche Region für die trans-Spleißen. Darüber hinaus würde auch eine Kombination von A-Blöcken und T-Blöcken zu Selbstkomplementarität führen, die mit trans-Spleißen, was zur Selektion gegen A-Blöcke führt. Es besteht auch ein Mutationsbias gegen ununterbrochene T-Stretches (Denver et al. 2004), der die Organisation von Thyminen in Blöcken auf derselben Seite der Doppelhelix begünstigt. Die Regionen zwischen den T-Blöcken könnten auch als Stellen für die Lokalisierung von stromabwärts gelegenen regulatorischen Elementen des Kernpromotors dienen. Somit können T-Blöcke im Kontext der auf diese Sequenz wirkenden Beschränkungen eine Doppelfunktion erfüllen.

Wie könnte die Anzahl der T-Blöcke in einem Core-Promotor das Expressionsniveau des Downstream-Gens kontrollieren? Die Transkriptionsinitiation kann als Konkurrenz zwischen Nukleosomen, die das Gen reprimieren, einerseits und einem Präinitiationskomplex, der auf den Core-Promotor zugreift, andererseits aufgefasst werden. Increasing the number of T-blocks might differentially tune in favor of the preinitiation complex, leading to higher rates of transcription initiation. Our observed correlation between the gradual increase in the number of T-blocks and the levels of gene expression may thus be explained by the fact that more T-blocks would lead to higher rates of nucleosome turn-over, clearing the promoter for transcription. Transcribed T-blocks would then serve as the U-rich element, increasing efficiency of trans-splicing (Graber et al. 2007). Thus, changes to a single motif may simultaneously affect transcription, transcript stability, and translational efficiency of a particular gene's expression. As predicted, genes whose number of T-blocks is reduced by a SNP generally have lower expression levels with respect to orthologs in another C. elegans strain ( Fig. 6C ).

The dual function of T-blocks may provide a simple mechanism for tuning gene expression levels. Since many essential C. elegans genes are characterized by constitutive expression patterns, such tuning would alleviate the need for transcription factor regulation. Under such a model, few, if any, TFs are required, and the core promoter is the dominant locus of regulation. The proximal promoter may thus be responsible for the spatial and temporal regulation of expression, while the core promoter modulates expression levels. In particular, we propose that expression of housekeeping genes will depend mainly upon the composition of the core promoter and internal gene architecture, rather than on the elements of proximal promoters or enhancers. Consistent with this supposition, it has been recently suggested that housekeeping genes such as those encoded by operons and expressed in the germline have low-complexity, permissive promoters, thus enabling their encoding as operons (Reinke and Cutter 2009).

Our model for the tuning of expression levels using T-blocks makes several important and testable predictions. The construction of a highly expressed transgene should be enabled by a promoter containing multiple T-blocks in combination with a trans-splicing motif. Such a promoter is predicted to drive constitutive expression of a reporter gene in a tuneable fashion across various tissues of C. elegans. In contrast, genes that depend upon precise regulation, such as developmental regulators, should be depleted in T-blocks, and this notion might provide a proxy for their identification. Finally, our results predict that T-blocks and their function will generally occur in organisms with similar selective pressures for short 5′ UTRs and trans-splicing.


Why don't housekeeping genes have TATA Box regions in their promoter sequences? - Biologie

The specificity of enhancers for core promoters is encoded in the sequence.

Motifs within enhancer and core-promoter sequences recruit trans-acting factors that mediate regulatory enhancer–core-promoter communication and specificity.

The communication is mediated by a high local concentration of cofactors that interact dynamically with, and possibly post-transcriptionally modify, each other and the RNA polymerase.

Gene expression is regulated by genomic enhancers that recruit transcription factors and cofactors to activate transcription from target core promoters. Over the past years, thousands of enhancers and core promoters in animal genomes have been annotated, and we have learned much about the domain structure in which regulatory genomes are organized in animals. Enhancer–core-promoter targeting occurs at several levels, including regulatory domains, DNA accessibility, and sequence-encoded core-promoter specificities that are likely mediated by different regulatory proteins. We review here current knowledge about enhancer–core-promoter targeting, regulatory communication between enhancers and core promoters, and the protein factors involved. We conclude with an outlook on open questions that we find particularly interesting and that will likely lead to additional insights in the upcoming years.


Ergebnisse

Experimental Model. Fetal hemoglobin can be abundantly produced in the red cells of human adult individuals, as demonstrated by mutations causing hereditary persistence of fetal hemoglobin (1) or δβ-thalassemia (1). Individuals homozygous for deletional hereditary persistence of fetal hemoglobin (HPFH) have 100% hemoglobin F and they are hematologically normal. Also, hemoglobin F can be elevated in human adults in a variety of acquired conditions, and it is typically elevated in the majority of patients with thalassemia and sickle cell disease. It is likely that specific elements of the γ-globin gene promoter are involved in the control of γ-gene expression in adult erythropoiesis. It is difficult, if not impossible, to investigate the role of these elements in the adult stage of development by using βYAC transgenic mice because of autonomous silencing of γ-gene expression. Therefore, to investigate γ-gene promoter elements contributing to γ-gene expression in the adult we used a transgenic mouse model whose phenotype mimics the phenotype of HPFHs and it is characterized by abundant γ-gene expression in the adult. The transgene contains a γ-globin gene with a promoter extended to position –382 linked to a 2.5-kb μLCR. This transgene is characterized by γ-gene expression in yolk sac and fetal liver erythropoiesis, but also by continuation of high levels of γ-gene expression in the cells of adult erythropoiesis (15), indicating that all the cis-elements necessary for activation of the γ-globin in all developmental stages are present in the construct. This model provided us an opportunity to ask which elements in the γ-globin gene promoter are involved in the control of γ-gene expression in the adult erythropoiesis.

The genomic arrangements of the β-globin locus of galago and human are very similar (Fig. 1EIN ). Sequence comparisons of the γ-gene promoters of the two species are depicted in Fig. 1B . The highly conserved region between the two promoters extends ≈250 bp 5′ to the cap site (12).

(EIN) Diagram of the galago and human β-globin loci. Rectangle boxes are the expressed genes, and the square boxes are pseudogenes. (B) Alignment of the human and galago promoters. Numbers in parentheses indicate the promoter truncations used in the constructs. (C) The basic configuration of the constructs. Each construct contains the μLCR and the human A γ-globin gene from the start codon (ATG) to +1951 (HindIII site). The promoters in each construct are specified in the text.

The basic configuration of the constructs is outlined in Fig. 1C , and the detailed promoter design is described in Materials and Methods. All constructs contain the same μLCR cassette and the same A γ-gene-coding sequence, but they differ in the structure of their promoters.

The Galago γ-Globin Gene Promoter Is Competent for Driving Expression of the Human A γ-Globin Gene. Transgenic mice carrying galago γ-globin gene constructs linked to HS2 or HS3 of the LCR express the γ-globin gene in the embryonic stage of erythropoiesis γ-gene expression occurs in the early fetal liver stage of definitive erythropoiesis of transgenic mice, but no γ-gene expression occurs in the adult stage (13, 14). In contrast, such expression is characteristic of transgenic mice carrying various human γ-globin gene constructs (15). If the galago γ-promoter is the major determinant of γ-gene silencing in adult erythropoiesis, it is expected that replacement of the human γ-promoter with the galago promoter will silence the human γ-gene in the adult stage of erythropoiesis. This expectation assumes that the galago γ-promoter is able to drive the human γ-globin gene expression to a high level during embryonic erythropoiesis. To test this we replaced the human γ-promoter with a 769-bp galago promoter spanning from –714 g to the start codon of the gene. The μLCR was placed upstream of the chimeric galago γ-promoter/human γ-gene, forming μLCR(–714 g ) A γ. Two transgenic mouse lines carrying intact copies of the construct were established. γ-gene expression in embryonic erythropoiesis was determined in 12-days-postcoitum yolk sac and fetal blood samples by RNase protection assay. In Fig. 2EIN we present representative RNase protection assays showing the level of γ-gene expression and the expression of endogenous murine α- and ζ-mRNAs. The level of human γ-mRNA (corrected per copy) of the A γ(–714 g ) line A was 15.4 ± 1.4 in day 12 blood and 36.0 ± 1.8 in day 12 yolk sac. In line B these values were 9.9 ± 1.6 and 16.9 ± 3.2, respectively. These results are similar to those of the μLCR(–201 h ) A γ control mice (10.4 ± 9.5 in day 12 blood and 21.0 ± 7.4 in day 12 yolk sac Table 1) and indicate that the galago γ-gene promoter is able to drive the human γ-gene to high levels of expression in embryonic cells.

The galago γ-globin gene promoter has the capability to drive high-level expression of the human γ-globin gene in transgenic mice. For each construct two images of RNase protection assay are shown, each one representing the results from an individual fetus. The line diagrams appearing below each image indicate the tested constructs. Hu γ, 170-bp protected fragment from exon 2 of the human γ-globin gene Mu ζ, 151-bp protected fragment from the murine ζ-globin gene Mu α, 128-bp protected fragment from the murine α-globin gene Bl, blood YS, yolk sac.

The Galago γ-Gene Promoter Down-Regulates Human γ-Gene Expression in Adult Erythropoiesis. To determine which sequences of the galago γ-promoter are responsible for the down-regulation of γ-gene expression we produced a construct carrying the human γ-gene driven by a galago γ-gene promoter truncated to –199 g . The position of galago –199 g γ corresponds to the human –201 h γ.We have previously shown that the –201 h γ transgenic mice display high levels of γ-globin gene expression in the embryonic and fetal stages of erythropoiesis and similarly high levels of γ-gene expression in the adult stage, i.e., they display a phenotype that mimics HPFH. Analysis of γ-mRNA levels and copy numbers of the transgene was performed in the three lines carrying intact copies of the μLCR (–199 g ) A γ construct (Table 1). As shown in the table and Fig. 2 C und D high levels of γ-gene expression were observed in the embryonic cells of these transgenes, providing further evidence that the galago promoter is able to drive the human γ-gene to a high level of expression. The γ-level of mRNA in the adult blood in the three galago –199 g γ lines was ≈1% of murine α mRNA per copy (Table 1), about 15 times lower than in the control –201 h A γ mice. These results suggest that the down-regulation of human γ-gene expression in the galago promoter/human γ transgenic mice is controlled by cis-regulatory elements located in the galago γ-gene promoter.

A Minimal Promoter of the Galago γ-Gene Is Sufficient to Down-Regulate γ-Globin Gene Expression in Adult Erythropoiesis. To further locate the elements responsible for down-regulation of γ-gene expression, we truncated the galago γ-promoter to position –157 g and produced a construct μLCR(–157 g ) A γ (Fig. 2E ). This minimal galago γ-promoter contains three conventional motifs, CACCC, CCAAT, and TATA. Six transgenic mouse lines carrying intact copies of this construct were established. An analogous construct containing the minimal human γ-promoter [μLCR(–159 h ) A γ] was produced to serve as control, and four transgenic mouse lines carrying this control construct were established. During embryonic erythropoiesis the γ-mRNA level in the human –159 h γ mice (Fig. 2F ) was similar to that in the μLCR(–382 h ) A γ mice (26.6 ± 8.8% vs. 21.0 ± 7.4% in day 12 yolk sac, Fig. 2B ), and the μLCR(–201 h ) A γ mice (Table 1 and Fig. 2D ), indicating that the minimal human γ-promoter is sufficient to drive the human γ-gene to high levels of expression. Similarly, as shown in Fig. 2E , in the embryonic stage, the galago –157 g γ promoter is able to drive the human γ-gene to a level indistinguishable from that of the human –159 h γ promoter (25.4 ± 4.2% and 26.6 ± 8.8% of murine α-mRNA per copy,). However, whereas in the human –159 h γ mice γ-gene expression continues in the definitive erythropoiesis, γ-gene expression is progressively down-regulated in the definitive erythropoiesis of the galago –157 g γ mice (Fig. 3EIN and Table 2). Thus, the amount of γ-mRNA in the day 12 fetal liver of the galago –157 g γ mice was reduced to about one-half of that in the human –159 h γ mice (8.3% vs. 14.0%). The largest decrease was observed in the adult blood: γ-gene expression in the galago –157 g γ mice decreased to 1.4 ± 0.5% of murine α-globin mRNA, i.e., it was 10-fold lower compared to the human –159 h γ mice. Because the truncated galago promoter actually maintains full promoter strength in the embryonic cells, we conclude that the minimal galago promoter is sufficient to down-regulate human γ-gene expression in the definitive erythropoiesis.

The galago minimal promoter silences expression of the γ-globin gene in adult erythropoiesis in transgenic mice. Effects of the galago γ-promoter or its promoter elements on humanγ-gene expression were assessed in the adult blood of transgenic mice carrying the corresponding construct. The line drawings at the top of each image show the constructs, and the differences between the test and control constructs are circled. Open and shaded bars with standard-deviation tabs show the expression levels of γ-gene expression in the controls and the experiments. The statistical significance (P) between experiment and control is indicated on the upper right corner of each histogram. (EIN) Comparison of effects of the human –159 minimal promoter and the galago –157 minimal promoter on expression of the γ-globin gene in adult erythropoiesis. (B) Comparison of the human CAC/CAT box with the galago CAC/CAT box. (C) Comparison of the human TATA box with the galago TATA box. (D) Comparison the human CAC box with the galago CAC box. (E) Comparison of the human CAT box with galago CAT box. (F) Comparison the human γCAC box with the human εCAC box.

The TATA Box and the Core γ-Gene Promoter Are Not Involved in γ-Gene Silencing in Adult Erythropoiesis. The minimal γ-promoter consists of a core promoter including the TATA box and a proximal promoter containing the CACCC and CCAAT boxes. Each conventional box is required for full level of γ-gene expression. To maintain full strength of the promoter in the γ-gene recombinant constructs, we produced a chimeric human/galago minimal promoter by interchanging the corresponding cis-elements between the human and the galago promoters. To study the role of the galago core promoter in developmental regulation, a NaeICH/NcoI fragment containing the TATA box and the 5′ untranslated region of the human minimal γ-promoter was substituted by the corresponding galago fragment, resulting in the construct μLCR(–159 h ) A γ(TATA g ) (Fig. 3C ). In five transgenic lines carrying this construct, the substitution of the human TATA box by the galago TATA box maintained high-level expression of the human γ-gene in embryonic erythropoiesis (Table 3). Notably, in the adult blood, γ-gene expression was also maintained at a level similar to that of the control –159 h A γ mice (17.8 ± 3.4% vs. 14.3 ± 3.3%) (Table 3 and Fig. 3C ). We conclude that the galago core promoter (the TATA box and the 5′ nontranslated region) does not play a major role in γ-gene silencing.

The CACCC and CCAAT Box Region of the Galago γ-Gene Promoter Is Mainly Responsible for γ-Gene Down-Regulation in Adult Erythropoiesis. To study the role of the proximal promoter in the developmental regulation of the γ-gene, the human NaeICH/NcoI fragment containing the TATA box and 5′ untranslated region replaced the corresponding fragment in the –157 g minimal galago promoter, forming μLCR(–157 g ) A γ(TATA h ) (Fig. 3B ). Four transgenic lines carrying this construct were established (Table 3). The replacement of the galago TATA box by the human TATA box did not impair the γ-promoter strength in embryonic erythropoiesis as shown by the similar levels of γ-gene expression in the μLCR(–157 g ) A γ(TATA h ) mice and the control mice (31.2 ± 9.6% vs. 26.6 ± 8.8%, P > 0.05). In contrast, the galago proximal promoter (CAC/CAT) caused a significant degree of down-regulation of γ-gene expression in the adult (5.8 ± 0.9% vs. 14.3 ± 3.3%, P < 0.01) (Fig. 3B ). These results suggest that the galago proximal γ promoter plays a major role in developmental down-regulation of γ-gene expression.

The CACCC Box Is the Dominant Element in Developmental Regulation of the γ-Globin Gene. The CACCC and CCAAT boxes of the proximal γ-gene promoter are essential for activation of the γ-globin gene the CCAAT box region has also being implicated in γ-gene silencing (17, 18). To delineate the roles of the two boxes in developmental regulation we swapped the galago and human CACCC and CCAAT boxes. When the galago CACCC box replaced the human counterpart [μLCR(–159 h ) A γ(CAC g )], γ-gene expression in the adult blood was reduced 4-fold (i.e., 4.4 ± 0.3% of murine α-mRNA, whereas the level of γ-gene expression was 14.3% in the control –159 h A γ mice) (Fig. 3D and Table 4). This replacement did not impair the γ-promoter strength as demonstrated by high-level γ-gene expression in embryonic erythropoiesis (Table 4).

When the galago CCAAT box replaced the human CCAAT box in the [μLCR(–159 h ) A γ] (CAT g ) mice, γ-gene expression was maintained at a high level in the embryonic stage and no statistically significant decline occurred in adult cells (Fig. 3E ).

These results suggest that the CACCC box is the main determinant of silencing of galago γ-gene expression in definitive erythropoiesis.

The Human ε-Globin Gene CACCC Box Directs Down-Regulation of the Human γ-Globin Gene. Because the galago CACCC box is largely responsible for the down-regulation of the human γ-globin gene in adult erythropoiesis, we postulated that the CACCC box of the human ε-globin gene would also be able to down-regulate the human γ-globin gene. To test this hypothesis we replaced the 18-bp γ-gene CACCC box region by the corresponding human ε-gene CACCC region in the context of the μLCR(–382 h ) A γ construct. In all four established transgenic mouse lines, expression of the human γ-globin gene in the adult mice was low (Table 5 and Fig. 3F ). Replacement of the γCACCC by εCACCC reduced γ-gene expression by 85% (i.e., from 16.5 ± 4.5% to 4.6 ± 1.2%) in the adult blood, whereas it did not affect the expression in the day 12 yolk sac (21.0 ± 7.4% vs. 26.0 ± 4.9%). These results indicate that the ε-gene CACCC box is able to down-regulate γ-globin gene expression even in the context of an HPFH-like γ-gene promoter.


Danksagung

We would like to thank Slawomir Kubik and David Shore for help with the MNase-seq protocol Michael Tolstorukov for advice regarding the MNase titration Michal Levo and Eran Segal for modelling the Utrecht sequencing facility for sequencing and the Holstege and Kemmeren group members for assistance and discussions. This work was supported by the Netherlands Organisation for Scientific Research (NWO) grants 016108607 (FH), 91106009 (FH) and 86411010 (PK) and by the European Research Council (ERC) grant 671174 DynaMech.