Information

Sind nicht-kodierende RNAs Introns?

Sind nicht-kodierende RNAs Introns?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich bin etwas verwirrt, welcher Teil des Genoms für nicht-kodierende RNAs kodiert. Sind es die Introns? Dies würde für mich Sinn machen, warum sie nicht transkribiert werden, da die Introns nicht transkribiert werden. Oder handelt es sich bei nicht-kodierender RNA tatsächlich um Exons, die einfach nicht transkribiert werden? Wenn ja, wozu dienen die Introns eigentlich? Darauf kann ich keine prägnante Antwort finden. Wikipedia zum Beispiel erscheint eher vage:

Während Introns keine Proteinprodukte kodieren, sind sie integraler Bestandteil der Genexpressionsregulation. Einige Introns kodieren selbst funktionelle RNAs, indem sie nach dem Spleißen weiterverarbeitet werden, um nichtkodierende RNA-Moleküle zu erzeugen.[18] Alternatives Spleißen wird häufig verwendet, um mehrere Proteine ​​aus einem einzigen Gen zu erzeugen. Darüber hinaus spielen einige Introns eine wesentliche Rolle in einer Vielzahl von regulatorischen Funktionen der Genexpression, wie z. B. Nonsense-vermittelter Zerfall[19] und mRNA-Export.[20]

Hat in beiden Fällen jemand auch Informationen darüber, warum die ncRNA nicht übersetzt wird? Was ist der Mechanismus, der verhindert, dass es übersetzt wird? Ich vermute, dass es bei einigen ncRNAs darum geht, dass sie den Kern nicht verlassen können, da viele ncRNAs meiner Meinung nach mit posttranskriptioneller Gen-Silencing zu tun haben, obwohl tRNA und rRNA den Kern eindeutig verlassen…

Für Hilfe zu Introns/Exons/ncRNAs wäre ich sehr dankbar. Dankeschön :)


Während Ankurs Antwort richtig ist, muss beachtet werden, dass nicht alle nicht-kodierenden RNAs Introns sind.

Ein Intron muss aus einer mRNA herausgeschnitten werden, was bedeutet, dass jede nicht-kodierende RNA, die nicht Teil einer mRNA ist, kein Intron sein kann.

rRNA und tRNA sind beispielsweise Beispiele für nicht-kodierende RNAs, die keine Introns sind, da sie nicht Teil der mRNA sind. miRNA kann in einigen Fällen aus Introns hergestellt werden, aber wenn sie separat transkribiert werden, sind sie keine Introns.

Die mRNA-Translation hängt von vielen Faktoren ab, die an prozessierte mRNA binden (ein sehr langer Prozess). Andere RNA durchläuft diesen Prozess nicht und wird daher nicht von Ribosomen rekonisiert und nicht translatiert.


Eine Klarstellung zu Introns und Exons.

Obwohl es wahr ist, dass Introns kein Teil der mRNA sind, wie March Ho sagte, werden sie im Wesentlichen transkribiert. Dies mag trivial erscheinen, aber es ist wichtig zu beachten. So:

  • Sowohl Introns als auch Exons entstehen aus der transkribierten Region
  • Exons müssen nicht unbedingt den ORF bilden (d. h. in Proteine ​​übersetzt werden)

Bezüglich intronischer RNAs:

Die Community hat keine gute Definition von intronischen RNAs. Die meisten dieser RNAs wurden durch Sequenzierung identifiziert und das Sequenzierungsexperiment kann nur sagen, auf welche Region des Genoms ein Read abgebildet wird. Es gibt keinen Hinweis darauf, wie die RNA hergestellt wurde.

Daher wurde jedes Read-Mapping auf das Intron eines anderen Gens als intronische RNA klassifiziert, was IMO nicht ganz korrekt ist. Nur Reads, die wirklich aus der intronischen Region des entstehenden Transkripts (über RNA-Prozessierung) stammen, sind als intronische RNAs zu betrachten und nicht nur aufgrund ihrer genomischen Überlappung. Jedes unabhängige Transkript, das mit der intronischen Region überlappt, ist als überlappendes Gen anzusehen. Die Ermittlung des Mechanismus ist jedoch möglicherweise nicht so einfach. Es ist bekannt, dass miRNAs und einige snoRNAs durch Prozessierung der intronischen Region produziert werden.

Eine Aussage wie diese (aus dem zitierten Artikel [18] in Ihren Zitaten):

Untersucht man die Daten für intronische und exonische DNA aus dem menschlichen Genom, sind piRNAs deutlich wahrscheinlicher als erwartet ($chi^2_{1df}$ = 1353,2; P < 2,2 × 10−16) eher in Exons als in Introns zu residieren, da Introns im Durchschnitt etwa 15-mal größer sind als Exons.
[… ]
Wir fanden 36 Sequenzen, die perfekt zu Regionen passen, die die Exon-Exon-Spleißverbindungen der mRNA überlappen, was darauf hindeutet, dass diese piRNA aus reifen mRNA produziert wird.

kann irreführend sein, weil es sich nur um genomische Überlappung handelt. Die meisten piRNAs werden als lange RNA synthetisiert, die exonukleolytisch vom 3' gehackt wird, um die reife piRNA zu erhalten. Ohne weitere Experimente kann eine solche Aussage gefährlich sein.


Hat in beiden Fällen jemand auch Informationen darüber, warum die ncRNA nicht übersetzt wird? Was ist der Mechanismus, der verhindert, dass es übersetzt wird?

Abgesehen von Ihrer Argumentation zur Kernretention (viele ncRNAs sind im Zytoplasma lokalisiert) kann es viele andere Gründe geben, hauptsächlich das Fehlen eines intakten ORF. Selbst wenn ein ORF vorhanden ist, erfordert die Translationsinitiation andere Merkmale wie die Kozak-Konsensussequenz usw. Allerdings wurde festgestellt, dass einige Reads-Mapping auf lncRNAs mit Ribosomen assoziiert sind (Guttman et al. 2013). Ob sie übersetzen oder nicht, ist nicht wirklich bekannt.


Yup - in vielen Fällen erfolgt die Transkription von nicht-kodierenden RNAs von Introns. Einige von ihnen sind innerhalb von Genen (intragen) und andere sind intergen (zwischen den Genen). Beim Menschen wurde eine große Anzahl von beiden dokumentiert http://www.nature.com/ng/journal/v47/n3/full/ng.3192.html

Kommen wir zu Ihrer Frage, warum sie nicht transkribiert werden – es kommt wieder auf dieselben Histonmarker und Promotoren an, die die Transkription kodierender Gene regulieren; an der Transkription von ncRNA ist nichts grundsätzlich Besonderes; Unterschiede treten später auf, wenn mRNA mit einer Kappe versehen und polyadenyliert ist und daher weniger abbaubar ist.

Außerdem werden viele, viele ncRNAs transkribiert, sind aber weniger häufig. Einige der interessanten Rollen, die sie spielen, umfassen die Interaktion mit Chromatin-modifizierenden Enzymen, die Regulierung der DNA-Methylierung zusammen mit den traditionell bekannten Funktionen, die die Gen-Stummschaltung durch Antisense-Transkripte oder die miRNA-gesteuerte Unterdrückung der Expression beinhalten.


Androgen-responsive intronische nicht-kodierende RNAs

Die Transkription einer großen Anzahl nicht-kodierender RNAs, die aus intronischen Regionen menschlicher Gene stammen, wurde kürzlich beschrieben, aber Mechanismen, die ihre Biosynthese und ihre biologischen Funktionen steuern, sind weitgehend unbekannt. In dieser Arbeit haben wir die Existenz eines gemeinsamen Mechanismus der Transkriptionsregulation untersucht, der von proteinkodierenden mRNAs und intronischen RNAs geteilt wird, indem wir die Wirkung von Androgen auf das Transkriptionsprofil einer Prostatakrebszelllinie gemessen haben.

Ergebnisse

Unter Verwendung eines speziell angefertigten cDNA-Mikroarrays, angereichert mit intronischen transkribierten Sequenzen, fanden wir 39 intronische nicht-kodierende RNAs, deren Spiegel durch Androgenexposition signifikant reguliert wurden. Die orientierungsspezifische reverse Transkriptions-PCR zeigte, dass 10 der 13 in Antisense-Richtung transkribiert wurden. Diese Transkripte sind lang (0,5–5 kb), ungespleißt und kodieren anscheinend nicht für Proteine. Interessanterweise fanden wir, dass die relativen Mengen androgenregulierter intronischer Transkripte mit den Mengen des entsprechenden Protein-kodierenden Gens korreliert werden können (alsGAS6 und asDNAJC3) oder mit der alternativen Verwendung von Exons (asKDELR2 und asITGA6) in den entsprechenden proteinkodierenden Transkripten. Bindung des Androgenrezeptors an eine mutmaßliche regulatorische Region stromaufwärts von alsMYO5A, ein Androgen-reguliertes Antisense-Intron-Transkript, wurde durch Chromatin-Immunpräzipitation bestätigt.

Abschluss

Insgesamt weisen diese Ergebnisse darauf hin, dass zumindest ein Bruchteil der natürlich transkribierten intronischen nicht-kodierenden RNAs durch gemeinsame physiologische Signale wie Hormone reguliert werden kann, und bestätigen weiter die Vorstellung, dass das intronische Komplement des Transkriptoms funktionelle Rollen bei der menschlichen Genexpression spielt Programm.


Einführung

Das menschliche Genom wird umfassend transkribiert. Die Mehrheit der Transkripte sind lange nicht-kodierende RNAs (lncRNAs), definiert als > 200 Basenpaare in der Länge und transkribierte Antisense-, Intron- oder intergene zu Protein-kodierenden Genen. RNA-Sequenzierungsstudien, die an verschiedenen Geweben und Zelltypen durchgeführt wurden, identifizieren ständig neue lncRNAs, was darauf hindeutet, dass die umfassende Annotation von lncRNA-Genen noch lange nicht abgeschlossen ist [1,2,3,4,5,6]. Jüngste Studien mit gezielter RNA-Sequenzierung (auch RNA CaptureSeq genannt) haben eine enorme Komplexität menschlicher Transkriptome gezeigt – hauptsächlich angetrieben durch durchdringende Transkription, komplexes alternatives Spleißen, Zelltyp und kontextspezifische Genexpression [7, 8]. Bis heute hat jedoch nur eine kleine Anzahl von lncRNAs eine zugewiesene Funktion, und der genaue Anteil der nicht-kodierenden Transkripte, die funktionsfähig sind, ist Gegenstand einer anhaltenden Debatte.

Genomweite Assoziationsstudien (GWAS) in Kombination mit Feinkartierung haben 196 unabhängige Signale identifiziert, die mit dem Brustkrebsrisiko (bedingte P Werte < 1 × 10 –6 ) [9]. Sechsundsechzig Signale verleihen ein höheres Risiko für Östrogenrezeptor (ER)-positive Tumoren, 29 ein höheres Risiko für die Entwicklung von ER-negativen Tumoren und die restlichen Signale zeigten keinen statistisch signifikanten Unterschied in ihren Auswirkungen auf ER-Subtypen [9]. Aufgrund des komplexen Kopplungsungleichgewichts (LD) werden genetische Varianten innerhalb eines Signals häufig mitvererbt, was es schwierig macht, die die Assoziation treibende Variante zu bestimmen. Eine kürzlich durchgeführte Studie hat die glaubwürdigen kausalen Varianten (CCVs) innerhalb jedes Signals definiert als solche mit P Werte innerhalb von zwei Größenordnungen von der Bleivariante (7394 CCVs/196) [9]. Bei 28 Signalen wurde ein einzelnes CCV identifiziert und bei 96 Signalen war die Anzahl der CCVs ≤ 10. Ähnlich wie bei anderen merkmalsbezogenen Varianten, die von GWAS identifiziert wurden, befindet sich die Mehrheit der CCVs in nicht-kodierenden genomischen Regionen [1].

Wir haben kürzlich gezeigt, dass CCVs an genomischen Merkmalen angereichert sind, die mit regulatorischer Aktivität in einer Reihe von aus der Brust stammenden Zelllinien verbunden sind, einschließlich Stellen mit offenem Chromatin, Chromatinmarkierungen, die mit Promotor- und Enhancer-Aktivität (H3K4Me3, H3K4Me1 und H3K27Ac) verbunden sind, und Transkriptionsfaktor Bindungsstellen [9, 10]. Capture Hi-C-Analysen haben annotierte Genpromotoren identifiziert, die häufig mit diesen CCV-enthaltenden Elementen interagieren, was eine Liste von Kandidaten-Risikogenen für diese Signale liefert [10]. Bei 20 Signalen fanden wir jedoch keine Hinweise darauf, dass CCVs in Regionen fallen, die durch regulatorische Aktivitäten gekennzeichnet sind, was darauf hindeutet, dass einige Signale das Risiko durch alternative Mechanismen verändern [10]. Mit RNA CaptureSeq haben wir multi-exonische nicht-kodierende RNAs (mencRNAs) annotiert, die aus Genomintervallen, die Brustkrebsrisikosignale umgeben, in einer Reihe von Brustgewebe und Zelllinien transkribiert wurden. Wir liefern Beweise dafür, dass nicht-kodierende RNAs einen alternativen Mechanismus darstellen, durch den CCVs das Brustkrebsrisiko verändern. Dies geht wahrscheinlich über Brustkrebs hinaus und könnte einen gemeinsamen Mechanismus darstellen, durch den GWAS-Varianten bei anderen komplexen Merkmalen und Krankheiten wirken.


Hintergrund

Nach dem zentralen Dogma wird DNA in mRNA transkribiert, die in Protein übersetzt wird, und letztere übernehmen die meisten funktionellen, strukturellen und regulatorischen Rollen in verschiedenen zellulären Prozessen. Nichtsdestotrotz wurde festgestellt, dass Protein-kodierende Gene sowohl in niederen als auch in höheren Organismen ähnlich sind und nicht ausreichen, um die Komplexität höherer Organismen zu erklären, was die proteinzentrierte Sichtweise in Frage stellt. Mit dem Aufkommen der Hochdurchsatztechnologie wurde festgestellt, dass der Großteil des Genoms beim Menschen transkribiert wird und die Anzahl der aktuellen Genannotationen übertrifft. Darüber hinaus werden die meisten dieser Transkripte nicht in Proteine ​​übersetzt. Diese nicht in Proteine ​​übersetzten Transkripte werden als nichtkodierende RNAs (ncRNAs) bezeichnet [1, 2]. Früher galten ncRNAs als „Junk“, aber die Bedeutung dieses Junk-Chunks haben wir erst vor kurzem erkannt [3]. Nicht-kodierende RNAs können anhand ihrer Größe klassifiziert werden. Nicht-kodierende RNAs mit einer Größe von weniger als 200 bp werden als kleine nicht-kodierende RNAs (sncRNAs) bezeichnet und diejenigen über 200 bp werden als lange nicht-kodierende RNAs (lncRNAs) bezeichnet [4] . MicroRNA (miRNA), small interfering RNAs (siRNAs) und Piwi-interacting RNA (piRNA) fallen unter die Kategorie der sncRNAs (Abb. 1). Mehrere Studien haben die Rolle kleiner nicht-kodierender RNAs bei der männlichen Keimzellentwicklung dokumentiert [5, 6]. Die Forschung an lncRNAs hat erst in jüngster Zeit mit Berichten über die Rolle von lncRNAs bei der Regulierung wichtiger Gene in humanen und Nagetier-embryonalen Stammzellmodellen (ESC) an Fahrt gewonnen [7, 8]. LncRNAs erfüllen in Säugetieren eine Vielzahl von Funktionen, sie regulieren beispielsweise die Gene, die an der Chromatin-Modifikation beteiligt sind, inaktivieren das X-Chromosom durch direkte Bindung, hemmen die Antisense-mRNA-Expression, fördern den Antisense-mRNA-Abbau, wirken als konkurrierende endogene RNA (ceRNAs) zur Hemmung die Funktion von miRNAs und binden an die DNA-bindenden Proteine, um deren Interaktion mit den Zielgenen zu hemmen [9].

Klassifizierung von nicht-kodierenden RNAs. Basierend auf der Größe können nicht-kodierende RNAs in kleine nicht-kodierende RNAs und lange nicht-kodierende RNAs unterteilt werden

Es wurde berichtet, dass lange nicht-kodierende RNAs eine Vielzahl von zellulären Prozessen wie Differenzierung, Proliferation und Apoptose regulieren. Die unterschiedliche Expression von lncRNAs bei menschlichen Erkrankungen unterstreicht ihre Rolle in verschiedenen biologischen Prozessen. Es wurde berichtet, dass drei lncRNAs: Peril, Evf2 (Dlx6os1) und linc-Brn1b wichtig für die neurale Entwicklung sind [10, 11]. Mehrere lncRNAs spielen eine wichtige Rolle bei der Entwicklung von Organen während der Embryogenese, wie beispielsweise lncRNA-Fendrr, die divergent vom Transkriptionsfaktor Foxf1 transkribiert wird. Das Maus-Knock-out-Modell von Fendrr wies Defekte in Lunge, Herz und Magen-Darm-Trakt auf [11]. Weiterhin wurde festgestellt, dass die sich entwickelnden Lungen der KO-Maus im Embryonalstadium E13.5 eine kleinere Größe mit kugelförmigen und desorganisierten Lappen aufwiesen. Diese KO-Mäuse sterben kurz nach der Geburt aufgrund von Atemproblemen [12]. Von mehreren lncRNAs wird berichtet, dass sie eine entscheidende Rolle bei der Erhaltung und Differenzierung von Stammzellen spielen. Zum Beispiel wird berichtet, dass RMST [13], Miat [14], Tunar [15] eine Rolle bei der neuronalen Differenzierung spielen. LncRNAs wie Braveheart [16], Alien [17], SENCR [18] und hoxBlinc [19] werden für die kardiale, endodermische, endotheliale bzw. hämatopoetische Differenzierung benötigt. Eine Vielzahl von lncRNAs sind an einer Vielzahl von Krebsarten beteiligt, wie ANRIL [20], CARLo-5 [21], FAL1 [22], GAS5 [23], HOTAIR [24], HOTTIP [25], PCGEM1 [26], PCA3 [27]. Die Vielfalt der lncRNAs und ihrer biologischen Funktionen macht derzeit einen Riesensprung.

Bis heute wurde über viele potenzielle lncRNAs bei Spermatogenese und männlicher Unfruchtbarkeit berichtet, jedoch wurden nur sehr wenige von ihnen validiert und funktionell charakterisiert. Ein Vergleich der Ergebnisse dieser Studien kann zur Identifizierung von lncRNAs führen, die für die Spermatogenese wichtig sind und auch als Marker für männliche Unfruchtbarkeit genutzt werden könnten. Daher haben wir in diesem Artikel die langen nichtkodierenden RNAs (lncRNAs), ihre genomischen Positionen, Datenbanken für die lncRNA-Vorhersage und -Analyse, die jüngsten Entdeckungen in Bezug auf die Spermatogenese und die männliche Fertilität besprochen und wichtige lncRNAs diskutiert, von denen bekannt ist, dass sie eine funktionelle Rolle in Spermatogenese und männliche Fruchtbarkeit.

Lange nicht-kodierende (lnc) RNAs

LncRNAs (long non-coding RNAs) sind definiert als die nicht-proteinkodierenden RNAs, die mindestens 200 Nukleotide lang sind [28, 29]. lncRNAs werden wie mRNAs von der RNA-Polymerase II transkribiert und manchmal wie mRNAs prozessiert, d. h. haben eine 5 mG-Kappe, gespleißt und polyadenyliert [30]. Mit dem Aufkommen empfindlicher Hochdurchsatztechnologien wie Next-Generation-Sequencing (NGS) und Microarray wurden mehrere lncRNAs entdeckt, aber bis heute wurden nur wenige durch genspezifische Studien funktionell charakterisiert.

Genomische Kontexte von lncRNAs

LncRNAs können auf der Grundlage ihrer genomischen Position klassifiziert werden, d. h. abhängig davon, woher diese RNAs transkribiert werden. Diese können in fünf große Klassen eingeteilt werden: eigenständige lncRNAs, natürliche Antisense-Transkripte, Pseudogene, lange intronische ncRNAs, Promoter-assoziierte Transkripte und Enhancer-Transkripte (Abb. 2).

Genomische Kontexte von lncRNAs. LncRNAs (blau) können eigenständige Transkriptionseinheiten sein, intronisch, antisense zu anderen Genen oder von Promotoren oder Enhancern transkribiert werden

Eigenständige lncRNAs

Eigenständige lncRNAs (auch bekannt als lincRNAs oder große intergene nicht-kodierende RNAs) werden von einem bestimmten Genom-Loci transkribiert und überlappen nicht mit proteinkodierenden Genen [31,32,33]. Sie haben eine durchschnittliche Länge von 1 kb und werden von RNA Pol II transkribiert. Diese Transkripte sind normalerweise polyadenyliert und gespleißt. Beim Menschen sind mehr als die Hälfte der lncRNAs lincRNAs [34]. Von LincRNAs wurde berichtet, dass sie in einer Vielzahl von Arten funktionelle Rollen haben. Bis heute wurden diese lncRNAs bei Mensch, Maus, Ratte, Schwein, Rind, Stier, Zebrafisch, C. elegans, Hefe, Arabidopsis thaliana [34,35,36,37]. Xist [38], HOTAIR [39], H19 [40] und MALAT1 [41] sind einige bekannte Beispiele für eigenständige lncRNAs.

Natürliche Antisense-Transkripte (NATs)

Natürliche Antisense-Transkripte werden vom entgegengesetzten Sense-Strang transkribiert [41, 42]. Im Allgemeinen werden NATs von beiden Enden von Sense-Genen transkribiert und sind komplementär zu den 5'- und 3'-Enden von Sense-mRNAs [42,43,44]. Da NATs komplementär zu den Protein-kodierenden mRNAs sind, regulieren diese die Genexpression durch RNA:RNA-Interaktion. Bestes Beispiel ist das X-inaktiv-spezifische Transkript Xist/Tsix-Transkriptpaar, das an der X-Chromosom-Stummschaltung beteiligt ist [45]. Genau wie lincRNAs wurde diese Klasse von lncRNA in einer Vielzahl von Spezies beschrieben, darunter Menschen, Mäuse, Ratten, Rinder, Hühner, Schweine und Hefen [35, 37, 46, 47].

Pseudogene

Pseudogene sind „Relikte“ von Genen, die nicht funktionsfähig sind und für kein Protein kodieren [46]. Sie sind das Ergebnis der Duplikation eines Elterngens oder der Retrotransposition der mRNA-Sequenz in einen anderen genomischen Locus. Diese sind als Folge von Nonsense-, Frameshift- und anderen Mutationen nicht funktionsfähig. Ungefähr 2–20% der Pseudogene werden in RNAs transkribiert, die unter diese Kategorie der lncRNAs fallen. Von Pseudogenen abgeleitete lncRNAs wurden sowohl beim Menschen als auch bei der Maus berichtet. Lethe, eine von einem Pseudogen abgeleitete lncRNA, wurde durch proinflammatorische Zytokine über den TNFα-Signalweg in der Maus induziert [47]. Es wurde auch berichtet, dass von Pseudogenen abgeleitete lncRNAs für die Krebsentwicklung und das Fortschreiten von entscheidender Bedeutung sind. So wurde beispielsweise festgestellt, dass DUXAP10 bei Darmkrebs hochreguliert ist [48]. Viele Studien haben gezeigt, dass Pseudogene die Genexpression ihres Elterngens regulieren, indem sie natürliche siRNAs oder Antisense-Transkripte produzieren [49].

Lange intronische ncRNAs

Es ist bekannt, dass Introns kleine ncRNAs wie snoRNAs und miRNAs beherbergen. Mehrere Transkriptomstudien haben ergeben, dass viele lange Transkripte von den Introns annotierter Gene kodiert werden [50, 51]. Bis heute wurden nur wenige untersucht, aber es wurde festgestellt, dass diese bei Krebs fehlreguliert sind und viele ein unterschiedliches Expressionsmuster bei Krankheitszuständen aufweisen [52]. Die intronischen lncRNAs wurden bei Mensch, Maus, Ratte, Rind, Huhn, Schwein und berichtet Arabidopsis [35, 37, 53, 54]. Eine lncRNA, ANRASSF1, reguliert epigenetisch die Expression eines Tumorsuppressorgens, RASSF1, bei der Tumorentstehung [53]. In ähnlicher Weise wurde berichtet, dass eine lncRNA SYISL, die in Muskeln der Maus stark exprimiert wird, epigenetische Maschinen (EZH2, PRC2) an die Promotoren von p21, MyoG, MCK und Myh4 rekrutiert, was zu epigenetischem Silencing führt [54]. In Arabidopsis thaliana, COLDAIR, ein im FLC-Gen (flowering repressor locus) vorhandenes Intron, ist für die Pflanzenvernalisation verantwortlich [55].

Promotor-assoziierte lange Transkripte und Enhancer-RNAs

Promotor-assoziierte lange RNAs (PALPs) und Enhancer-assoziierte RNAs (eRNAs) sind lncRNAs, die von Promotoren und Enhancern durch RNA Pol II transkribiert werden [56]. Sowohl Promotor- als auch Enhancer-assoziierte lncRNAs sind bei Mensch und Maus bekannt [57, 58]. Promotor-assoziierte RNAs werden von den Transkriptionsstartstellen (TSS) von Protein-kodierenden oder nicht-kodierenden Genen transkribiert. Dies sind cis-wirkende Elemente, die die Expression ihrer Nachbargene regulieren. Die PALPs haben sich in letzter Zeit als wichtiger epigenetischer Regulator von Genen herausgestellt, die an einer Vielzahl von Krankheiten beteiligt sind [59]. Myoparr ist eine promotorassoziierte lncRNA, die aus der Promotorregion des Myogenin-Gens von Mensch und Maus transkribiert wird. Es aktiviert die Expression des Myogenin-Gens durch Interaktion mit Ddx17 und PCAF und hemmt die Proliferation durch Aktivierung der myogenen microRNA-Expression, wodurch die Myogenese gefördert wird [57]. Enhancer-assoziierte RNAs (eRNAs) sind ungefähr 2 kb lang und sind im Allgemeinen nicht polyadenylierte RNAs [60]. Es wurde berichtet, dass eRNAs an der Chromatinöffnung beteiligt sind und die RNA Pol II-Bindung an der Transkriptionsstelle des Zielgens fördern [61, 62]. Es wurde festgestellt, dass eine Enhancer-assoziierte RNA, CARMEN, in humanen kardialen Vorläuferzellen (CPC) stark exprimiert wird, wo sie mit SUZ12 und EZH2 (Komponenten des PRC2-Komplexes) interagiert und die kardiale Spezifizierung und Differenzierung in CPC fördert [58].

Regulation durch lange nicht-kodierende RNAs

Genregulation ist ein komplexer Prozess, der auf transkriptioneller, posttranskriptionaler und translationaler Ebene stattfindet (Abb. 3). Lange nicht-kodierende RNAs in Verbindung mit anderen Molekülen regulieren die Genexpression auf folgende Weise:

Die Genexpression wird durch lncRNAs auf drei Arten reguliert. Transkriptionell: lncRNA interagiert mit dem Methylierungs- und Deacetylierungskomplex, um die Genexpression zu beeinflussen. Posttranskriptionell: lncRNA interagiert mit miRNA, um deren Wirkung zu hemmen (ein), lncRNA wird von miRNA (B), kompetitive Bindung von lncRNA und miRNA an die Zielstelle der mRNA (C). Beeinflussung des alternativen Spleißens: lncRNA erleichtert das alternative Spleißen, indem es an die Zielstelle auf der Prä-mRNA bindet. Translationale Regulation: lnc rekrutiert translationalen Repressor, um die Translation zu blockieren (ein), lnc rekrutiert Polysomen, um die Translation zu fördern (B)

Transkriptionsebene

LncRNAs sind an der epigenetischen Genregulation und dem genomischen Imprinting beteiligt, wie z. B. X-inaktives spezifisches Transkript (XIST), AIR, H19 [63]. Bei Frauen wird im frühen Embryonalstadium ein X-Chromosom inaktiviert, um eine Dosiskompensation gegenüber hemizygoten Männern zu gewährleisten [64]. Diese Inaktivierung des X-Chromosoms wird durch die Rekrutierung des PRC2-Komplexes (polycomb repressive 2) an bestimmten Stellen initiiert, was zu H3k27me3 (Histone H3-Lysin-K27-Trimethylierung) führt. H19, Airn, Kcnq1ot1, Meg3 und Meg8 sind Beispiele für lncRNAs, die an der Kontrolle des genomischen Imprintings beteiligt sind [65]. Dabei wird die Genexpression durch die Rekrutierung von DNA- und Histon-Methyltransferasen für die DNA-Methylierung bzw. Histon-Modifikation reguliert [66]. Diese Art der Regulation wurde bei Mensch, Maus und Hefe beschrieben [66, 67].

Ebene nach der Transkription

Nach der Transkription können lange nicht-kodierende RNAs die Expression von miRNAs regulieren, indem sie als miRNA-Schwamm arbeiten. Es kann auch die Funktion von miRNA stören, indem es um seine Zielstelle auf der mRNA konkurriert. Darüber hinaus kann miRNA auch die Expression von lncRNAs regulieren, indem sie an ihre 3’UTR-Region bindet. Diese Art der Regulation wurde bei Mensch, Maus und Ratte beschrieben [68,69,70,71].

Es gibt mehrere nicht-kodierende RNAs, die die Genexpression regulieren, indem sie durch Sequenzkomplementarität an die Ziel-mRNA binden. Es gibt bestimmte lncRNAs, die als kompetitive endogene RNAs (ceRNAs) fungieren, auch miRNA-Schwämme genannt, weil sie Bindungssequenzen für miRNAs enthalten [72]. Diese ceRNAs interagieren mit miRNAs und beeinträchtigen die Interaktion zwischen miRNA und ihrer Ziel-mRNA. Zum Beispiel blockiert lnc-MG die miR-125b-Expression und kontrolliert die IGF2-Spiegel (Insulin Growth Factor 2) [73].

MicroRNAs können auch die Expression von lncRNAs regulieren [68]. Zum Beispiel regulieren miR-101 und miR-217 negativ die lncRNA MALAT1 (Metastasierung im Zusammenhang mit Lungen-Adenokarzinom-Transkript1) [69] und miR-449a blockiert die lncRNA NEAT1 (nuklear angereichertes reichliches Transkript 1)-Expression bei Krebs [74].

Lange nicht-kodierende RNAs können die miRNA-Funktion unterbrechen, indem sie um ihre Zielstelle auf der mRNA konkurrieren. Ein sehr gutes Beispiel hierfür ist die Bindung von lncRNA BACE1-AS (β-site Amyloid Precursor Protein cleaving Enzym 1-Antisense Transkript) an ihren Sense-Partner, an den miR-485-5p bindet und dadurch die Funktion von miR-485- beeinträchtigt. 5p bei Alzheimer-Krankheit [75].

Alternatives Spleißen

Der Prozess des alternativen Spleißens findet sowohl bei Tieren als auch bei Pflanzen statt, um verschiedene mRNA-Isoformen zu erzeugen [76]. Kürzlich wurde festgestellt, dass lncRNAs den Prozess des alternativen Spleißens regulieren, indem sie mit den Spleißfaktoren interagieren oder RNA-RNA-Duplexe mit prä-mRNAs bilden [70]. Bis heute wurde diese Art der Regulation durch lncRNA bei Mensch und Maus beschrieben [77]. Kürzlich wurde berichtet, dass die lncRNAs NEAT1 und MALAT1 mit nuklearen Speckles, die den Spleißfaktor SC35 enthalten, kolokalisieren, was auf ihre Beteiligung am Prozess des alternativen Spleißens hindeutet [71].

Übersetzung

LncRNAs spielen auch eine wichtige Rolle bei der Regulierung des Translationsprozesses. LncRNAs, die Zielgene auf translationaler Ebene regulieren, wurden bei Mensch und Maus beschrieben [68]. Es wurde berichtet, dass LncRNA-p21 die Translation von JunB- und β-Catenin-mRNA durch Rekrutierung von translationalen Repressoren unterdrückt [68].

Die Translation von Uchl1 (Carboxyl-terminale Ubiquitin-Hydrolase L1) wird durch die aus ihrem Antisense-Strang AS-Uchl1 generierte lncRNA erleichtert, die mit Hilfe einer repetitiven Domäne SINEB2 Polysomen rekrutiert, um eine cap-unabhängige Translation zu fördern [68].

Posttranslationale Modifikationen

LncRNAs können auch die posttranslationalen Modifikationen (PTM) eines Proteins modulieren, indem sie die PTM-Stellen maskieren, was sowohl beim Menschen als auch bei der Maus beschrieben wurde [78, 79]. Lnc-DM ist eine zytosolische lncRNA, die ausschließlich in humanen konventionellen dendritischen Zellen (DCs) exprimiert wird. Diese lncRNA reguliert die Differenzierung dendritischer Zellen, indem sie STAT3 auf Tyr205 phosphoryliert und dadurch die Bindung des Proteins Tyrosinphosphatase SHP1 verhindert [80]. In ähnlicher Weise interagiert eine mit NF-κB interagierende lncRNA NKILA mit IκB und hemmt dessen Phosphorylierung, was zur Aktivierung von NF-κB und zur Unterdrückung von Brustkrebsmetastasen führt [81].

Datenbanken für lncRNA-Vorhersage und -Analyse

Hochdurchsatzstudien wie Microarray und Deep Sequencing haben eine große Anzahl nicht-kodierender RNAs identifiziert [77]. In Hochdurchsatz-Transkriptomstudien wurden etwa 90.000 lncRNAs berichtet [78], aber nur 16.000 sind in GENCODE annotiert [79]. Viele neue lncRNA-Datenbanken wurden entwickelt, um eine so große Anzahl von lncRNAs zu kommentieren (Tabelle 1). Die Anzahl der in den Datenbanken gespeicherten lncRNAs reicht von < 2000 bis > 70.000 Transkripten, wobei Noncode v3.0 die größte Datenbank ist, die > 73.000 Transkripte speichert. DIANA-LncRNA ist die Datenbank, die die größte Anzahl rechnerisch vorhergesagter lncRNAs (> 56.000 Transkripte) sowie die größte Anzahl experimentell validierter lncRNAs (2958 Transkripte) enthält. Diese Datenbanken generieren automatisch Ergebnisse entsprechend der Abfrage als Listen oder Tabellen. Darüber hinaus bieten die meisten von ihnen auch grafische Visualisierungen als Diagramme oder Plots (Noncode v3.0, DIANA-LncBase, CHIPBase, LNCipedia und lncRNome) [96]. Es gibt mindestens eine Datenbank, die die Ziele für lncRNAs vorhersagt [94]. Diese Datenbank sagt die lncRNA-lncRNA- und lncRNA-mRNA-Interaktion bei Mensch und Maus vorher. Eine andere Datenbank enthält Targets für lncRNA bei krankheitsspezifischen Erkrankungen wie Krebs, Arteriosklerose, Herzfibrose und pulmonaler Hypertonie [95]. Die Informationen über gespeicherte lncRNAs und ihre biologischen Annotationen stammen aus der Literatur, Computervorhersagen oder Primärdatenspeichern. Das GENCODE-Projekt, das Teil des ENCODE-Projekts [97] ist, ist ein primärer Datenspeicher, der genaue Annotationen des menschlichen Genoms, einschließlich nicht-kodierender RNAs, bereitstellt [98]. Andererseits basieren Datenbanken wie lncRNADisease und funktionale lncRNA-Datenbanken auf manuell identifizierten, aus der Literatur extrahierten Anmerkungen.

Alle Datenbanken liefern Informationen über beim Menschen identifizierte lncRNAs. Datenbanken, die Informationen über Maus-lncRNAs bereitstellen, sind DIANA-LncBase, CHIPBase, lncRNAdb, Noncode v3.0 und die Functional lncRNA Database. Die Datenbanken LncRNAdb und Noncode v3.0 liefern Informationen zu lncRNAs, die in verschiedenen Spezies exprimiert werden, von Hefe bis zu Pflanzen. Es gibt bestimmte Datenbanken, die Informationen über die zell- oder gewebespezifischen lncRNAs liefern, zum Beispiel lncRNAdb, CHIPBase, Noncode v3.0, DIANA-LncBase und lncRNome. Nur lncRNAdb und Noncode v3.0 geben Auskunft über die zelluläre Lokalisation der lncRNAs. Es gibt bestimmte Datenbanken, die Informationen über lncRNAs und ihren Zusammenhang mit Krankheiten liefern: Noncode v3.0, lncRNAdb, DIANA-lncBase, lncRNADisease und lncRNome. Nur wenige Datenbanken liefern Informationen über die Assoziation von lncRNAs mit anderen nicht-kodierenden RNAs. Datenbanken wie DIANA-LncBase, LNCipedia, die Functional lncRNA Database und lncRNome geben Auskunft über die Assoziation zwischen miRNAs und lncRNAs.

Differentielle Expression von lncRNAs bei Spermatogenese und männlicher Unfruchtbarkeit

Mikroarray

Microarrays mit Sonden, die spezifisch für den Nachweis von lncRNAs sind, wurden vor etwa einem Jahrzehnt verfügbar. Dazu gehören Arraystar Mouse Stringent und Affymetrix Genechip 2.0 ST sowie LncRNA Microarray, die auf aktualisierten genomischen lncRNA-Annotationsressourcen wie NONCODE, ENCODE, RefSeq, UCSC Genes, NRED und fRNAdb basieren. Diese Plattformen ermöglichen die direkte Messung der Spiegel bekannter lncRNA-Kandidaten. Nur drei Microarray-Studien haben lncRNAs in Bezug auf die Spermatogenese untersucht [99,100,101] (Tabelle 2). Sonneet al. (2013) führten eine Microarray-Studie an neonatalen (6 Tage) und adulten Maushoden (8 Wochen alt) durch und identifizierten 8265 lncRNAs, von denen 3025 eine differentielle Expression zeigten [99]. Beim Vergleich der beiden Gruppen stellten sie fest, dass 1062 lncRNAs in den Hoden der erwachsenen Maus im Vergleich zu den Neugeborenenhoden signifikant herunterreguliert und 1963 signifikant hochreguliert waren. Einige der männlichen Keimzellen-spezifischen lncRNAs wie Aldoart2, Speer5-ps1 und Speer9-ps1 wurden in adulten Hoden angereichert und einige der geprägten lncRNAs wie H19, Meg3, Airn wurden in adulten Hoden herunterreguliert. Die Studie zeigte auch, dass es eine Korrelation zwischen der lncRNAs-Expression und den epigenetischen Modifikationsmarkierungen H3K4me3 und H3K27me3 gibt [99]. Allerdings hat keine Microarray-Studie die differentielle lncRNA-Expression beim Menschen analysiert.

Baoet al. (2013) führten eine weitere Microarray-Studie durch, um die Expression von lncRNAs in verschiedenen Entwicklungsstadien zu identifizieren: embryonaler Tag (E) 12,5, E 15,5, postnataler Tag 7 (PND 7), 14, 21 und Erwachsener [100]. Sie fanden heraus, dass während der fetalen Hodenentwicklung 2593 lncRNAs im E12.5-Stadium im Vergleich zum E15.5-Stadium hochreguliert und 1125 herunterreguliert wurden. Außerdem wurden 1976 lncRNAs hochreguliert, während 3096 in P21 im Vergleich zu adulten Hoden herunterreguliert waren. Zu den anderen drei Zeitpunkten wurden über 2000 und über 1500 lncRNAs herunter- und heraufreguliert [100]. Sie wählten 28 lncRNAs aus Microarray-Daten zur Validierung durch Echtzeit-Polymerase-Kettenreaktion (RT-PCR) aus und fanden eine konsistente Expression ausgewählter lncRNAs. Diese lncRNAs waren AK005782, AK052477, BC049716, ENSMUST00000136860, ENSMUST00000145068, ENSMUST00000161511, ENSMUST00000172055, NR_027848, uc008hqc.1, uc009fxb.1, uc009rzf.1, AK020521, AK132382, ENSMUST0000098955, ENSMUST00000142338, ENSMUST00000153774, ENSMUST00000161823, NR_003270, NR_028123, uc009cxn.1 , uc009ipj.1, uc009til.1, ENSMUST00000119676, ENSMUST00000131790, uc007kgi.1, uc007pgs.1, Tsx. In both the above studies, most of the differentially expressed lncRNAs overlapped with small RNAs, suggesting a possible precursor or regulatory relationship. Also, both these studies identified a close association between lncRNAs and epigenetic regulation. Bao et al. (2013) also identified by RNA immunoprecipitation experiment that 11 lncRNAs interact with one or many factors of chromatin-remodelling complexes, such as EZH2 and LSD1 [100].

In a recent study, microarray analysis of transcripts from mouse brain, kidney, heart, liver and testis was performed [101] (Table 2). It was found that the lncRNAs were most abundant in testes as compared to other tissues. A total of 14, 256 lncRNAs were detected in testis, out of which 1607 lncRNAs were specifically expressed in testis. They selected 26 testis-specific abundant lncRNAs for validation by reverse transcription polymerase chain reaction (RT-PCR) and found a pattern of expression similar to the microarray results. These testis-specific lncRNAs were AK018981, Uc007xmk.2, NR_01596, AK005929, NR_040424, ENSMUST00000086914, NR_102286, Uc008vyo.1, NR_028107, NR_027704, NR_038002, ENSMUST00000135865, NR_040326, Uc009dqq.1, NR_038180, ENSMUST00000131403, NR_045045, NR_033583, NR_003953, ENSMUST00000132787, NR_033788, NR_015571, NR_015547, ENSMUST00000136906, Uc029xya.1, and AK018904. The microarray studies on lncRNAs have been undertaken only on different developmental stages and between neonatal and adult testis to identify RNAs which participate in spermatogenesis. No study on purified germ cells or Sertoli cells has been undertaken. Studies on humans lack completely, providing a good opportunity to score the expression of lncRNAs between testicular tissues from azoospermic and normozoospermic individuals and in sperm from oligozoospermic infertile, normozoospermic fertile and normozoospermic infertile individuals.

RNA sequencing (RNA seq) studies

Because of the falling cost of the Next Generation Sequencing (NGS) technology, RNA seq has become a popular approach and is commonly used for transcriptome analysis. Its advantage over microarray technique is its sensitivity, coverage, resolution and the capability to identify new transcripts. Thousands of lncRNAs have been identified in human and mouse transcriptome sequencing projects [98]. RNA sequencing generates billions of reads having size in the range of 30–400 bp, depending upon the technology used. In RNA seq, the number of reads mapping to a region directly reflects the expression level of transcripts, facilitating comparison between two or more samples. Till date, several RNA sequencing studies have been conducted on testis or sperm in order to investigate their roles in male germ cell development. Nevertheless, due to huge data output from these studies, thousands of transcripts have been reported in relation to spermatogenesis.

Studies in humans

At least three studies have investigated lncRNAs in human germ cells (Table 2). Zhuet al. (2016) undertook sequencing and identified a total of 1800 lncRNAs, out of which 157 showed differential expression between different population of testicular cells [107]. In a similar study conducted by Jan et al. (2017) found a total of 137 lncRNAs were differentially expressed between different population of testicular cells [108]. Recently, Rolland et al. (2019) undertook RNA sequencing in human testicular cells to identify lncRNAs, and compared them with rat germ cell RNA profile [109]. They identified 113 known lncRNAs and 20 novel unannotated transcripts (NUTs) were conserved between human and rodents, suggesting them to be important for spermatogenesis. We compared the data across the above three studies and found 15 lncRNAs (LINC00635, LINC00521, LINC00174, LINC00654, LINC00710, LINC00226, LINC00326, LINC00494, LINC00535, LINC00616, LINC00662, LINC00668, LINC00467, LINC00608, LINC00658) to be common across them. We predicted their potential targets using lncRIsearch database, and found some crucial spermatogenic genes such as CENPB, FAM98B, GOLGA6 family, RPGR, TPM2, GNB5 and KCNQ10T1 (Table 3). In yet another search for targets using disease-specific target database (lncTarD), we identified TAZ, LIN28A, CDKN2B, CDKN2A, CDKN1A, CDKN1B, CDKN1C, EZH2, SUZ12, VEGFA as targets relevant to spermatogenesis for some of the lncRNAs (Table 3). This opens up new avenues of research in establishing regulatory connections to the signalling involved in spermatogenesis.

LncRNA profiling of human sperm is very limited (Table 2). Sendler et al. (2013) sequenced sperm transcriptome of fertile men and identified 155 lncRNAs in human sperm [106]. Most of these lncRNAs were antisense or lincRNAs. Only one study analysed lncRNA profile in infertility. Zhanget al. (2019) undertook sequencing to identify lncRNAs that differ in motile and immotile human sperm [110]. While 9879 lncRNA genes (13,819 lncRNA transcripts) showed differential expression in between motile and immotile sperm, three lncRNAs i.e. lnc32058, lnc09522, and lnc98497 showed specific and high expression in immotile sperm in comparison to normal motile sperm. Gene ontology of lncRNAs targets revealed that most of the targets were involved in the process of spermatogenesis and sperm function.

Studies in mouse

Most of the RNA seq studies have been undertaken on mouse testis or sperm (Table 2). Laiho et al. (2013) undertook RNA sequencing on whole testis of mouse on post-natal days 7, 14, 17, 21, and 28 [102]. When compared between two adjacent developmental stages, they found that 17–46 lncRNAs were down-regulated and 16–605 lncRNAs were up-regulated in each transition. Wichman et al. (2017) analysed the expression of lncRNAs at specific stages of spermatogenesis in mouse by purifying key stages (combined type A and type B spermatogonia, pre-leptotene, combined leptotene/zygotene, pachytene spermatocytes and round spermatids) of spermatogenesis by STA-PUT method [103]. They found that 1630 lncRNAs were differentially expressed in spermatogonia versus pachytene spermatocytes with Gm14244, 1700026D11Rik, 1700066O22Rik, RP24-503F14.1, Gm1698, 1700110I01Rik, Gm20621, Gm10619, RP23-52 K8.2, 1700006J14Rik, H19, Gm26751, Gm13054, Gm26656, Gm26835, 5930412G12Rik, Gm26775, D830015G02Rik, Gm26673, Gm5532 being the top 20. 1534 lncRNAs were differentially expressed between pachytene spermatocytes and round spermatids with 1810059H22Rik, 4930412B13Rik, 4930467K11Rik, Gm14249, Astx6, RP23-245G9.1, Gm11782, Gm13481, 9130204K15Rik, Gm13175, Gm27032, Gm16278, 1700040D17Rik, Gm10619, Gm14244, 4930477E14Rik, RP23-46B12.8, 1520401A03Rik, A730090N16Rik, Gm13589 being the top 20. They also identified a subset of lncRNAs that escape meiotic sex chromosome inactivation at the pachytene stage of meiosis and others with strong testicular expression pattern, suggesting their importance in spermatogenesis. Lastly, they generated a knock out mouse having the deletion of one X-linked lncRNA, Tslrn1 (testis-specific long noncoding RNA1) and found that males carrying this deletion displayed normal fertility, but a significant reduction in sperm count [103]. This shows its participation in the regulation of spermatogenesis, though the molecular mechanisms of its action remain to be investigated.

Zhanget al. (2017) undertook strand-specific RNA sequencing that revealed a large repertoire of lncRNAs in mouse mature sperm [104]. They identified 20,907 known and 4088 novel lncRNAs transcripts in sperm. Chenet al. (2018) undertook single-cell-RNA sequencing on mouse germ cells at mitotic, meiotic and post-meiotic stages in order to identify the molecular events occurring during male germ cell development and to reveal several novel crucial regulators of mammalian spermatogenesis [105]. A large proportion of known protein-coding genes (18,037 out of 20,088, 89.8%) were identified in the spermatogenic cells. They also identified 9431 out of 11,962 (78.8%) annotated lncRNAs to be expressed in the spermatogenic cells, which had different spatio-temporal expression. The highest numbers and the expression level of lncRNAs were found in the diplotene, MI spermatocytes and steps 6–8 spermatids.

Studies in other animals

Selvaraju et al. (2017) undertook sequencing to identify the spermatozoal transcripts in fresh bull semen [111] (Table 2). They found that spermatozoa retain a variety of RNAs, including lncRNAs. The most abundant lncRNAs reported in this study were NONBTAT002138.2, NONBTAT029740.1, NONBTAT026069.2, NONBTAT026075.2, NONBTAT015718.2, NONBTAT015717.2, NONBTAT017665.2, NONBTAT027794.1, NONBTAT007060.2, NONBTAT029554.1, NONBTAT008960.2, NONBTAT022624.2, NONBTAT030080.1, NONBTAT030770.1, NONBTAT030342.1, NONBTAT030589.1, NONBTAT031209.1, NONBTAT022014.2, NONBTAT025041.2, and NONBTAT001981.2. It remains to be seen if some of these lncRNAs match with human or rodent sperm.

Yanli et al. (2017) conducted RNA sequencing to identify lncRNAs and their role in the testes development of high-grain (HG) diet fed sheep [112]. A total of 6460 lncRNAs were reported. Further, on comparing the lncRNAs expressed in testes of hay and HG diet groups, researchers identified 28 up-regulated and 31 down-regulated lncRNAs differentially expressed between the two groups. Ten differentially expressed lncRNAs were randomly selected to validate the RNA sequencing results by using qRT-PCR. These lncRNAs were XR_001435329.1, XR_001025228.2, XR_0010443569.1, XR_001042765.2, XR_001045031.2, XR_001040775.1, XR_001434819.1, XR_001044933.2, XR_001044935.2, XR_001044859.2. This study apart from providing lncRNA profile of sheep testis also suggested a significant role of 59 lncRNAs in regulating the effect of nutrition on fertility.

In another study, Wang et al. (2019) undertook an integrated analysis of lncRNAs and mRNAs in high and low motility Holstein bull sperm, in order to identify mRNAs regulated by lncRNAs and their impact on sperm motility [113] (Table 2). They reported 11,561 lncRNAs in sperm, of which 2517 were differentially expressed between high and low motility sperm groups. The top 20 significantly differentially expressed lncRNAs reported were TCONS_00000538,TCONS_00003123, TCONS_00005494, TCONS_00007217, TCONS_00008747, TCONS_00009226, TCONS_00011237, TCONS_00012048, TCONS_00012181, TCONS_00012775, TCONS_00013706, TCONS_00014744, TCONS_00014816, TCONS_00015123, TCONS_00019053, TCONS_00020130, TCONS_00021031, TCONS_00021657, TCONS_00024090 and TCONS_00025506. They also found that out of the 20,875 protein coding genes detected in semen, 19 were differentially expressed between high and low motility groups. Further, they found that lncRNA TCONS_000417333 targets a gene EFNA1 (ephrin A1), which is involved in male reproductive physiology. Several other lncRNAs and mRNAs identified in this study are good targets for further studies. This is a landmark study in identifying bull sperm motility and fertility lncRNA markers, which can find potential application in animal husbandry.

Functional lncRNAs in spermatogenesis

Many potential lncRNAs have been identified in male germ cell development, some of them showing differential expression between fertile and infertile sperm. However, only a few have been functionally annotated and characterized [1] (Fig. 4). Below are some lncRNAs, which have been shown to participate in spermatogenesis.


Circular RNAs promote transcription

Exon-derived circular RNAs (circRNAs) are abundant in animal cells the cell-specific expression of many of them suggests that they have regulatory roles, but these roles are largely unknown. Li et al. have now identified circRNAs that contain introns and that regulate gene transcription in cis by forming specific interactions with the U1 small nuclear ribonucleoprotein RNA (snRNA).

To examine whether circRNAs are involved in transcription regulation, the authors isolated non-coding RNAs from human cells that were crosslinked to and immunoprecipitated with RNA polymerase II (Pol II). Out of 111 Pol II-interacting circRNAs, 15 were further validated to be circular and to contain introns between the circularized exons they were therefore named exon–intron circRNAs (EIciRNAs). Two circRNAs, EIciEIF3J and EIciPAIP2, were investigated in detail depleting them decreased the transcription levels of the corresponding EIF3J oder PAIP2 Gene. Furthermore, RNA–DNA double fluorescence vor Ort hybridization (FISH) revealed that EIciEIF3J and EIciPAIP2 colocalize with EIF3J und PAIP2, respectively, but not with flanking genes, suggesting that they regulate the transcription of their parental genes in cis (although they might also affect other loci in trans).

Next, the authors found that EIciEIF3J and EIciPAIP2 co-precipitated with the U1 snRNA and proteins (U1 snRNPs a pre-mRNA maturation complex), and with the promoters of the parental genes. Moreover, EIciEIF3J and EIciPAIP2 each have one potential U1 snRNA–binding site at their retained introns, and sterically blocking them with antisense molecules decreased the interactions of the EIciRNAs with U1 snRNA and Pol II, the binding of these factors to the EIF3J und PAIP2 promoters, and the transcription of the parental genes.

“the interactions between U1 snRNA and . EIciEIF3J and EIciPAIP2 promote the transcription of EIF3J und PAIP2

In summary, the interactions between U1 snRNA and the U1-binding sites of EIciEIF3J and EIciPAIP2 promote the transcription of EIF3J und PAIP2, bzw. There is evidence that generating circRNAs might compete with pre-mRNA maturation, but once produced, EIciRNAs could establish positive feedback loops for their own expression as well as for that of their parental genes.


Evidence that introns and other non-coding RNAs have function

Examples of intronic and other non-protein-coding RNAs that contain functional information are increasingly coming to light ( Askew and Xu, 1999 Eddy, 1999 ) (see also below). One interesting subclass of these are small nucleolar RNAs (snoRNAs), which are produced from intronic RNAs derived from genes encoding ribosomal proteins and nucleolar proteins, as well as from other genes whose exons no longer have any protein coding capacity ( Maxwell and Fournier, 1995 Tycowski et al., 1996 Filipowicz, 2000 ). These introns are processed through pathways involving endonucleolytic cleavage by double-stranded RNase III-related enzymes, exonucleolytic trimming and possibly RNA-mediated cleavage, which occur in large complexes called exosomes ( Allmang et al., 1999 van Hoof and Parker, 1999 ).

Other interesting examples of non-coding RNAs with functional activity are the small temporal RNAs lin-4 und lass-7, which control developmental timing in C. elegans via RNA–RNA interactions that affect the translation and stability of other transcripts ( Moss, 2000 ). lass-7 is conserved among vertebrates and invertebrates ( Pasquinelli et al., 2000 ). These small RNAs are derived from larger precursors and are around 22 nucleotides in length, similar to the size of RNAs produced by RNA interference (RNAi)-mediated RNA processing (see below). Indeed, it has been shown recently that the production of these RNAs is dependent on homologs of the Dicer and RDE-1 families of proteins that are also involved in RNAi ( Grishok et al., 2001). It is quite conceivable that such pathways are involved in the downstream processing of a wide range of intronic and other non-coding RNAs, whose products may number in the tens or hundreds of thousands and which may act as guide RNAs to regulate many different processes. There are many other examples of non-coding RNAs that have a role during development in both animals and plants, including Xist and roX1/roX2 which are involved in dosage compensation, as well as H19, Pgc, NTT, bic, BORG, BC200, his-1, Bsr, hsr-omega, ENOD40, CR20, among many others ( Nakamura et al., 1996 Teramoto et al., 1996 Liu et al., 1997 Tam et al., 1997 Takeda et al., 1998 Eddy, 1999 Komine et al., 1999 Erdmann et al., 2001). Some of these RNAs are alternatively spliced or have alternative polyadenylation sites and are probably derived from genes that have lost their protein coding capacity.

It seems safe to predict that the vast majority of non-coding RNAs have not yet been catalogued (see e.g. Ashe et al., 1997 ), as most genomic screens have been intrinsically biased against their discovery ( Eddy, 1999 ). It is only recently that some attempts to do this more systematically have been initiated ( Olivas et al., 1997 Hüttenhofer et al., 2001). In addition, it is likely that single-base mutations in non-coding RNAs will be hard to detect phenotypically. As is the case for promoters, such sequences may be somewhat more flexible than are protein-coding sequences, especially if the affected RNAs are part of a scale-free network that is resistant to damage ( Albert et al., 2000 ). On the other hand, it is relatively easy to find mutations in genomic sequences encoding non-coding RNAs by insertional and deletional mutagenesis, as in the case for the Drosophila bithorax locus referred to above.


What is Noncoding DNA

Noncoding DNA is the other type of DNA in the genome, accounting for 99% of the human genome. Significantly, it does not encode for protein-coding genes. Thereby, it does not provide instructions for the synthesis of proteins. Generally, the types of noncoding DNA in the genome include regulatory elements, noncoding RNA genes, introns, pseudogenes, repeating sequences, and telomeres.

Regulatory Elements

The main function of regulatory elements is to provide sites for the binding of transcription factors to regulate the expression of genes. Usually, there are two types of regulatory elements cis-regulatory elements and trans-regulatory elements. Normally, cis-regulatory elements occur close to the gene to be regulated while trans-regulatory elements occur distantly to the gene to be regulated.

Figure 2: Role of Regulatory Elements

Moreover, these regulatory elements include promoters, enhancers, silencers, and insulators. Generally, the protein machinery responsible for transcription binds to the promoter. Also, transcription factors, which activate gene expression bind to enhancers while those repress the gene expression bind to silencers. On the other hand, enhancer-blockers, which prevent the action of enhancers and barriers, which prevent structural changes, repressing gene expression bind to insulators.

Noncoding RNA Genes

For instance, noncoding RNA genes are responsible for the synthesis of noncoding RNAs rather than mRNAs. Basically, there are three types of noncoding RNAs tRNAs, rRNAs, and other regulatory RNAs such as miRNAs.

Figure 3: Noncoding RNA

Significantly, the main function of the noncoding RNAs is to take part in translation and the regulation of gene expression.

Introns

Introns occur interrupting the coding region of protein-coding genes. Generally, they are removed after transcription by splicing exons to obtain an undisturbed coding region.

Pseudogene

Pseudogenes are the genes, which lost their protein-coding ability. Also, they arise due to retrotransposition or genomic duplication of functional genes, and become “genomic fossils”.

Repeating Sequences

Repeating sequences include transposons and viral elements. However, they are mobile elements. Here, transposons undergo transposition as mobile DNA elements while viral elements or retrotransposons move by a ‘copy and paste’ mechanism through transcription.

Telomere

Telomeres are repetitive DNA, which occurs at the end of chromosomes. They are responsible for preventing chromosomal deterioration during DNA replication.


Researchers identify non-coding RNA molecule in trypanosome parasites

Researchers at Bar-Ilan University in Israel have identified a non-coding RNA molecule that regulates protein translation in Trypanosomatids, single-cell parasites that cause major diseases affecting millions of people. The discovery may lead to the development of novel medications, based on anti-sense RNA, to treat, and prevent the spread of, these diseases. Indeed, the recent success in RNA delivery in the vaccine for COVID-19, holds promise for this biotechnological approach. Credit: Bar-Ilan University

Trypanosomatids are single-cell parasites that cause major diseases, such as sleeping sickness and Rose of Jericho, which affect millions of people. Trypanosoma parasites are transmitted to mammals by the blood-sucking tsetse fly. The parasite's stopover in the insect-host consists of two stages. They live in the insect's gut for two to three weeks and then migrate to the saliva glands. When the fly eats its next meal, the parasites are transferred via saliva to the prey, infecting its bloodstream. In this way mammals become host to the parasite, and the disease is spread.

Prof. Shulamit Michaeli, vice president for research and a faculty member of the Mina and Everard Goodman Faculty of Life Sciences at Bar-Ilan University, has made significant strides in understanding the internal functions of trypanosomatids. Now, she and a team of scientists have identified a non-coding RNA (ncRNA) molecule that regulates protein translation in the parasite. The finding was recently published in the journal iScience.

All proteins, which determine hereditary traits, are encoded in DNA. DNA is "locked" in the nucleus of the cell, which is barely permeable, and thus, one of the important functions of RNA is to transport the information stored in DNA from the nucleus inside the cell to ribosomes outside the cell. This is accomplished through messenger RNA (mRNA), a copy of DNA that enters the ribosomes. The factory-like ribosomes subsequently translate this information and synthesizes proteins. This is the template according to which proteins are made.

The ribosome is composed of ribosomal RNA (rRNA), and proteins. Additional molecules also regulate its activity. One such molecule is non-coding RNA (ncRNA), which controls mRNA function and determines whether mRNA molecules survive or degrade, and whether or not they are translated into proteins.

The ncRNA molecule identified by Michaeli originates from the gene that encodes for rRNA. When rRNA is processed in the cell, unnecessary domains in the RNA are spliced or processed out. These domains usually undergo degradation, and until now their purpose was unknown and considered insignificant. However, Michaeli and team showed that these domains are actually used to produce ncRNA regulating translation, a function never previously known to occur in trypanosome parasites. "These organisms found a special localization for ncRNA. This novel ncRNA interacts with rRNA when it is formed in the nucleus and moves with it to the cytoplasm, where translation and protein synthesis takes place," says Prof. Michaeli.

Prof. Michaeli developed a method that captures the interaction between ncRNA and mRNA which is based on cross-linking via UV radiation. "We can then sequence these hybrid molecules so that we know which molecules interact with each other. This is very elegant, because it enables us to discover which genes are regulated by these novel, non-coding RNA based on the idea 'tell me who you interact with or who your friends are, and I'll tell you who you are." We were able to elucidate ncRNA in such a way that we could learn about the molecules with which they interact and regulate."

This finding in one species leads Michaeli to believe that it may also be common to the entire family of trypanosomatids, and may even exist in other organisms. "Years ago people referred to introns (information that is spliced out of RNA during its maturation) of mRNA as "junk," though it was subsequently discovered that such introns carry information for non-coding RNAs. However, nobody ever suggested that ncRNA exist in rRNA introns," adds Michaeli.

Prof. Michaeli's discovery may lead to the development of novel medications to treat, and prevent the spread of, the diseases caused by trypanosomatids based on anti-sense RNA. RNA therapy will be useful in the future for many diseases, including infectious diseases, since these can be used to interfere with their regulatory function. Indeed, the recent success in RNA delivery in the vaccine for COVID-19, holds promise for this biotechnological approach.


Perspective

Recent research into ncRNAs has highlighted their roles in epigenetics. The data generated over the last few years have indicated that in addition to their negative effects, positive functions have also been found, which has extended our knowledge and understanding of ncRNAs. Uhler et al. ( 2007 ) showed that an unstable ASRNA across the PHO5 promoter plays a role in activation, but not repression, in S. cerevisiae. Abrogation of this ASRNA clearly leads to a slower rate of chromatin remodelling during the transcriptional activation of PHO5. A new mechanistic role of ncRNAs was demonstrated in the genetic activation of eukaryotes. In the fission yeast Schizosaccharomyces pombe, ncRNAs transcribed by RNAP II are required for chromatin remodelling at the fbp+ locus during transcriptional activation (Hirota et al., 2008 ). Some ncRNAs, such as miRNA, snoRNA and piRNA, have been linked to specific disease states including cancer, and the de-regulation of several ncRNAs has been associated with cancers of the colon, prostate, liver, ovary, breast, cervix, tongue and oesophagus, as well as lymphomas and leukaemias. Such relationships suggest that ncRNAs can serve as markers that can be used as novel targets for early diagnosis and prognosis, and for drug development (Costa, 2005 Lin et al., 2007 Perez et al., 2008 ). Although there have been many exciting discoveries, the possible functional mechanisms remain poorly understood. We have just begun to lift the veil on non-coding transcription, and surely this will be a fascinating field that will attract and reward scientists in the coming years.