Information

Welcher Server für die Berechnung des Volumens und der zugänglichen Oberfläche von Proteinen verwendet werden soll

Welcher Server für die Berechnung des Volumens und der zugänglichen Oberfläche von Proteinen verwendet werden soll


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich möchte die zugängliche Oberfläche und das Volumen eines Proteins ermitteln, indem ich die PDB-Datei als Eingabe für das Protein angebe. Ich habe zwei Server verwendet, 3vee und Vadar. Für die PDB-ID 1LTM geben mir die Websites unterschiedliche Volumen- und Oberflächenmaße wie folgt an:
3vee (Vol: 50951 A^3; Oberfläche: 10837 A^2)
Vadar (Vol: 40937,8 A^3; Oberfläche: 14680,6 A^2)
Kann mir jemand sagen, welcher Server verwendet werden soll, welcher Server genauer ist? Wenn Sie einen anderen Server kennen, der genaue Ergebnisse liefert, lassen Sie es mich bitte auch wissen.
Notiz: Beide Veröffentlichungen stammen von Nucleic Acids Research, ich denke, ich muss sie nicht validieren. 3vee wurde 2010 mit 164 Zitationen veröffentlicht und Vadar wurde 2003 mit 416 Zitationen veröffentlicht. Ist es in Ordnung, wenn ich 3vee nehme, da es das neueste Tool ist?


Sie können PDBSum- und PDBe-PISA-Server verwenden, um die zugängliche Oberfläche und die vergrabene Oberfläche zu berechnen, und den Castp-Server, um Taschen in Ihrem Proteinmolekül zu finden. Wenn Ihr Protein kugelförmig ist, können Sie den Durchmesser in Pymol messen und sein Volumen berechnen. Ich hoffe es hilft.


Die Ergebnisse hängen von den Atomradien und den Sondenradien ab. Ohne sie ist es unmöglich, eine Meinung über die Volumina und Oberflächenwerte zu haben.

Unter Verwendung von C=1,75, N=1,55, O=1,4, S=1,8 und Hinzufügen von 1,4 für die Sonde, Ausführen der interaktiv in ASV-Ausgaben verfügbaren Monte-Carlo-Methode für 10000000 zufällige Punkte (nur ATOM-Datensätze wurden eingegeben): V = 57335,548996 +/- 1,96*34,439 ; S = 14887,818374 +/- 1,96*20,345

Sie können ASV herunterladen von: http://petitjeanmichel.free.fr/itoweb.petitjean.freeware.html ; Es ist kein Installationsvorgang erforderlich, markieren Sie die Binärdatei einfach mit dem Befehl chmod als ausführbar. Monte-Carlo f77-Quellroutinen werden ebenfalls mitgeliefert.

Verweise:
M. Petitjean, J. Comput. Chem.-Nr. 1994, 15[5], 507-523;
M. Petitjean, Spheres Unions and Intersections und einige ihrer Anwendungen in der molekularen Modellierung. In: Distance Geometry: Theory, Methods, and Applications, Kap.4, S.61-83, Springer, 2013.


Welcher Server für die Berechnung des Volumens und der zugänglichen Oberfläche von Proteinen verwendet werden soll - Biologie

Fläche/Volumen aus dem Web verwendet die StrucTools Server zur Berechnung von Atomoberflächen und Voronoi-Volumina aus molekularen Koordinaten. Die berechneten Werte werden als Atomattribute zugewiesen. Siehe auch: Volumen und Fläche messen, CASTp-Daten, Oberfläche, vergrabene Fläche messen

Beachten Sie, dass bei der Generierung einer molekularen Oberfläche in Chimera automatisch die gesamten analytischen lösungsmittelzugänglichen und lösungsmittelausgeschlossenen Bereiche im Antwortprotokoll, und die Werte pro Atom und Rest werden als Attribute namens . zugewiesen BereichSAS und BereicheSES. Diese Werte entsprechen direkt der molekularen Oberfläche in Chimera und hängen von den gleichen Parametern (VDW-Radien und verschiedene molekulare Oberflächeneinstellungen) ab. Dagegen sind nur die Einstellungen im Fläche/Volumen aus dem Web Dialoge werden an die StrucTools Server und andere Parameter wie VDW-Radien werden ausschließlich durch den dem Server zugrunde liegenden Prozess bestimmt.

Es gibt mehrere Möglichkeiten zu starten Fläche/Volumen aus dem Web, ein Werkzeug in der Oberflächen-/Bindungsanalyse Kategorie. Im resultierenden Dialog können ein oder mehrere Molekülmodelle aus den Moleküle Liste oder Ketten aus der Ketten aufführen.

    Begehbare Fläche (Gerstein) [Details bei StrucTools]

  • Oberflächensondengröße (1.3/1.4/1.5/1.6)
  • Atome zu verwenden (Keine Wärme/Atome + Wärme/Alle Atome außer Wasser)
    *Wasserstoffe werden ignoriert
  • Oberflächensondengröße (1.3/1.4/1.5/1.6)
  • Atome zu verwenden (Keine Hitze/Atoms + Hetatms/Alle Atome außer Wasser)
  • Methode (Normale Voronoi/Methode B/Radikale Ebene/Modifizierte Methode B)
  • Radien (Chothia Radien/Richards-Radien)
  • Atome zu verwenden (Keine Hitze/Atoms + Hetatms/Alle Atome außer Wasser)
    *Wasserstoffe werden ignoriert
  • Rendern öffnen/nach Attribut auswählen - ob man anfangen soll Nach Attribut rendern/auswählen, das ein Histogramm von Attributwerten anzeigt und es ermöglicht, sie farblich zuzuordnen oder als Auswahlkriterien zu verwenden. Die Atomwerte und Summen pro Rest werden automatisch im Dialog als Atom- bzw. Restattribute aufgelistet. Auch wenn diese Option nicht verwendet wird, sind die Attribute weiterhin verfügbar in Nach Attribut rendern/auswählen wenn es später in der Sitzung gestartet wird.
  • Serverausgabe in Datei speichern - ob die HTML-Ausgabe vom Server als Datei gespeichert werden soll
  • Serverausgabe im Browser anzeigen - ob die HTML-Ausgabe in einem Browserfenster angezeigt werden soll

Die transformierten Koordinaten der Atome in dem/den gewählten Modell(en) oder Kette(n) werden an die StrucTools Server, wo sie kollektiv behandelt werden. Wenn beispielsweise Proteine ​​in zwei verschiedenen Modellen positioniert werden, um einen Komplex zu bilden, unterscheiden sich die Ergebnisse, die für jedes Protein erhalten werden, wenn beide Modelle ausgewählt werden, von den Ergebnissen, die für jedes Protein separat erhalten werden. Die Koordinaten enthalten in Chimera vorgenommene Änderungen, wie z. B. Bindungsrotationen. Andere Eingaben wie Atom- und Sondenradien werden jedoch nur vom Server und den Einstellungen im Fläche/Volumen aus dem Web Dialog. Die Atomradien und molekularen Oberflächeneinstellungen in Chimera werden nicht verwendet.

Für jedes Attribut werden den Atomen die vom Server berechneten Werte zugewiesen (Oberfläche in Å 2 , Volumen in Å 3 ). Die Gesamtfläche oder das Gesamtvolumen und die Anzahl der zugewiesenen Atome sind in der angegeben Antwortprotokoll und Statuszeile. Wenn die Ausgabe Daten für weniger Atome enthält, als an den Server gesendet wurden, gibt eine Warnmeldung die Anzahl der &ldquomissing&rdquo-Werte an. Dies ist recht häufig und gibt selten Anlass zur Besorgnis, zum Beispiel wenn die Keine Hitze Wenn die Option ausgewählt ist, erfolgt keine Ausgabe für solche Atome. Atomen, die in der Serverausgabe fehlen, werden keine Attributwerte zugewiesen, und Atomen mit nicht berechenbaren Voronoi-Volumen wird kein Volumenwert zugewiesen. Attributwerte können über Gruppen von Atomen mit dem Attributrechner.


Ergebnisse

Hintergrund

Proteinfaltung ist ein Prozess, bei dem ein Polypeptid von einem ungefalteten Zustand in einen nativen Zustand übergeht. Während native Zustände gut untersucht sind, sind entfaltete Zustände schwieriger zu charakterisieren. Der hydrophobe Effekt ist die treibende Kraft bei der Proteinfaltung, bei der sich hydrophobe Gruppen vom Wasser weg in einen lösungsmittelgeschützten hydrophoben Kern bewegen. Beim Falten geht die lösungsmittelzugängliche Oberfläche (ASA) zwischen dem nativen (gefalteten) und dem ungefalteten Zustand verloren. Während wir die ASA für den nativen Zustand leicht berechnen können (zum Beispiel mit dem Algorithmus von Lee und Richards [1] oder äquivalenten in Programmen wie Chimera [2]), ist die Berechnung für ASA für das ungefaltete Protein schwieriger. Es wurden mehrere Veröffentlichungen veröffentlicht, die behaupten, die besten Modelle zur Berechnung der ASA des ungefalteten Proteins zu haben, oder haben solche Modelle verglichen oder vorgeschlagene Modelle angepasst [3–10]. Wir möchten diese Methoden berücksichtigen und eine für die Verwendung in einer neuen Datenbank von Proteinen am besten geeignete bestimmen (ACPro, die Amherst College Protein Folding Kinetics Database, verfügbar unter: https://www.ats.amherst.edu/protein/) organisiert basierend auf denen mit Falt- und Entfaltungsinformationen. Wir untersuchen kurz die Literatur, in der diese ASA-Berechnungsmethoden für entfaltete Zustände vorgeschlagen werden.

Robertson und Murphy veröffentlichten eine Übersicht, die sich auf die Beziehung zwischen Proteinstabilität und -struktur konzentrierte, die mit thermodynamischen Parametern aus kalorimetrischen und spektroskopischen Studien und Strukturmodellen aus Röntgenkristallographie und NMR-Spektroskopie erstellt wurde [11]. Als Teil ihrer Analyse werden zugängliche Oberflächenänderungen zwischen nativem und ungefaltetem Zustand für eine Reihe von Proteinen untersucht, wobei die ungefaltete ASA für jeden Aminosäuretyp auf einem erweiterten Ala-Xaa-Ala-Tripeptid basiert, wobei Xaa ein Platzhalter für . ist diese Aminosäure. Es werden Korrekturen für Termini-Effekte vorgenommen. Die Ala-Xaa-Ala-Tripeptid-Methode ist eine der einfachsten Methoden zur Bestimmung einer Schätzung für ungefaltetes ASS und wurde ursprünglich von Zielenkiewisz und Saenger vorgeschlagen [3].

Es gibt viele weitere Methoden zur Bestimmung von ungefalteten Schätzungen von ASA. Wir untersuchen einige rechnerisch schnelle und leicht verständliche Methoden, da wir eine für die Verwendung in einer öffentlich zugänglichen Datenbank auswählen möchten. Creamer, Srinivasan und Rose schlagen Alternativen zum Tripeptidmodell vor [5, 6]. Als Alternativen schlagen sie zwei Modelle vor, die das erwartete Verhalten eines ungefalteten Proteins eingrenzen. Das erste Modell liefert obere Schrankenwerte für die entfaltete ASA. Diese oberen Grenzwerte basieren auf simulierten flexiblen Peptiden, die aus einer Hard-Sphere-Approximation für ASA- und Kettendimensionen modelliert wurden. Die Verwendung der Näherung harter Kugeln führt zu expandierten Peptiden, die den verfügbaren Konformationsraum frei erkunden, im Vergleich zu tatsächlichen Peptiden, die intramolekulare Anziehungskräfte erfahren, die zu einem weiteren Kettenkollaps führen. Folglich schließen diese simulierten Peptide Volumeneffekte aus und werden stärker ausgedehnt als tatsächlich entfaltete Peptide. Das zweite Modell ist für untere Grenzwerte von ASA. Die unteren Grenzwerte werden aus Proteinfragmenten modelliert, die aus vollständig gefalteten Strukturen herausgeschnitten wurden. Da die ASA-Werte in diesem Modell aus Fragmenten bestimmt werden, die aus gefalteten Proteinen herausgeschnitten wurden, liefern sie eine untere Grenze für ungefaltetes ASA. Das Konformationsverhalten ungefalteter Peptide liegt somit zwischen den beiden Grenzen. In ihrer Analyse haben Creamer et al. argumentieren, dass die Tripeptidmodelle den Flächenverlust überschätzen [5]. Sie zeigen zum Beispiel, dass die Alanin-Seitenkette im Zentrum eines 11-Reste-entfalteten Polyalanyl-Peptids bei der Helixbildung wenig bis gar keine Fläche verliert und eine Valin-Seitenkette im Durchschnitt an Fläche in der Helix zunimmt. Ein Tripeptidmodell würde schlussfolgern, dass sowohl Alanin- als auch Valinseitenketten bei der Helixbildung an Oberfläche verlieren. 1997 haben Creamer et al. das Modell der oberen Grenze bei der Erweiterung auf den Backbone-Fall angepasst, wobei der Ansatz von Spolar et al. [4] und gibt an, dass dies ähnliche Werte wie ihr vorheriger Ansatz ergab und weniger rechenintensiv ist [6]. Um einen Kompromiss zwischen den von Creamer et al. vorgeschlagenen Modellen der oberen und unteren Grenze zu erzielen, verwendeten andere Forscher den Durchschnitt der beiden Grenzen, wodurch effektiv ein drittes Modell für ungefaltetes ASA bereitgestellt wurde [7, 8].

Vor kurzem schlugen Gong und Rose eine neue Methode zur Berechnung von lösungsmittelabhängigen ASAs von Aminosäureresten in ungefalteten Proteinen vor [10], die sie in erster Linie mit der von Creamer et al. [6]. Sie argumentieren, dass die Methode zur Mittelung der ASA-Reste der ungefalteten Zustände zwischen der Obergrenze und der Untergrenze unbefriedigend ist, da ihr eine strenge physikalische Grundlage fehlt. Die eigene Methode von Gong und Rose hingegen basiert auf physikalischer Grundlage, um die Oberflächen von Rückgrat- und Seitenkettenresten zu berechnen, indem Daten von Peptiden verwendet werden, die durch Variieren der möglichen Diederwinkel erzeugt wurden, um mit zulässigen Regionen des Konformationsraums zusammenzufallen. Sie verwenden intramolekulare Wasserstoffbrückenbindungsstärken, um lösungsmittelabhängige Effekte durch eine Boltzmann-gewichtete Verteilung der Lösungsmittelqualität durch einen „Wasserstoffbrücken-Zifferblatt“ zu modellieren. Als Funktion der Wasserstoffbrückenbindungsstärke aufgetragen, beschreibt die Boltzmann-gewichtete Konformerenverteilung eine sigmoidale Kurve mit einem Übergangsmittelpunkt nahe -1,5 kcal/mol pro Wasserstoffbrückenbindung. Für das Rückgrat ähneln diese mittleren ASA-Werte den Obergrenzen von Creamer und überschreiten in einigen Fällen sogar die in [6] festgelegten Obergrenzen. Die Autoren argumentieren, dass dies auf die erhöhte Flexibilität in diesem neuen Modell zurückzuführen ist. Gong und Rose geben zu, dass ihr Modell unvollkommen ist, weil das Wasserstoffbrücken-Zifferblatt nicht alle möglichen energetischen Begriffe verwendet [10]. Aufgrund des „Zifferblatts“ liefern Gong und Rose ASA-Werte, wenn das „Zifferblatt“ auf „Aus“ und in der Übergangsmitte steht. Für die Terminologie nennen wir die „Aus“-Werte die oberen Schranken und die Übergangsmittelpunktwerte die unteren Schranken für diese Methode, analog zu [6]. Die Mittelung der Werte an den beiden Grenzen ergibt einen Durchschnittswert für den Vorschlag von Gong und Rose.

Schließlich untersuchen wir eine rechenintensivere Methode, ProtSA, vorgeschlagen von Bernado et al. [9]. Die Methode wird durch eine Webanwendung [12] (abrufbar unter: http://webapps.bifi.es/protsa/#Xbernado:2006) zur Verfügung gestellt und berechnet sequenzspezifische Protein-Lösungsmittel-Zugänglichkeiten im ungefalteten Ensemble durch Simulation des ungefalteten Proteins Many mal und kombiniere die Ergebnisse. In den Simulationen wird das Strukturmodell zur Beschreibung der entfalteten Konformationen, die für das ungefaltete Protein repräsentativ sind, durch den Flexible-Meccano-Algorithmus generiert. Die Analysesoftware ALPHASURF wird verwendet, um die Zugänglichkeit von atomaren Lösungsmitteln zu berechnen. Die Forscher berichten in [9] über viele Beispiele (und Simulationen) den durchschnittlichen ASA für jede Aminosäure, aber die Webanwendung ermöglicht auch die Generierung nicht statischer Werte [12].

Obwohl diese Liste von Methoden nicht vollständig ist (der Leser wird für eine vollständigere Übersicht auf [9] verwiesen), glauben wir, dass es sich um eine repräsentative Stichprobe von zu vergleichenden Methoden handelt. In diesem Hinweis verwenden wir statistische Analysen, um die von diesen Methoden erzeugten ASA-Werte zu vergleichen, um signifikante Unterschiede zwischen den Methoden zu finden, falls vorhanden. Wir vergleichen die Tripeptid-Methode (Ala-Xaa-Ala), Creamer et al. Obergrenze, Untergrenze und Durchschnittsmethode, Gong und Rose Durchschnitts- und Untergrenze (Übergangsmittelpunkt) Methoden, ProtSA statisch (basierend auf Durchschnittswerten) und Webserverwerte. Einzelheiten zu Berechnungen finden Sie im Abschnitt Methoden. Wir vergleichen auch die resultierenden Änderungen der für Lösungsmittel zugänglichen Oberfläche und ihre Beziehungen mit etablierten Variablen in der Literatur aus [11].

Entfaltete ASA-Ergebnisse

Um die Unterschiede zwischen den sieben ungefalteten ASA-Methoden (ohne das Tripeptidmodell) aufzuzeigen, untersuchen wir die Werte, die sie einzelnen Aminosäuren in Tabelle 1 zuordnen. Es ist ziemlich offensichtlich, dass die einzelnen Aminosäurewerte zwischen den Methoden stark variieren, aber wir wissen nicht, ob diese Sorte zu signifikant unterschiedlichen Gesamtwerten der ungefalteten ASA für Proteine ​​führt. Um für jedes Protein einen gesamten ungefalteten ASA-Wert zu erhalten, wie in Methoden ausführlich beschrieben, ordnen wir die Werte aus Tabelle 1 den entsprechenden Aminosäuren in jedem Protein zu oder wir beziehen die Werte vom ProtSA-Webserver, je nach Methode, und summieren Sie sie (nach Berücksichtigung von Termini-Effekten).

Als nächstes untersuchen wir eine Reihe von Boxplots, die die gesamten ungefalteten ASA-Werte über einen Satz von 51 Proteinen (Abbildung 1) zeigen, die ausgewählt wurden, um mit dem Datensatz von [11] abzugleichen. Dieser Datensatz ist mittelgroß, und wir möchten natürlich, dass so viele Daten wie möglich bei unserer Auswahl einer ungefalteten ASA-Berechnungsmethode helfen. Obwohl die Größe des Datensatzes den Schlussfolgerungen einige Einschränkungen auferlegen kann, konnten wir keinen größeren Datensatz mit den notwendigen Informationen finden, um unsere Analyse zu erweitern. Unsere Analyse ist dennoch in der Lage, Methodenunterschiede aufzuzeigen und uns bei der Entscheidung über die Methodenauswahl für unsere Datenbank zu unterstützen.

Boxplots mit ungefalteter, lösungsmittelzugänglicher Oberfläche. Ungefaltete ASA-Werte werden zum Vergleich zwischen den Methoden für den Satz von 51 Proteinen bereitgestellt.

Wir vermerken mehrere Schlüsselmerkmale in Abbildung 1. Erstens gibt es einige Ausreißer, bei denen es sich bei jeder Methode um dieselben Proteine ​​handelt (Proteindatenbankdateien (PDBs): 1ABE, 2CAB, 5PEP, 3PSG, 3SIC und 2ST1). Als nächstes sehen die Verteilungen von ProtSA static und ProtSA (Webserver) sehr ähnlich aus, aber die statischen ProtSA-Werte sind relativ zu den Webserverwerten etwas nach oben verschoben. Wir sehen Beweise, die bestätigen, was in [10] gesagt wurde, dass die Methode der unteren Grenze (Übergangsmittelpunkt) von [10] zu ähnlichen Werten führt wie die von Creamer et al. Upper-Bound-Methode aus [6]. Die untere Grenze von Creamer et al. -Methode scheint Werte zu liefern, die denen von ProtSA (statisch und Webserver) am ähnlichsten sind.

Als Nächstes untersuchen wir Boxplots der ASA-Änderung über die acht Methoden (einschließlich der vorherigen sieben Methoden und Tripeptidwerte aus [11]), wie in Abbildung 2 gezeigt. Einzelheiten zu den Berechnungen finden Sie unter Methoden. Die Tripeptidwerte (Ala-Xaa-Ala) scheinen etwas höher zu sein als die von Creamer et al. Methode (wie in [5] vorgeschlagen), aber nicht viel. Dies führt zu einer natürlichen Frage. Sind die Unterschiede in den Boxplots signifikant? Daher wenden wir uns unserer statistischen Analyse zu.

Boxplots der Änderung der für Lösungsmittel zugänglichen Oberfläche. Änderungen der ASA-Werte werden zum Vergleich zwischen den Methoden bereitgestellt, einschließlich der Tripeptidergebnisse für die Untergruppe von 44 Proteinen.

Änderung der ASA-Ergebnisse

Wir berechneten die Änderung der ASA-Werte vom ungefalteten in den gefalteten Zustand, nachdem wir mit Chimera gefaltete ASA-Schätzungen erhalten hatten [2]. Einzelheiten zu Berechnungen finden Sie unter Methoden. Gepaarte t-Tests zur Suche nach Unterschieden in der mittleren Änderung der ASA-Werte wurden durchgeführt, um festzustellen, ob die in den Boxplots beobachteten Unterschiede signifikant sind oder nicht (ähnliche Ergebnisse werden erhalten, wenn eine solche Analyse nur an den mittleren ungefalteten ASA-Werten aufgrund der der einzige Unterschied in den Werten ist eine deutliche konstante Verschiebung für jedes Protein) mit Anpassungen bei der Bestimmung der Signifikanz aufgrund von Mehrfachtests. Diese Analyse und alle nachfolgenden Analysen werden an der Untergruppe von 44 Proteinen durchgeführt, bei denen die Proteingröße dem Wert der Anzahl der Reste aus der Übersichtsarbeit von [11] entsprach, so dass vergleichbare Werte verglichen wurden. Die gepaarten t-Tests zeigten, dass nur vier Kontraste (Methodenpaare) zu einem unbedeutenden Ergebnis führten. Die unbedeutenden Kontraste bestanden zwischen der Tripeptid- und der durchschnittlichen Gong/Rose-Methode, der Tripeptid- und der unteren Gong/Rose-Methode, dem Tripeptid und der oberen Grenze Creamer et al. Methoden, und die untere Gong/Rose und die obere Grenze Creamer et al. Methoden. Alle anderen Methodenpaare führten zu statistisch signifikant unterschiedlichen mittleren Veränderungen der ASS-Werte der untersuchten Proteine. Die statische ProtSA-Änderung der ASA-Werte lag im Durchschnitt etwa 225 Einheiten über der ProtSA-Webserver-Änderung der ASA-Werte pro Protein, so dass dies trotz ihrer Ähnlichkeit in den Boxplots ein signifikanter Unterschied war. Da viele der Methoden zu signifikant unterschiedlichen Veränderungen der ASA pro Protein führen, müssen wir festlegen, welche Methode wir in der Datenbank ACPro verwenden möchten. Als nächstes betrachten wir, welche Methode (wenn überhaupt) im Verhältnis zur Leistung der Tripeptid-Methode in Bezug auf die in [11] untersuchten Beziehungen zu Veränderungen der ASS „beste“ ist, da die neueren Methoden eine stärkere physikalische Grundlage haben.

Um einen Basislinien-Leistungsschwellenwert festzulegen, berechnen wir den R-Quadrat-Wert (aus einer einfachen linearen Regression) zwischen der Tripeptid-Änderung des ASS-Werts auf der 44-Protein-Untergruppe und jeder untersuchten Variablen in einer Beziehung zur Veränderung des ASS in [11]: Anzahl der Reste (Nres), Wärmekapazitätsänderung beim Entfalten (ΔCP), Entfaltungsenthalpie bei 60 °C (ΔH(60)) und bei 100 °C (ΔH*) und Entfaltungsentropie bei 60 °C (ΔS(60)) und bei 112 °C (ΔS*). Dann berechnen wir R-Quadrat-Werte aus Regressionen unter Verwendung der Änderung der ASA-Werte der anderen Methode und derselben Variablen. Die resultierenden R-Quadrat-Werte sind in Tabelle 2 angegeben.

Basierend auf den Ergebnissen in Tabelle 2 stellen wir fest, dass zwischen den Methoden, bei denen die Änderung der ASS als die besten drei Prädiktoren für jede Antwortvariable identifiziert wurde, die Unterschiede in den R-Quadrat-Werten (die geringfügigen Unterschieden in den Korrelationen entsprechen), sind nicht groß genug, um statistisch signifikant zu sein. In der Tat wäre dies bei den meisten Methoden (und wir beschränken uns nicht einmal auf die drei stärksten Beziehungen) der Fall. Die Methode, die hinsichtlich dieser Beziehungen der Leistung der Tripeptid-Methode am nächsten kommt, ist die Gong/Rose-Methode der unteren Grenze (Übergangsmittelpunkt).

Basierend auf unseren Ergebnissen verwendet die frei verfügbare ACPro-Datenbank mit Informationen zur Proteinfaltungskinetik die Gong/Rose-Methode der unteren Grenze (Übergangsmittelpunkt) zur Berechnung der ungefalteten ASA für die berichteten Proteine. Die Begründung ist wie folgt: Die Methode hat eine starke physikalische Grundlage wie in [10] bereitgestellt, ist nicht rechenintensiv und Termini-Effekte sind leicht zu handhaben. Obwohl diese Methode signifikant andere Schätzungen der ASA liefert als einige der anderen Methoden, leidet sie nicht in Bezug auf ihre Leistung in Schlüsselbeziehungen mit zuvor untersuchten thermodynamischen Variablen.


CASTp

Die CASTp (Cberechnet EINtlas von SDein Gesicht TOpographie von Proteins) Webserver ist ein Online-Tool, das die Taschen auf den Proteinoberflächen und die Hohlräume im Inneren von Proteinen lokalisiert, vermisst und charakterisiert. Diese Oberflächentaschen und Hohlräume sind die konkaven Regionen von Proteinen, die normalerweise mit Bindungsaktivitäten korreliert sind. CASTp verwendet die Alpha-Form und den Taschenalgorithmus, der in der Computergeometrie entwickelt wurde (Jie Liang et al., 2003), um die Oberflächentaschen und Hohlräume in Proteinen abzugrenzen und zu messen. In CASTp werden die Oberflächentaschen als konkave Regionen von Proteinen mit Bindungsstellen an der Öffnung erklärt. Diese Taschen ermöglichen auch einen einfachen Zugang von Wassermolekülen von außen. Die Hohlräume werden als versteckte Leerstellen im Inneren von Proteinen beschrieben, die für Wassermoleküle nach Entfernung aller Heteroatome von außen unzugänglich sind.

Abbildung 1: Die Bindungstasche (grün) der HIV-1-Protease (1hte). Der Ligand Gr12397(gelb) besetzt die Bindungsstelle.

Das CASTp-Online-Tool analysiert alle Oberflächentaschen und inneren Hohlräume auf der dreidimensionalen Struktur eines Proteins und bietet auch eine detaillierte Charakterisierung aller Atome, die an der Bildung dieser Hohlräume und Taschen beteiligt sind. CASTp verwendet sowohl das lösungsmittelzugängliche Oberflächenmodell (Richards-Oberfläche) als auch das molekulare Oberflächenmodell (Connolly-Oberfläche), um die Fläche und das Volumen jedes Hohlraums und jeder Tasche analytisch zu messen. Die für Lösungsmittel zugängliche Oberfläche, auch bekannt als Richards-Moleküloberfläche, ist die Oberfläche eines Biomoleküls, die für ein Lösungsmittel zugänglich ist. Darüber hinaus misst CASTp auch die Größe der einzelnen Taschen und Mundöffnungen. Dies ermöglicht es, die Zugänglichkeit von Bindungsstellen für verschiedene Liganden und Substrate zu bestimmen. Die Berechnung oder Oberflächenanalyse von Proteinen mit CASTp hat eine Reihe von Vorteilen in biologischen Studien.

Die annotierten funktionellen Informationen von Proteinen sind auch in der neuen Version von CASTp enthalten. Diese Annotationen stammen aus der Proteindatenbank (PDB), Swiss-Prot sowie der Online Mendelian Inheritance in Man (OMIM), und letztere enthält Informationen zu den varianten Single Nucleotide Polymorphisms (SNPs), von denen bekannt ist, dass sie Krankheiten verursachen.

In diesem Experiment wird die CASTp-Onlineressource verwendet, die über verfügbar isthttp://cast.engr.uic.edu

Joe Dundas, Zheng Ouyang, Jeffery Tseng, Andrew Binkowski, Yaron Turpaz und Jie Liang. 2006. CASTp: berechnete Daten der Oberflächentopographie von Proteinen mit struktureller und topographischer Kartierung von funktionell annotierten Resten. Nukl. Säureres., 34:W116-W118.


Abstrakt

Im modernen Wirkstoffdesign ist es von großem Interesse, die freien Energien der Protein-Ligand- oder Nukleinsäure-Ligand-Bindung genau zu berechnen. MM-PBSA (Molekularmechanik Poisson-Boltzmann-Oberfläche) und MM-GBSA (Molekularmechanik verallgemeinerte Born-Oberfläche) haben auf diesem Gebiet an Popularität gewonnen. Bei beiden Methoden wird die Konformationsentropie, die normalerweise durch Normal-Mode-Analyse (NMA) berechnet wird, benötigt, um die absoluten freien Bindungsenergien zu berechnen. Leider ist NMA rechenintensiv und wird zu einem Flaschenhals der MM-PB/GBSA-NMA-Methoden. In dieser Arbeit haben wir einen schnellen Ansatz entwickelt, um die Konformationsentropie basierend auf Berechnungen der lösungsmittelzugänglichen Oberfläche abzuschätzen. In unserem Ansatz wird die Konformationsentropie eines Moleküls, S, kann durch Summieren der Beiträge aller Atome erhalten werden, unabhängig davon, ob sie vergraben oder freigelegt sind. Jedes Atom hat zwei Arten von Oberflächen, Lösungsmittel zugängliche Oberflächen (SAS) und vergrabene SAS (BSAS). Die beiden Oberflächentypen werden gewichtet, um den Beitrag eines Atoms zu abzuschätzen S. Atome mit dem gleichen Atomtyp haben das gleiche Gewicht und einen allgemeinen Parameter k wird angewendet, um die Beiträge der beiden Arten von Oberflächen auszugleichen. Dieses Entropiemodell wurde unter Verwendung einer großen Menge kleiner Moleküle parametrisiert, für die ihre Konformationsentropien auf dem B3LYP/6-31G*-Niveau unter Berücksichtigung des Lösungsmitteleffekts berechnet wurden. Das gewichtete lösungsmittelzugängliche Oberflächenmodell (WSAS) wurde in drei Tests umfassend evaluiert. Zur Bequemlichkeit, TS Werte, das Produkt der Temperatur T und Konformationsentropie S, wurden in diesen Tests berechnet. T wurde durch den Text immer auf 298,15 K gesetzt. Zunächst wurden gute Korrelationen zwischen WSAS TS und NMA TS für 44 Protein- oder Nukleinsäuresysteme, die mit Molekulardynamiksimulationen beprobt wurden (10 Schnappschüsse wurden für Postentropieberechnungen gesammelt): die Quadrate des mittleren Korrelationskoeffizienten (R 2) war 0,56. Was die 20 Komplexe betrifft, so TS Änderungen bei Bindung TΔS Werte wurden ebenfalls berechnet, und der Mittelwert R 2 war 0,67 zwischen NMA und WSAS. Im zweiten Test, TS Die Werte wurden für 12 Protein-Ködersätze (jeder Satz hat 31 Konformationen) berechnet, die vom Rosetta-Softwarepaket generiert wurden. Auch hier wurden für alle Ködersätze gute Korrelationen erzielt: Mittelwert, Maximum und Minimum von R 2 waren 0,73, 0,89 bzw. 0,55. Schließlich wurden die freien Bindungsenergien für 6 Proteinsysteme (die Anzahl der Inhibitoren reicht von 4 bis 18) unter Verwendung von vier Bewertungsfunktionen berechnet. Im Vergleich zu den gemessenen freien Bindungsenergien ist der Mittelwert R 2 der sechs Proteinsysteme waren 0,51, 0,47, 0,40 und 0,43 für MM-GBSA-WSAS, MM-GBSA-NMA, MM-PBSA-WSAS bzw. MM-PBSA-NMA. Die mittleren Effektivfehler der Vorhersage betrugen entsprechend 1,19, 1,24, 1,41, 1,29 kcal/mol für die vier Bewertungsfunktionen. Daher erreichten die beiden Bewertungsfunktionen, die WSAS verwenden, eine vergleichbare Vorhersageleistung wie die Bewertungsfunktionen, die NMA verwenden. Hervorzuheben ist, dass vor der WSAS-Berechnung im letzten Test keine Minimierung durchgeführt wurde. Obwohl WSAS nicht so rigoros ist wie physikalische Modelle wie quasi-harmonische Analyse und thermodynamische Integration (TI), ist es rechnerisch sehr effizient, da nur die Oberflächenberechnung beteiligt ist und keine strukturelle Minimierung erforderlich ist. Darüber hinaus hat WSAS eine mit der Normalmodusanalyse vergleichbare Leistung erreicht. Wir erwarten, dass dieses Modell in Bereichen wie High Throughput Screening (HTS), Molecular Docking und rationalem Proteindesign Anwendung finden könnte. In diesen Bereichen ist Effizienz entscheidend, da eine Vielzahl von Verbindungen, Docking-Posen oder Proteinmodellen evaluiert werden müssen. Eine Liste der Akronyme und Abkürzungen, die in dieser Arbeit verwendet werden, wird zum schnellen Nachschlagen bereitgestellt.


Andere Dateien und Links

  • APA
  • Standard
  • Harvard
  • Vancouver
  • Autor
  • BIBTEX
  • RIS

In: Bioinformatik, Vol. 2, No. 23, Nr. 24, 12.2007, p. 3397-3399.

Forschungsergebnis : Beitrag zu Zeitschrift › Artikel › peer-review

T2 - Ein Webserver zur Vorhersage von interagierenden Stellen auf Proteinoberflächen

N1 - Informationen zur Finanzierung: Dieses Projekt wird durch die NIH-Zuschüsse R21 AI055746 und R01 AI064913 an W.B. und NIH-Stipendium (5UO1-AI053858-03 Johnny Peterson, PI) an C.H.S.

N2 - Ein neuer Webserver, InterProSurf, sagt interagierende Aminosäurereste in Proteinen voraus, die aufgrund der 3D-Strukturen von Untereinheiten eines Proteinkomplexes am wahrscheinlichsten mit anderen Proteinen interagieren. Die Vorhersagemethode basiert auf einer lösungsmittelzugänglichen Oberfläche von Resten in den isolierten Untereinheiten, einer Neigungsskala für Grenzflächenreste und einem Clustering-Algorithmus zur Identifizierung von Oberflächenbereichen mit Resten mit hoher Grenzflächenneigung. Hier veranschaulichen wir die Anwendung von InterProSurf, um zu bestimmen, welche Bereiche von Bacillus anthracis-Toxinen und Masernvirus-Hämagglutinin-Protein mit ihren jeweiligen Zelloberflächenrezeptoren interagieren. Die rechnerisch vorhergesagten Regionen überlappen mit jenen Regionen, die zuvor durch Sequenzanalyse- und Mutagenese-Experimente als Grenzflächenregionen identifiziert wurden.

AB - Ein neuer Webserver, InterProSurf, sagt interagierende Aminosäurereste in Proteinen voraus, die aufgrund der 3D-Strukturen von Untereinheiten eines Proteinkomplexes am wahrscheinlichsten mit anderen Proteinen interagieren. Die Vorhersagemethode basiert auf der lösungsmittelzugänglichen Oberfläche von Resten in den isolierten Untereinheiten, einer Neigungsskala für Grenzflächenreste und einem Clustering-Algorithmus zur Identifizierung von Oberflächenbereichen mit Resten mit hoher Grenzflächenneigung. Hier veranschaulichen wir die Anwendung von InterProSurf, um zu bestimmen, welche Bereiche von Bacillus anthracis-Toxinen und Masernvirus-Hämagglutinin-Protein mit ihren jeweiligen Zelloberflächenrezeptoren interagieren. Die rechnerisch vorhergesagten Regionen überlappen mit jenen Regionen, die zuvor durch Sequenzanalyse- und Mutagenese-Experimente als Grenzflächenregionen identifiziert wurden.


Welcher Server für die Berechnung des Volumens und der zugänglichen Oberfläche von Proteinen verwendet werden soll - Biologie

Methode

Der POPScomp-Server ruft das POPS-Programm auf, um den lösungsmittelzugänglichen Oberflächenbereich (SASA) einer gegebenen PDB-Struktur zu berechnen. Für Protein- oder RNA/DNA-Komplexe erstellt der POPScomp-Server intern alle Paarkombinationen von Ketten, um die vergrabene SASA bei der Komplexierung zu berechnen. Einzelheiten zu diesen Funktionalitäten werden in den veröffentlichten Artikeln zu impliziten Lösungsmitteln, POPS und POPSCOMP erläutert. Die Liste der Veröffentlichungen finden Sie auf der Registerkarte 'Über'.

SASA-Tabellen werden ohne Werte initialisiert, daher sieht der Benutzer vor der Ausführung von 'Run POPScomp' nur den Tabellenkopf und darunter den Hinweis '0 bis 0 von 0 Einträgen anzeigen'. Nach Auswahl einer PDB-Datei und Drücken von 'Run POPScomp' führt der Server das POPS-Programm auf der ausgewählten PDB-Datei aus. Die Ausgabe sind SASA-Tabellen, die automatisch in die entsprechenden Registerkarten geladen werden. Der Erfolg der Berechnung wird als Exit-Code zurückgegeben und unter dem 'Run POPScomp'-Button angezeigt: 'Exit-Code: 0' bedeutet Erfolg und das sollten Sie erwarten, ansonsten konsultieren Sie die Registerkarte 'Exit-Codes'.

Ergebnisse

Die SASA-Ergebnisregisterkarten sind 'Atom', 'Residue', 'Chain' und 'Molecule'. Diese Registerkarten enthalten eine zweite Registerkartenebene, um die POPSCOMP-Funktionalität wie folgt unterzubringen. 'Eingabestruktur': SASA-Werte der PDB-Struktur als Eingabe. 'DeltaSASA': Der SASA-Unterschied zwischen isolierten Ketten und Kettenpaarkomplexen. 'Isolated Chains': SASA-Werte von isolierten Ketten. Nur Strukturen mit mehreren Ketten liefern Werte für die Registerkarten 'DeltaSASA' und 'Isolated Chains'.

Die Ergebnisse werden bis Mitternacht GMT-Zeit auf dem Server gespeichert und dann automatisch gelöscht. Bitte nutzen Sie die 'Download. ' Schaltflächen unter den Tabellen, um Ihre Ergebnisse im 'csv'-Format zu speichern. Die Schaltfläche „Alle Ergebnisse herunterladen“ im Seitenbereich gibt den gezippten Inhalt des gesamten Ausgabeverzeichnisses zurück, d. h. alle Ergebnisse, die für einen bestimmten POPScomp-Job erzeugt wurden.

Falls der Server nicht wie erwartet funktioniert oder serverbezogene Probleme geklärt werden müssen, senden Sie bitte eine E-Mail an die Betreuer: Jens Kleinjung ([email protected]) und Franca Fraternali ([email protected]). Bei Software- und Ausgabefehlern, Funktionsvorschlägen und ähnlichen Themen fügen Sie auf der POPScomp GitHub-Seite auf der Registerkarte Probleme einen Eintrag hinzu.

Glänzende App

Dies ist Version 3.1.7 der POPScomp Shiny App.

Für detaillierte Informationen über die Software besuchen Sie das POPScomp GitHub-Repository von Fraternali Lab. Die Wiki-Seiten enthalten detaillierte Installations- und Verwendungsanweisungen.

Verweise

Users publishing results obtained with the program and its applications should acknowledge its use by citation.

Implicit solvent

Fraternali, F. and van Gunsteren, W.F. An efficient mean solvation force model for use in molecular dynamics simulations of proteins in aqueous solution. Journal of Molecular Biology 256 (1996) 939-948. DOI Pubmed

Kleinjung, J. and Fraternali, F. Design and Application of Implicit Solvent Models in Biomolecular Simulations. Current Opinion in Structural Biology 25 (2014) 126-134. DOI Pubmed

POPS method

Fraternali, F. and Cavallo, L. Parameter optimized surfaces (POPS): analysis of key interactions and conformational changes in the ribosome. Nucleic Acids Research 30 (2002) 2950-2960. DOI Pubmed

POPS server

Cavallo, L., Kleinjung, J. and Fraternali, F. POPS: A fast algorithm for solvent accessible surface areas at atomic and residue level. Nucleic Acids Research 31 (2003) 3364-3366. DOI Pubmed

POPSCOMP server

Kleinjung, J. and Fraternali, F. POPSCOMP: an automated interaction analysis of biomolecular complexes. Nucleic Acids Research 33 (2005) W342-W346. DOI Pubmed

License and Copyright

Usage of the software and server is free under the GNU General Public License v3.0.

Copyright Holders, Authors and Maintainers

2002-2020 Franca Fraternali (author, maintainer)

2008-2020 Jens Kleinjung (author, maintainer)

Mitwirkende

2002 Kuang Lin and Valerie Hindie (translation to C)

2002 Luigi Cavallo (parametrisation)

Überblick

POPScomp uses a combination of *Shell* (system) calls and R *Shiny* routines. Therefore, the return value shown as exit code may come from *Shell* or *Shiny*. A successful run will return 'Exit code: 0'. Any error will return an exit code different from '0'. A commented list of exit codes is given below together with troubleshooting tips. In case you get stuck, please contact the maintainers.

Shell command exit codes

* 1 - Catchall for general errors

* 2 - Misuse of shell builtins (according to Bash documentation

* 126 - Command invoked cannot execute

* 128 - Invalid argument to exit

* 128+n - Fatal error signal 'n'

* 130 - Script terminated by Control-C

* 255* - Exit status out of range

Shiny exit codes

* No PDB source input! - Enter PDB identifier or upload PDB file from local file system at the top of the side panel.

* Two PDB sources input! - Only one PDB source is accepted per computation. Refresh the browser page and either speficy a PDB identifier or upload a PDB file, not both.

Troubleshooting Errors

Exit code: 1 AND Error: Cannot open the connection

The PDB file could not be read, most possibly because something went wrong during up/down-loading. If you used the 'Enter PDB entry' field, check your internet connection.


Abstrakt

We propose a pairwise and readily parallelizable SASA-based nonpolar solvation approach for protein simulations, inspired by our previous pairwise GB polar solvation model development. In this work, we developed a novel function to estimate the atomic and molecular SASAs of proteins, which results in comparable accuracy as the LCPO algorithm in reproducing numerical icosahedral-based SASA values. Implemented in Amber software and tested on consumer GPUs, our pwSASA method reasonably reproduces LCPO simulation results, but accelerates MD simulations up to 30 times compared to the LCPO implementation, which is greatly desirable for protein simulations facing sampling challenges. The value of incorporating the nonpolar term in implicit solvent simulations is explored on a peptide fragment containing the hydrophobic core of HP36 and evaluating thermal stability profiles of four small proteins.


PROTEIN TERTIARY STRUCTURE

Sites are offered for calculating and displaying the 3-D structure of oligosaccharides and proteins. With the two protein analysis sites the query protein is compared with existing protein structures as revealed through homology analysis.

Background: "Principles of Protein Structure, Comparative Protein Modelling and Visualization" by N. Guex & M.C. Peitsch (GlaxoWellcome, Switzerland) is here . To obtain PDB coordinates for a protein of your interest, go to the Protein Data Bank or Molecules to Go or NCBI.

PHYRE2 - P rotein homology/analogJa Recognition Engine - this is my favourite site for the prediction of the 3D structure of proteins. In each case I have used this site it has provide me with a model. Phyre2 uses the alignment of hidden Markov models via HHsearch to significantly improve accuracy of alignment and detection rate. It also incorporates a n ew ab initio folding simulation called Poing to model regions of your proteins with no detectable homology. ( Reference: Kelley LA et al. Nature Protocols 10: 845-858 (2015) .

CPHModels (Center for Biological Sequence Analysis, Technical University of Denmark) - currently consists of the following tools: Sowhat: A neural network based method to predict contacts between C-alpha atoms from the amino acid sequence. RedHom: A tool to find a subset with low sequence similarity in a database. Databases: Subsets of the Brookhaven Protein Data Bank (PDB) database with low sequence similarity produced using the RedHom tool.

SWISS-MODEL - (Glaxo-Wellcome Experimental Research, Switzerland) An automated comparative protein modelling server. Choose "First Approach mode". N.B. results come by E-mail and require a viewer such as DeepView - Swiss-PdbViewer, Rasmol, or Cn3D.

ORION - is a web server for protein fold recognition and structure prediction using evolutionary hybrid profiles. Various databases such as PDB, SCOP and HOMSTRAD can be mined to find an appropriate structural template. For the modeling step, a protein 3D structure can be directly obtained from the selected template by MODELLER and displayed with global and local quality model estimation measures. ( Reference: Ghouzam Y et al. (2016) Scientific Reports 6: 28268).

I-TASSER ONLINE - 3D models are built based on multiple-threading alignments by LOMETS and iterative TASSER simulations function inslights are then derived by matching the predicted models with protein function databases. I-TASSER was ranked as the No 1 server for protein structure prediction in recent CASP7 and CASP8 experiments. ( Reference: A. Roy et al. 2010. Nature Protocols 5: 725-738)

ESyPred3D - this automated homology modeling program derives benefit from a new alignment strategy using neural networks. Alignments are obtained by combining, weighting and screening the results of several multiple alignment programs. The final three dimensional structure is built using the modeling package MODELLER. ( Reference: C. Lambert et al. 2002. Bioinformatics 18: 1250-1256).

Robetta - is a protein structure prediction service that is continually evaluated through CAMEO. It features include an interactive submission interface that allows custom sequence alignments for homology modeling, constraints, local fragments, and more. It can model multi-chain complexes and provides the option for large scale sampling. It uses the PDB100 template database, which is updated weekly, a co-evolution based model database (MDB), and also provides the option for custom templates. ( Reference: Kim DE et al. (2004) Nucleic Acids Res 32(Web Server issue): W526-531).

PEP-FOLD 3 is a de novo approach aimed at predicting peptide structures from amino acid sequences. This method, based on structural alphabet SA letters to describe the conformations of four consecutive residues, couples the predicted series of SA letters to a greedy algorithm and a coarse-grained force field. ( Reference: Lamiable A, et al. Nucleic Acids Res. 2016 44(W1): W449-54).

(PS)2: protein structure prediction server predicts the three-dimensional structures of protein complexes based on comparative modeling furthermore, this server examines the coupling between subunits of the predicted complex by combining structural and evolutionary considerations. The predicted complex structure could be indicated and visualized by Java-based 3D graphics viewers and the structural and evolutionary profiles are shown and compared chain-by-chain.( Reference: T-T. Huang et al. 2015. Nucl. Acids Res. 43 (W1): W338-W342).

BetaCavityWeb: computing molecular voids and channels with their mass properties. The output consists of three components: 1) the number of cavities, 2) the atoms contributing to the boundary of each cavity, and 3) the geometric property of each cavity. Computational statistics are also reported. The probe radius of zero corresponds to the cavities existing in the van der Waals molecules. If the probe radius is nonzero, the cavities are thoese existing in the Lee-Richards (solvent accessible) model. ( Reference: J-K. Kim et al. 2015. Nucl. Acids Res. 43 (W1): W413-W418).

AS2TS system - offers a variety of resources for protein structural analysis using the LGA (local-global alignment) program to search for regions of local similarity and to evaluate the level of structural similarity between compared protein structures. To facilitate the homology-based protein structure modeling process, the AL2TS service translates given sequence&ndashstructure alignment data into the standard PDB coordinates ( Reference: A. Zemla et al. 2005. Nucl. Acids Res. 33: W111-W115).

3D-JIGSAW (Biomolecular Modelling Laboratory, Cancer Research UK, England) - homology modelling. Save email results as *.pdb and view with Rasmol etc.

RaptorX - consists of four major modules: single-template threading, alignment quality assessment, and multiple-template threading. ( Reference: Källberg, M. et al. 2012. Nat Protoc. 7(8):1511-1522).

WHAT IF Web Interface (Centre for Molecular and Biomolecular Informatics, University of Nijmegen, Holland) offers one a large number of tools for examining PDB files.

Protein Peeling - an approach for splitting a 3D protein structure into compact fragments - a method to identify small compact units (protein units (PU)) that compose protein three-dimensional structures. ( Reference: J.-C. Gelly et al. 2006. Bioinformatics 22: 129-133)

InterProSurf - predicts interacting amino acid residues in proteins that are most likely to interact with other proteins, given the 3D structures of subunits of a protein complex. The prediction method is based on solvent accessible surface area of residues in the isolated subunits, a propensity scale for interface residues and a clustering algorithm to identify surface regions with residues of high interface propensities. ( Reference: S.S. Negi et al. 2007. Bioinformatics. 23: 3397-3399)

ProtSkin converts a protein sequence alignment in BLAST, CLUSTAL or MSF format to a property file used to map the sequence conservation onto the structure of a protein using the GRASP, MOLMOL or PyMOL. A pseudo-PDB file with the sequence conservation score in place of the temperature factor is also provided, to use with programs such as InsightII (accelrys). ( Reference: Deprez, C. et al. 2005. J. Mol. Biol. 346: 1047-1057).

PSIPRED Protein Sequence Analysis Workbench - includes PSIPRED v3.3 (Predict Secondary Structure) DISOPRED3 & DISOPRED2 (Disorder Prediction) pGenTHREADER (Profile Based Fold Recognition) MEMSAT3 & MEMSAT-SVM (Membrane Helix Prediction) BioSerf v2.0 (Automated Homology Modelling) DomPred (Protein Domain Prediction) FFPred 3 (Eukaryotic Function Prediction) GenTHREADER (Rapid Fold Recognition) MEMPACK (SVM Prediction of TM Topology and Helix Packing) pDomTHREADER (Fold Domain Recognition) and, DomSerf v2.0 (Automated Domain Modelling by Homology). ( Reference: Buchan DWA et al. 2013. Nucl. Acids Res. 41 (W1): W340-W348).

MODELLER - comparative protein structure modelling by satisfaction od spacial constrains

Structures derived from NMR coordinates:

GeNMR (GEnerate NMR structure) - generates 3D protein structures using NOE-derived distance restraints and NMR chemical shifts. ( Reference: M. Berjanskii et al. 2009. Nucl. Acids Res. 37(Web Server issue):W670-W677)

Once you have a structure you may want to superimpose it on other molecules. To obtain PDB accession codes for a
protein of your interest, go to the Protein Data Bank

FATCAT (Flexible structure EINlignmenT von Chaining EINligned fragment pairs allowing Twists) is an approach for flexible protein
structure comparison. It simultaneously addresses the two major goals of flexible structure alignment optimizing the
alignment and minimizing the number of rigid-body movements (twists) around pivot points (hinges) introduced in the reference
Struktur. ( Reference: Y.Ye & A. Godzik. (2003) Bioinformatics 19: suppl. 2. ii246-ii255). This website provides access to a wide
range of protein tools.

Search for Similar Protein Structures by FATCAT - either upload local PDB files or simply provide PDB codes. For close homologs go here ( Reference: Y. Ye & A. Godzik. 2003. Bioinformatics 19(Suppl 2):II246-II255)

SuperPose - is a protein superposition server. It calculates protein superpositions using a modified quaternion approach. From a superposition of two or more structures, SuperPose generates sequence alignments, structure alignments, PDB coordinates, RMSD statistics, Difference Distance Plots, and interactive images of the superimposed structures. The SuperPose web server supports the submission of either PDB-formatted files or PDB accession numbers. ( Reference: Maiti, R. et al. 2004. Nucleic Acids Res. 32 (Web Server issue: W590-594).

MulPBA (multiple Protein Bsperren EINlignment) - is a tool for comparison of protein structures based on similarity in the local backbone conformation. The local backbone conformation is defined as pentapeptide dihedrals ( Reference: Léonard S et al. (2014) J Biomol Struct Dyn. 32(4): 661-668).

3D-Match - Comparing 3D structures of two proteins (Softberry)

iPBA - is a tool for comparison of protein structures based on similarity in the local backbone conformation. It presents an improved alignment approach using (i) specialized PB Substitution Matrices (SM) and (ii) anchor-based alignment methodology. ( Reference: Gelly, J.C. et al. 2011. Nucleic Acids Res. 39(Web Server issue):W18-23).

MAPSCI Multiple Alignment of Protein Structures and Consensus Identification. The algorithm represents each protein as a sequence of triples of coordinates of the alpha-carbon atoms along the backbone. It then computes iteratively a sequence of transformation matrices (i.e., translations and rotations) to align the proteins in space and generate the consensus. The algorithm is a heuristic in that it computes an approximation to the optimal alignment that minimizes the sum of the pairwise distances between the consensus and the transformed protein. ( Reference: Ilinkin, I. et al. 2010. BMC Bioinformatics. 11:71).

Rclick - this web server that is capable of superimposing RNA 3D structures by using clique matching and 3D least-squares fitting. Rclick has been benchmarked and compared with other popular servers and methods for RNA structural alignments. In most cases, Rclick alignments were better in terms of structure overlap. It also recognizes conformational changes between structures. ( References: Nguyen MN, & Verma C. 2015. Bioinformatics 31:966-968).

The NGL Viewer is a web application for the visualization of macromolecular structures. By fully adopting capabilities of modern web browsers, such as WebGL, for molecular graphics, the viewer can interactively display large molecular complexes and is also unaffected by the retirement of third-party plug-ins like Flash and Java Applets. Beautiful output. ( Reference: A.S. Rose & P.W. Hildebrand. 2015. Nucl. Acids Res. 43 (W1): W576-W579).

CEP: a conformational epitope prediction server - provides a web interface to conformational epitope prediction. The algorithm, apart from predicting conformational epitopes, also predicts antigenic determinants and sequential epitopes. The epitopes are predicted using 3D structure data of protein antigens, which can be visualized graphically. ( Reference: U. Kulkarni-Kale et al. 2005. Nucl. Acids Res. 33: W168-W171). The following is an example of an epitope (space-filled) mapped onto the partial surface (stick) of lysozyme:

PDB2MultiGIF (Central Spectroscopy Department - Molecular Modeling, Deutsches Krebsforschungszentrum, Germany) - if you want to present your model on a webpage in a similar manner to the three pictures on the entry page use this program. It takes the 3D structure (PDB file) and generates an animated image which can be displayed using any browser. There is considerable choice on the image size, number of frames and direction of rotation.

MovieMaker - a web server that allows short (

10 sec), downloadable movies to be generated of protein dynamics. It accepts PDB files or PDB accession numbers as input and automatically outputs colorful animations covering a wide range of protein motions and other dynamic processes. Users have the option of animating 1) simple rotation 2) morphing between two end conformers 3) short-scale, picosecond vibrations 4) ligand docking 5) protein oligomerization 6) mid-scale nanosecond (ensemble) motions and 7) protein folding/unfolding. MovieMaker is not a molecular dynamics server and does not perform MD calculations. ( Reference: R. Maiti et al. 2005. Nucl. Acids Res. 33: W358-W362)

COMBOSA3D - Coloring Of Molecules Based On Sequence Alignment (Paul Stoddard) - accepts a group of pre-aligned sequences in FASTA format (one of the sequences must have a solved three-dimensional structure), and it uses the alignment information to highlight conserved residues on the molecule. Three-dimensional structures are shown using a Chime plugin or one may use RasMol to view and color a molecule..

ProFunc: a server for predicting protein function from 3D structure - this program takes PDB files and carries out an awesome array of analyses including scans against PDB and motif databases, determination of surface morphology and conserved residues, and potential ligand-binding sites. ( Reference: R. A. Laskowski et al. 2005. Nucl. Acids Res. 33: W89-W93).

Predict Function from Structure:

ProFunc - is been developed to help identify the likely biochemical function of a protein from its three-dimensional structure using a variety of sequence- and structure-based methods ( Reference: Laskowski R.A. et al. 2005. Nukleinsäuren Res.33, W89-W93).

PROVEAN (Profitein Variation Effect EINnalyzer) is a software tool which predicts whether an amino acid substitution or indel has an impact on the biological function of a protein. ( Reference: Choi Y et al. 2012. PLoS One 7:e46688).

CUPSAT - Cologne University Protein Stability EINnalysis Tool - predicts changes in protein stability upon point mutations. The prediction model uses amino acid-atom potentials and torsion angle distribution to assess the amino acid environment of the mutation site. Additionally, the prediction model can distinguish the amino acid environment using its solvent accessibility and secondary structure specificity. ( Reference: Parthiban V, et al. (2006) Nucleic Acids Research, 34: W239-42.

Eris - is a protein stability prediction server. This server calculates the change of the protein stability induced by mutations (&Delta&DeltaG) utilizing the recently developed Medusa modeling suite. In our test study, the &Delta&DeltaG values of a large dataset (>500) were calculated and compared with the experimental data and significant correlations are found. The correlation coefficients vary from 0.5 to 0.8. Eris also allows refinement of the protein structure when high-resolution structures are not available. ( Reference: Yin, F. et al. Nature Methods 4: 466-467 2007). Requires registration.

AUTO-MUTE - AUTOmated server for predicting. functional consequences of amino acid MUTations in protEins - is a suite of programs measuring stability changes (&Delta&DeltaG, &Delta&DeltaGH2O, and &DeltaTm). ( Reference: Masso M. & Vaisman I.I. (2010) Protein Eng. Des. Sel. 23: 683-687).

DUET - Protein Stability Change Upon Mutation - a web server for an integrated computational approach for studying missense mutations in proteins. DUET consolidates two complementary approaches (mCSM and SDM) in a consensus prediction, obtained by combining the results of the separate methods in an optimised predictor using Support Vector Machines (SVM). ( Reference: D.E.V. Pires et al. 2015. Nucl. Acids Res. 42(1): W314-W319)

Pockets (active sites) in 3D structures of proteins:

metaPocket - Identification of cavities on protein surface using multiple computational approaches for drug binding site prediction ( Reference: Zhang, Z. et al. 2011. Bioinformatics, 27: 2083-2088).

POCASA (Bestellungcket-CAvity Search EINpplication) is an automatic program that implements the algorithm named Roll which can predict binding sites by detecting pockets and cavities of proteins of known 3D structure. ( Reference: Yu, J. et al. 2010. Bioinformatics 26: 46-52.)

Fpocket suite - three servers are available: (a) Fpocket: perform simple pocket detection (b) MDpocket: track pockets in molecular dynamics and, (c) Hpocket: view conserved pockets withing homologous proteins ( Reference: Schmidtke P et al. 2009. Nucleic Acids Res.10:168).

Mutation and crystallization:

SERp Server - Surface Entropy Reduction Prediction (SERp) is an exploratory tool to aid identification of sites that are most suitable for mutation designed to enhance crystallizability by a Surface Entropy Reduction approach. ( Reference: Goldschmidt L et al. 2007. Protein Sci. 16:1569-76).

Scratch Protein Predictor - (Institute for Genomics and Bioinformatics, University California, Irvine) - programs include: ACCpro: the relative solvent accessibility of protein residues CMAPpro: Prediction of amino acid contact maps COBEpro: Prediction of continuous B-cell epitopes CONpro: predicts whether the number of contacts of each residue in a protein is above or below the average for that residue DIpro: Prediction of disulphide bridges DISpro: Prediction of disordered regions DOMpro: Prediction of domains SSpro: Prediction of protein secondary structure SVMcon: Prediction of amino acid contact maps using Support Vector Machines and, 3Dpro: Prediction of protein tertiary structure (Ab Initio).


Accessible surface area from NMR chemical shifts

Accessible surface area (ASA) is the surface area of an atom, amino acid or biomolecule that is exposed to solvent. The calculation of a molecule’s ASA requires three-dimensional coordinate data and the use of a “rolling ball” algorithm to both define and calculate the ASA. For polymers such as proteins, the ASA for individual amino acids is closely related to the hydrophobicity of the amino acid as well as its local secondary and tertiary structure. For proteins, ASA is a structural descriptor that can often be as informative as secondary structure. Consequently there has been considerable effort over the past two decades to try to predict ASA from protein sequence data and to use ASA information (derived from chemical modification studies) as a structure constraint. Recently it has become evident that protein chemical shifts are also sensitive to ASA. Given the potential utility of ASA estimates as structural constraints for NMR we decided to explore this relationship further. Using machine learning techniques (specifically a boosted tree regression model) we developed an algorithm called “ShiftASA” that combines chemical-shift and sequence derived features to accurately estimate per-residue fractional ASA values of water-soluble proteins. This method showed a correlation coefficient between predicted and experimental values of 0.79 when evaluated on a set of 65 independent test proteins, which was an 8.2 % improvement over the next best performing (sequence-only) method. On a separate test set of 92 proteins, ShiftASA reported a mean correlation coefficient of 0.82, which was 12.3 % better than the next best performing method. ShiftASA is available as a web server (http://shiftasa.wishartlab.com) for submitting input queries for fractional ASA calculation.

Dies ist eine Vorschau von Abonnementinhalten, auf die Sie über Ihre Institution zugreifen können.


Schau das Video: Prismen - Zusammensetzen von Körpern. Prisma - Oberfläche berechnen. Mathe einfach erklärt (Kann 2022).