Information

B5. Analyse der Tertiärstruktur von Proteinen - Biologie

B5. Analyse der Tertiärstruktur von Proteinen - Biologie



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Das höchstauflösende Verständnis der Proteinstruktur erfordert eindeutig eine Lösung der 3D-Struktur des Proteins. Drei Methoden sind derzeit nützlich, um die 3D-Strukturen von Proteinen zu bestimmen.

A. Röntgenkristallographie

Wenn Kristalle des Proteins hergestellt werden können, können traditionelle Röntgenkristallographietechniken verwendet werden, um die Struktur zu lösen. Röntgenstrahlen bestrahlen einen Kristall, der die Röntgenstrahlen streut, was zu konstruktiven/destruktiven Interferenzmustern führt. Mit entsprechender Mathematik kann das Interferenzmuster in die tatsächliche Struktur des Proteins zurückverwandelt werden. Sehen Sie sich ein lustiges Beispiel an, das eine solche Rekonstruktion des Parthenons anhand seines Beugungsmusters zeigt!

Diese Strukturen sind keine Lösungsstrukturen, aber überwältigende Beweise deuten darauf hin, dass sie die Lösungsstruktur darstellen. Zum Beispiel enthält eine Röntgenstruktur viele Wassermoleküle, die miteinander und mit dem Protein interagieren, ein Befund, der für eine Struktur erwartet wird, die die Lösungsstruktur des Proteins darstellt. Darüber hinaus können Substrate und Inhibitoren in den Kristall infundiert werden und an das Protein binden, was wiederum auf eine native Struktur des Proteins im Kristall schließen lässt.

  • Tutorial zur Röntgenkristallographie

B. NMR

Es gibt viele Protonen in Proteinen, die ein Protonen-NMR-Spektrum ergeben. Das Problem liegt in der Zuordnung, da es so viele gibt. Kerne in unterschiedlichen Umgebungen absorbieren Energie bei unterschiedlichen Resonanzfrequenzen. Wenn ein Protonspin umgedreht wird, geht es in einen höheren Energiezustand über. Es wird mit einiger Zeitverzögerung in den Gleichgewichtszustand zurückkehren.

Abbildung: 1D-NMR-Spektren eines Proteins

Befindet sich ein nicht angeregtes Proton im Raum proximal, kann die Magnetisierung auf das nicht angeregte Proton übertragen werden. Diese Wechselwirkung ist umgekehrt proportional zur 6. Potenz des Abstands zwischen ihnen und ist die Grundlage des Nuclear Overhauser Effect (NOE). Ein 2D-NOE-Spektrum zeigt korrelierte Peaks abseits der Diagonale, was darauf hindeutet, dass sie im 3D-Raum nahe beieinander liegen.

Abbildung: 2D-NOSY-Spektren eines Proteins

Mehrdimensionale Techniken, die erhalten werden, wenn Isotope von N(15) und C(13) im Protein vorhanden sind, können verwendet werden, um tatsächlich eine 3D-Lösung eines kleinen Proteins zu erhalten. NMR- und Röntgenstruktur des Proteins sind fast überlagert.

Abbildung: NMR-Struktur von Proteinen

C. Homologiemodellierung

Die Struktur unbekannter Proteine ​​kann theoretisch modelliert werden, wenn sie eine weitgehende Sequenzhomologie zu einem anderen Protein mit bekannter Struktur aufweisen.

  • Homologiemodellierung: allgemeine Beschreibung
  • Homologiemodellierung für Anfänger: ein Kurs
  • ein automatischer vergleichender Proteinmodellierungsserver - vom Proteomics-Server The ExPASy (Expert Protein Analysis System) des Schweizerischen Instituts für Bioinformatik (SIB)
  • vergleichende Proteinmodellierung von ExPASy.

Um Proteine ​​genau zu charakterisieren, müssen sie natürlich aus einer Lösung gereinigt werden, die viele Proteine ​​enthält. Wir werden diese Techniken im Labor behandeln. Hier ist eine kurze Zusammenfassung einiger von ihnen:

  • Java-basierte Proteinreinigung von der University of Leeds (School of Biochemistry and Molecular Biology)

Experimentelle Strukturbiologie: Proteinkristallisation und Röntgenkristallographie

Dieses Kapitel soll den Grundlagen der wichtigsten experimentellen Methoden zur Bestimmung der tertiären Proteinstruktur gewidmet werden. Eine dieser Methoden, die Röntgenkristallographie, hat den größten Beitrag zu unserem Verständnis der Proteinstrukturen geleistet, obwohl die anderen Methoden unsere Daten ergänzt haben, wenn die Kristallographie aus dem einen oder anderen Grund nicht verwendet werden konnte.

Die primären experimentellen Methoden, die bei der Untersuchung der tertiären Proteinstruktur verwendet werden, umfassen:
◦ Proteinkristallographie
◦ Elektronenmikroskopie (und insbesondere Kryo-Elektronenmikroskopie): Elektronenkristallographie und Einzelpartikelrekonstruktion
◦ Kernspinresonanz (NMR-Spektroskopie)
◦ Röntgenkleinwinkel- und Neutronenstreuung (SAXS und SANS)
◦ Homologiemodellierung

Jede experimentelle Methode hat ihre Vorteile und Grenzen. So können Elektronenmikroskopie und insbesondere Cryo-EM, die eine höhere Auflösung bietet, verwendet werden, um relativ große Objekte wie Zellorganellen oder große makromolekulare Komplexe mit der Methode der Einzelpartikelrekonstruktion zu untersuchen. Ein Vorteil der Methode der Einzelpartikelrekonstruktion gegenüber der Proteinkristallographie besteht darin, dass das Protein nicht kristallisiert werden muss, da die Kristallisation in vielen Fällen schwierig und aufwendig sein kann. In der Elektronenkristallographie, die hauptsächlich für Membranproteine ​​verwendet wird, benötigen wir jedoch Kristalle, sogenannte zweidimensionale Kristalle eines Proteins. Kryo-EM erfordert auch geringe Materialmengen, was sowohl im Vergleich zur Kristallographie als auch zur NMR-Spektroskopie ein Vorteil ist. Die NMR erfordert viel größere Materialmengen und außerdem muss das untersuchte Protein bei Raumtemperatur über eine ziemlich lange Zeit der Datenerfassung stabil sein. Eine der Einschränkungen von Cryo-EM besteht darin, dass die erhaltene Auflösung im Allgemeinen im Vergleich zu der Auflösung begrenzt ist, die durch NMR-Spektroskopie oder Proteinkristallographie erhalten wird.

Die Proteinkristallographie kann eine atomare oder nahezu atomare Auflösung liefern, wenn kleine Details der Proteinstruktur mit sehr hoher Genauigkeit aufgelöst werden können. Obwohl die NMR-Spektroskopie diese Auflösung nicht bietet, erwies sich die Methode als wertvoll, wenn Details der Dynamik des Systems untersucht werden mussten oder ein Protein schwer zu kristallisieren ist.
SAXS und SANS, wie beispielsweise die Einzelpartikel-Elektronenmikroskopie, bieten eine begrenzte Auflösung der Strukturen. Wie bei der NMR werden die Messungen in Lösung durchgeführt, was den Vorteil hat, die Bedingungen des Experiments direkt in Lösung zu kontrollieren.
Homologiemodellierung kann auch verwendet werden, um dreidimensionale Strukturinformationen von Proteinstrukturen zu erhalten. Für eine genaue Modellierung benötigen wir jedoch eine hohe prozentuale Identität zwischen der Aminosäuresequenz des gegebenen Proteins und seinem Homologen, dessen Tertiärstruktur bekannt ist (der Matrize). Zusätzliche Methoden, die zur Gewinnung partieller (lokaler) Strukturinformationen verwendet werden, umfassen Massenspektrometrie, analytische Ultrazentrifugation, verschiedene fluoreszenzspektroskopische Methoden usw.

Ein Überblick über die Röntgenkristallographie
Kristallographie beginnt mit einem Kristall und um Kristalle zu erhalten, muss das Protein kristallisiert werden. Die Leute sagen oft: Kristallisation ist eine Kunst und keine Wissenschaft. Es stimmt bis zu einem gewissen Grad, es gibt noch einige allgemeine Prinzipien, die befolgt werden müssen, und vor allem gibt es verschiedene Methoden, die entwickelt wurden, um die Proteinkristallisation zu erleichtern. Nach dem Erhalten der Kristalle ist es Zeit für das röntgenkristallographische Experiment, bei dem der Kristall in einen Röntgenstrahl gelegt, gedreht und Beugungsdaten gesammelt werden. Nach der Datenerhebung wird der Rest der Arbeit mit spezialisierten Computerprogrammen erledigt. Zunächst gebe ich einen Überblick über die Kristallisationsmethode und Kristallisationswerkzeuge, gefolgt von einem Überblick über Kristallographie, Röntgendatenerfassung, Verfeinerung und Strukturqualität:


Proteinstruktur

Tertiärstruktur befasst sich mit der dreidimensionalen Anordnung aller Aminosäuren

Die Tertiärstruktur von Proteinen beschäftigt sich damit, wie die regionalen Strukturen im Raum zusammengesetzt sind. Beispielsweise können die α-Helices parallel zueinander oder rechtwinklig ausgerichtet sein. Die Tertiärstruktur bezieht sich also auf die Faltung der verschiedenen Segmente von Helices, Blättern, Windungen und dem Rest des Proteins in seine native dreidimensionale Struktur. Im Allgemeinen werden Membranproteine ​​in der Membran durch hydrophobe Alpha-Helices verankert, die in der Primärsequenz weit entfernt sein können, aber in der Tertiärstruktur des Proteins eng aneinander liegen.


Proteinorganisation: 4 Strukturen

Es ist die Beschreibung der Grundstruktur eines Proteins. Dies umfasst die Anzahl der Polypeptide, die Anzahl und die Sequenz der Aminosäuren in jedem Polypeptid. Letztere wird genetisch (durch DNA) durch Transkription und Translation bestimmt.

Spezifische Aminosäuren bestimmen die Stellen, an denen sich Polypeptide biegen oder falten sollen und wo die unterschiedlichen Längen zueinander angezogen werden. Der Abstand zwischen zwei benachbarten Peptidbindungen beträgt etwa 0,35 nm. Herkömmlicherweise wird das linke Ende der Proteinprimärstruktur durch die erste Aminosäure repräsentiert, während das rechte Ende durch die letzte Aminosäure repräsentiert wird.

2. Sekundärstruktur:

Es ist die Entwicklung neuer stearischer Beziehungen von Aminosäuren, die in der linearen Sequenz innerhalb der Polypeptide vorhanden sind. Einige der neuen Beziehungen sind regelmäßiger Natur und verleihen der Struktur Periodizität. Es gibt drei Arten von Sekundärstrukturen – α-Helix, β-Plissee und Kollagen-Helix.

Die Begriffe α und β bezeichnen einfach den ersten und den zweiten Typ von Sekundärstrukturen, die in Proteinen entdeckt wurden. In der α-Helix ist die Polypeptidkette spiralförmig gewunden, im Allgemeinen rechtshändig.

An manchen Stellen ist die Helix weniger regelmäßig und bildet zufällige Windungen. Die Helix wird durch Wasserstoffbrückenbindungen zwischen dem Sauerstoff der Carboxylgruppe (-CO-Gruppe) eines Aminosäurerests und der > NH-Gruppe des nächsten vierten Aminosäurerests stabilisiert.

Tatsächlich sind alle Hauptketten-CO- und >-NH-Gruppen Wasserstoffbrückenbindungen, α-helikal gewundene Sekundärstruktur findet sich in mehreren Proteinen, z. B. Keratin (Haare), Myosin, Tropomyosin (beide Muskeln), Epidermin (Haut), Fibrin gerinnen). Zwei oder mehr Polypeptide können sich weiter umeinander winden, um Kabel zu bilden. Dies ergibt einen spiralförmigen Strang.

In einer β-plissierten Sekundärstruktur werden zwei oder mehr Polypeptidketten durch Wasserstoffbrücken miteinander verbunden. Anstelle einer Faser oder eines Stabes wird in α-Helix ein Blatt hergestellt. Daher wird diese Sekundärstruktur oft als gefaltetes Blatt oder β-gefaltetes Blatt bezeichnet.

Benachbarte Polypeptidstränge können in die gleiche Richtung (paralleles β-Faltblatt, z. B. β-Keratin) oder in entgegengesetzte Richtungen (antiparalleles β-Faltblatt, z. B. Seidenfibroin) verlaufen. In einigen Fällen kann ein einzelnes Polypeptid in einem Teil eine &agr;-Helix aufweisen und in anderen Teilen gebogen werden, um zwei oder mehr parallele Stränge mit einer &bgr;-Faltenstruktur zu bilden, z. B. Ribonuklease. &bgr;-gefaltete Proteine ​​sind stärker gestreckt als solche mit a-Helix.

In Kollagen (dem am häufigsten vorkommenden Protein in unserem Körper) entdeckte Ramachandran (1954), dass im Allgemeinen drei Stränge oder Polypeptide umeinander gewunden sind (Abb. 9.15). Die Spirale wird durch die Bildung einer Wasserstoffbrücke zwischen der > NH-Gruppe des Glycinrests jedes Strangs mit der -CO-Gruppe der anderen beiden Stränge verstärkt. Auch mit Hilfe von Prolin- und Hydroxyprolin-Resten kommt es zu einem Locking-Effekt.

3. Tertiärstruktur:

Es gibt Biegen und Falten verschiedener Art zu Kugeln, Stäben oder Fasern. Es bringt außerdem neue Stearin-Beziehungen von Aminosäuren mit sich, insbesondere solchen, die in der linearen Sequenz weit auseinander liegen. Die aktiven Zentren (z. B. polare Seitenketten) des Proteins werden oft an die Oberfläche gebracht.

Bestimmte andere Seitenketten (z. B. hydrophob) werden in das Innere des Proteins gebracht. Die Tertiärstruktur wird durch mehrere Arten von Bindungen stabilisiert – Wasserstoffbrückenbindungen, ionische Bindungen, Van-der-Waal-Wechselwirkungen, kovalente Bindungen, hydrophobe Bindungen (Abb. 9.16). Die Tertiärstruktur verleiht dem Protein eine dreidimensionale Konformation (Abb. 9.17).

In der Proteinstruktur sind kovalente Bindungen am stärksten. Es gibt zwei Arten, Peptidbindungen und -SS-(Disulfid)-Bindungen. Ionische Bindungen oder elektrostatische Bindungen treten aufgrund der Anziehungskraft zwischen entgegengesetzt geladenen ionisierten Gruppen auf, z. B. -NH3 + und —COO –.

Wasserstoffbrücken entstehen durch die gemeinsame Nutzung von H + oder Protonen durch zwei elektronegative Atome, Van-der-Waals-Wechselwirkungen entwickeln sich mit Ladungsfluktuationen zwischen zwei nahe beieinander liegenden Gruppen (z. B. -CH2OH und -CH2OH). Zwischen zwei unpolaren Gruppen wird eine hydrophobe Bindung gebildet. Es hilft, Wasser in diesem Bereich auszuschließen und zu scheuen.

Die zur Bildung der Tertiärstruktur erforderlichen Bindungen können leicht durch hochenergetische Strahlungen, hohe Temperaturen, drastische pH-Änderungen und Schwermetallsalze gebrochen werden. Dieser Vorgang des Abbaus der Tertiärstruktur wird als Denaturierung bezeichnet.

Proteine ​​können auch durch verschiedene Chemikalien und niedrige Temperatur ausgefällt oder koaguliert werden. In einigen Fällen bewirkt die Entfernung des Denaturierungsmittels die Wiederherstellung der Bindungen, die für die Aufrechterhaltung der Tertiärstruktur erforderlich sind. Das Phänomen ­enon wird Renaturierung genannt.


B5. Analyse der Tertiärstruktur von Proteinen - Biologie

ONLINE-ANALYSE-TOOLS
(INTERNETRESSOURCEN für MOLEKULARBIOLOGEN)

Die Analyse von Nukleotid- und Proteinsequenzdaten war zunächst auf diejenigen beschränkt, die Zugang zu komplizierten Mainframe- oder teuren Desktop-Computerprogrammen hatten (zB PC/GENE, Lasergene, MacVector, Accelrys etc.). Die Verfügbarkeit von Online-Tools ermöglicht es selbst dem unerfahrenen Molekularbiologen, eine beträchtliche Menge an nützlichen Informationen aus Nukleotid- oder Proteinsequenzdaten abzuleiten. Für diejenigen ohne Erfahrung habe ich drei Sequenzen bereitgestellt: (a) eine DNA-Sequenz, (b) eine Proteinsequenz und (c) vier Proteinsequenzen, präsentiert im FASTA-Format. Bevor Sie eine Website ausprobieren, wählen Sie die Sequenz aus und kopieren Sie sie in die Zwischenablage. Jedes der Elemente in blauem Text ist mit einer Site im Web verlinkt. Jede dieser Websites verfügt über ein Feld, in das Sie Ihre Sequenz "einfügen" können. Klicken Sie auf die Schaltfläche "Suchen", "Ausführen" oder "Absenden". Verwenden Sie im Zweifelsfall die Standardeinstellung der Sites, aber für Abenteuerlustige bieten einige der Sites die Möglichkeit, die Suchstrategie zu ändern.


Proteinbioinformatik

Eine der dringendsten Aufgaben der Biotechnologie besteht heute darin, die Funktion jedes der tausenden neuen Gene zu erschließen, die täglich identifiziert werden. Wissenschaftler tun dies, indem sie Proteine ​​analysieren und interpretieren, die als Task Force eines Gens gelten. Diese Single-Source-Referenz deckt alle Aspekte von Proteinen ab, erklärt die Grundlagen, synthetisiert die neueste Literatur und zeigt die wichtigsten heute verfügbaren bioinformatischen Werkzeuge für die Proteinanalyse, -interpretation und -vorhersage. Studenten und Forscher der Biotechnologie, Bioinformatik, Proteomik, Proteintechnik, Biophysik, Computational Biology, Molecular Modeling und Drug Design finden hier eine schnelle Referenz, um in diesem sich schnell entwickelnden interdisziplinären Gebiet auf dem Laufenden und produktiv zu bleiben.

Eine der dringendsten Aufgaben der Biotechnologie besteht heute darin, die Funktion jedes der tausenden neuen Gene zu erschließen, die täglich identifiziert werden. Wissenschaftler tun dies, indem sie Proteine, die als Task Force eines Gens gelten, analysieren und interpretieren. Diese Single-Source-Referenz deckt alle Aspekte von Proteinen ab, erklärt die Grundlagen, synthetisiert die neueste Literatur und zeigt die wichtigsten heute verfügbaren bioinformatischen Werkzeuge für die Proteinanalyse, -interpretation und -vorhersage. Studenten und Forscher der Biotechnologie, Bioinformatik, Proteomik, Proteintechnik, Biophysik, Computational Biology, Molecular Modeling und Drug Design finden hier eine schnelle Referenz, um in diesem sich schnell entwickelnden interdisziplinären Gebiet auf dem Laufenden und produktiv zu bleiben.


Für eine Metasite, die mit einer Vielzahl von Online-Programmen zur Proteinsequenzanalyse und Strukturvorhersage verknüpft ist, empfehle ich PredictProtein (ROSTLAB, Technische Universität München). Siehe auch: SCRATCH Protein Predictor (Institut für Genomik und Bioinformatik, University of California, Irvine, USA)

Mehrere großartige Websites für die Online-Analyse potenzieller membranüberspannender Proteine ​​sind: (Prüfablauf sehen Orientierung von Proteinen in Membranen für 268 einzigartige a-helikale Membranproteinstrukturen)

TMpred - Vorhersage von Transmembranregionen und -orientierung - ISREC (Schweizerisches Institut für experimentelle Krebsforschung)
TMHMM - Vorhersage von Transmembranhelices in Proteinen (Zentrum für biologische Sequenzanalyse, Technische Universität Dänemark)
DAS - Transmembran-Vorhersageserver (Universität Stockholm, Schweden)
TEILT (D. Juretic, Univ. Split, Kroatien) - Der Server zur Vorhersage der Transmembran-Proteintopologie bietet eine klare und farbenfrohe Ausgabe, einschließlich Beta-Präferenz und modifiziertem hydrophoben Moment-Index.
OCTOPUS - Mit einer neuartigen Kombination aus Hidden-Markov-Modellen und künstlichen neuronalen Netzen sagt OCTOPUS die korrekte Topologie für 94% eines Datensatzes von 124 Sequenzen mit bekannten Strukturen vorher. (Referenz: Viklund, H. &

Phobius - ist ein kombinierter Transmembrantopologie- und Signalpeptid-Prädiktor (Referenz: L. Käll et al. 2004. J.Mol. Biol. 338: 1027-1036) Dieses Tool kann auch hier aufgerufen werden (EBI).

CCTOP (Consensus Cangespannt OBENologievorhersage)-Server - verwendet 10 verschiedene hochmoderne Topologievorhersagemethoden, der CCTOP-Server integriert Topologieinformationen aus bestehenden experimentellen und rechnerischen Quellen, die in den PDBTM-, TOPDB- und TOPDOM-Datenbanken verfügbar sind, unter Verwendung des probabilistischen Rahmens des Hidden-Markov-Modells. Der Server bietet die Möglichkeit, der Topologievorhersage eine Signalpeptidvorhersage und eine transmembran-globuläre Proteindiskriminierung voranzustellen. (Referenz: Dobson L et al. (2015) Nucleic Acids Res 43(W1): W408&ndashW412).

TMFoldWeb - ist die Webserver-Implementierung von TMFoldRec, einem Algorithmus zur Erkennung von Transmembran-Proteinfalten. TMFoldRec nutzt statistische Potenziale und verwendet Topologiefilterung und einen lückenlosen Threading-Algorithmus. Es stuft Vorlagenstrukturen ein und wählt die wahrscheinlichsten Kandidaten aus und schätzt die Zuverlässigkeit des erhaltenen Modells mit der niedrigsten Energie. Das statistische Potenzial wurde in einem Maximum-Likelihood-Framework auf einem repräsentativen Satz der PDBTM-Datenbank entwickelt. Laut Benchmark-Test beträgt die Leistung von TMFoldRec etwa 77 % bei der korrekten Vorhersage der Faltungsklasse für eine gegebene Transmembranproteinsequenz. (Referenz: Kozma D & Tusnády GE (2015) Biol Direct. 10: 54).

MEMSATSVM - ist eine verbesserte Vorhersage der Transmembranproteintopologie unter Verwendung von SVMs. Dieses Verfahren ist in der Lage, Signalpeptide von Transmembranhelices zu unterscheiden. (Referenz: Reeb J et al. (2015) Proteine 83(3): 473-84).

MITGLIED - Vorhersage der Membranproteinorientierung. ist in der Lage, sowohl alpha-helikale als auch beta-Barrel-Membranproteine ​​innerhalb der Lipiddoppelschicht schnell und genau auszurichten und zeigt eine bessere Übereinstimmung mit experimentell ermittelten Werten als bestehende Ansätze. Wir demonstrieren auch eine konsistente und signifikante Verfeinerung von Membranproteinmodellen und die effektive Unterscheidung zwischen nativen und Köderstrukturen (Referenz: Nugent T & DT Jones (2013) BMC Bioinformatics 14: 276)

RHYTHM - sagt die Orientierung von Transmembranhelices in Kanälen und Membranspulen voraus, insbesondere vergrabene gegenüber exponierten Rückständen. (Referenz: A. Rose et al. 2009. Nucl. Acids Res. 37(Webserverproblem):W575-W580)

TMMOD - Hidden-Markov-Modell für die Vorhersage der Transmembranproteintopologie (Abt. Computer & Informationswissenschaften, University of Delaware, USA) - Klicken Sie auf der Ergebnisseite auf " Posterior-Wahrscheinlichkeiten anzeigen", um ein Diagramm vom TMHMM-Typ zu sehen

PRED-TMR2 (C. Pasquier & S.J. Hamodrakas, Abt. Zellbiologie und Biophysik, Univ. Athen, Griechenland) - Bei Anwendung auf mehrere Testsätze von Transmembranproteinen liefert das System eine perfekte Vorhersagebewertung von 100 %, indem es alle Sequenzen in die Transmembranklasse einordnet. Nur 2,5% Fehlerrate bei Nichttransmembranproteinen.

TOPCONS - berechnet Konsensusvorhersagen der Membranproteintopologie unter Verwendung eines Hidden-Markov-Modells (HMM) und Eingaben von fünf hochmodernen Topologievorhersagemethoden. (Referenz: A. Bernsel et al. 2009. Nucleic Acids Res. 37(Webserverproblem), W465-8) . Für einen Batch-Server ohne BLAST-Läufe verwenden Sie TOPCONS single.

MINNOU ( mEmbrane-Protein ichdentifizierungn mitOUt explizite Verwendung von Hydropathie-Profilen und -Ausrichtungen) - sagt alpha-helikale sowie beta-Faltblatt-Transmembran(TM)-Domänen basierend auf einer kompakten Darstellung eines Aminosäurerests und seiner Umgebung voraus, die aus der vorhergesagten Lösungsmittelzugänglichkeit und der Sekundärstruktur jeder Aminosäure besteht. (Referenz: Cao et al. 2006. Bioinformatik 22: 303-309). Eine Legende zur Interpretation der Ergebnisse hier.

SuperLooper - bietet die erste Online-Schnittstelle für die automatische, schnelle und interaktive Suche und Platzierung von Loops in Proteinen. (Referenz: P. W. Hildebrand et al. 2009. Nucl. Acids Res. 37(Webserverproblem):W571-W574) )

Transmembrane Kink Predictor (TMKink) – Ein Kennzeichen der Membranproteinstruktur ist die große Anzahl verzerrter Transmembranhelices. Aufgrund der Prävalenz von Biegungen ist es wichtig, nicht nur zu verstehen, wie sie erzeugt werden, sondern auch zu lernen, wie ihr Auftreten vorhergesagt werden kann. Hier finden wir, dass es in geknickten Helices lokale Sequenzpräferenzen gibt, insbesondere eine höhere Prolinmenge, die ausgenutzt werden kann, um Biegungen aus lokalen Sequenzinformationen zu identifizieren. Ein neuronaler Netzprädiktor identifiziert über zwei Drittel aller Biegungen (Sensitivität 0,70) mit hoher Zuverlässigkeit (Spezifität 0,89). (Referenz: Meruelo AD et al. 2011. Protein Sci. 20:1256-64)

SCMMTP-Bewertungskartenmethode Membrantransportproteine: Identifizierung und Charakterisierung von Membrantransportproteinen unter Verwendung von Propensity-Scores von Dipeptiden. Die Trainings- und Testgenauigkeiten von SCMMTP betragen 83,81 % bzw. 76,11 %. (Referenz: Vasylenko, T. et al. 2015. BMC Bioinformatics, 16 (Ergänzung 1):S8, 2015)

Zum Zeichnen der Struktur von Transmembranproteinen stehen zwei Stellen zur Verfügung:

Protter - ein Open-Source-Tool zur interaktiven Integration und Visualisierung von annotierten und vorhergesagten Proteinsequenzmerkmalen zusammen mit experimentellen proteomischen Beweisen. Protter unterstützt zahlreiche proteomische Dateiformate und integriert automatisch eine Vielzahl von Referenzprotein-Annotationsquellen, die leicht über modulare Plug-Ins erweitert werden können. Eine integrierte Exportfunktion erzeugt maßgeschneiderte Proteinillustrationen in Publikationsqualität, auch für große Datensätze. (Referenz: U. Omasits et al. 2014. Bioinformatik. 30:884-886). Diagramm des mit Protter erzeugten Holins aus Bakteriophage Lambda:

TOPO2 (S. Johns, UCSF Sequence Analysis Consulting Service, USA) - Diese Site bietet erhebliche Kontrolle über die Präsentation. Hier finden Sie eine umfangreiche Dokumentation.

TMRPres2D (Trans M embrane protein R e-Präsentation in 2 D imensions tool) – dieses Java-Tool nimmt Daten von einer Vielzahl von Proteinfaltungsservern und erstellt einheitliche, zweidimensionale, hochgradig analysierte grafische Bilder/Modelle von alpha-helikalen oder Beta-Barrel-Transmembranproteine. (Referenz: I.C. Spyropoulos et al. 2004. Bioinformatik 20: 3258-3260).

Signalpeptiderkennung & subzelluläre Lokalisierung:

A. Bakterielle Proteine

PSORTb (Brinkman Lab, Simon Fraser Univ., Kanada) - liefert wahrscheinlich den genauesten Prädiktor für die subzelluläre Lokalisation von bakteriellen Proteinen. Alternativ PSORT . verwenden (Univ. Tokio, Japan) - eine Reihe von Programmen zur Vorhersage von Proteinlokalisationsstellen in Zellen. Wählen Sie spezielle Programme für tierische, Hefe-, Pflanzen- oder Bakterienproteine ​​(gramnegative oder grampositive).
PSLPred - ist eine SVM-basierte Methode, die 5 wichtige subzelluläre Lokalisationen (Zytoplasma, innere Membran, äußere Membran, extrazellulär, Periplasma) von gramnegativen Bakterien vorhersagt. Diese Methode umfasst verschiedene SVM-Module, die auf unterschiedlichen Eigenschaften der Proteine ​​basieren. Der Hybrid-Ansatz erreichte eine Gesamtgenauigkeit von 91%, die beste aller existierenden Methoden zur subzellulären Lokalisierung prokaryontischer Proteine. ( Referenz: 21: 2522-2524.)

CELLO-SubCELlular LOkalisationsvorhersagesystem - ordnet gramnegative Proteine ​​dem Zytoplasma, der inneren Membran, dem Periplasma, der äußeren Membran oder dem extrazellulären Raum mit einer Gesamtprädiktionsgenauigkeit von ca. 89 % . Analysiert auch eukaryontische und grampositive Proteine. (Referenz: C. S. Yu et al. 2004. Protein Sci. 13:1402-1406). Das aktualisierte CELLO2GO (Protein subCELlular LOKalisierungsvorhersage mit Functional gene Öntology Annotation) - CELLO2GO sollte ein nützliches Werkzeug für die Forschung mit komplexen subzellulären Systemen sein, da es CELLO und BLAST in einer Plattform kombiniert und seine Ausgabe leicht manipuliert werden kann, sodass die benutzerspezifischen Fragen leicht beantwortet werden können (Referenz: Yu CS et al. 2014. PLoS ONE 9: e99368).

SignalP - sagt das Vorhandensein und die Lage von Signalpeptid-Spaltungsstellen in Gram-positiven, Gram-negativen und eukaryotischen Proteinen voraus (Zentrum für biologische Sequenzanalyse, Technische Universität Dänemark). Als Beispiel für ein periplasmatisches Protein verwenden Sie eine Testsequenz Männlich.
Phobius - ist ein kombinierter Transmembrantopologie- und Signalpeptid-Prädiktor (Referenz: L. Käll et al. 2004. J.Mol. Biol. 338: 1027-1036).
LipoP 1.0 (Zentrum für biologische Sequenzanalyse der Technischen Universität Dänemark) – ermöglicht die Vorhersage, wo Signalpeptidasen I & II-Spaltungsstellen von Gram-negativen Bakterien ein Protein spalten.

SecretomeP - produziert von Anfang an Vorhersagen von nicht-klassischen d.h. nicht signalpeptidgesteuerte Proteinsekretion. Die Methode fragt eine große Anzahl anderer Merkmalsvorhersageserver ab, um Informationen über verschiedene posttranslationale und lokalisierte Aspekte des Proteins zu erhalten, die in die endgültige Sekretionsvorhersage integriert werden (Referenz: J.D. Bendtsen et al. 2005. BMC Microbiology 5: 58).

SSPRED - Identifizierung und Klassifizierung von Proteinen, die an bakteriellen Sekretionssystemen beteiligt sind. Reichen Sie nicht mehr als vier Proteine ​​auf einmal ein. (Referenz: Pundhir, S., & Kumar, A. 2011. Bioinformation 6: 380-382).

Signal Find Server - beinhaltet (a) FlaFind, das archaeale Klasse III (Typ IV Pilin-ähnliche) Signalpeptide (Klasse III Signalpeptide) und ihre Prepilin-Peptidase-Spaltungsstellen vorhersagt (b) EppA-pilinFind, das Klasse III Signalpeptide vorhersagt, die von a . verarbeitet werden einzigartige archaeale Prepilin-Peptidase, EppA (c) TatFind, das archaeale UND bakterielle Twin-Arginin-Translokation (Tat)-Signalpeptide vorhersagt (d) PilFind, das bakterielle Typ-IV-Pilin-ähnliche Signalpeptide und ihre Prepilin-Peptidase-Spaltungsstellen vorhersagt und (e) TatLipo die Haloarchaeal-Tat-Signalpeptide vorhersagt, die eine SPase II-Spaltungsstelle (Lipobox) enthalten.

Signal-3L 2.0 - ist ein Online-Server zur Vorhersage des N-terminalen Protein-Signalpeptids, und die Eingabe ist nur die Aminosäuresequenz. Es ist mit einem hierarchischen Mischungsmodell aufgebaut, das die folgenden drei Schichten enthält: (1) Unterscheidung von SP-Proteinen (Signal Peptide) und TMH-Proteinen (TransMembrane Helical) von den anderen globulären Proteinen (2) Erkennung von SP-Proteinen von TMH-Proteinen und, (3) Identifizieren der Spaltungsstellen von SP-Proteinen. (Referenz: Y-Z. Zhang & H-B. Shen. Journal of Chemical Information and Modeling, 2017, 57: 988-999)

PrediSi - PREDAktion von SIgnal Peptide (Karsten Hiller, TU Braunschweig)

Signal Find Server - bietet mehrere unterschiedliche Programme: (a) FlaFind sagt archaeale Klasse III (Typ IV Pilin-ähnliche) Signalpeptide (Klasse III Signalpeptide) und ihre Prepilin-Peptidase-Spaltungsstellen voraus. (b) EppA-pilinFind sagt Klasse-III-Signalpeptide voraus, die von einer einzigartigen archaealen Prepilin-Peptidase, EppA, verarbeitet werden. (c) TatFind sagt archaeale UND bakterielle Twin-Arginin Translokation (Tat) Signalpeptide voraus. (d) PilFind sagt bakterielle Typ IV-Pilin-ähnliche Signalpeptide und ihre Prepilin-Peptidase-Spaltungsstellen voraus. (e) TatLipo sagt Haloarchae-Tat-Signalpeptide voraus, die eine SPase II-Spaltungsstelle (Lipobox) enthalten.

B. Eukaryontische Proteine

DeepLoc-1.0 sagt die subzelluläre Lokalisation eukaryontischer Proteine ​​voraus. Es kann zwischen 10 verschiedenen Lokalisationen unterscheiden: Nukleus, Zytoplasma, Extrazellulär, Mitochondrium, Zellmembran, Endoplasmatisches Retikulum, Chloroplast, Golgi-Apparat, Lysosom/Vakuole und Peroxisom. Ihr Modell erreicht eine gute Genauigkeit (78 % für 10 Kategorien, 92 % für membrangebunden oder löslich) und übertrifft die aktuellen Algorithmen nach dem neuesten Stand der Technik, einschließlich solcher, die auf Homologieinformationen beruhen. (Referenz: Almagro Armenteros JJ et al. 2017. Bioinformatik 33(21): 3387-3395).

Protein Prowler Subcellular Localization Predictor Version 1.2 akzeptiert Aminosäuresequenzen, die im FASTA-Format präsentiert werden, und bestimmt die Lokalisierung des Proteins in den folgenden Kategorien: Sekretorischer Weg (Vorhandensein eines Signalpeptids SP) Mitochondrium (Vorhandensein eines mitochondrialen Targeting-Peptids mTP) Chloroplast (Anwesenheit eines Chloroplasten-Transitpeptids cTP, das nur auf Pflanzenproteine ​​anwendbar ist) und Andere (Kern, zytoplasmatisch oder anderweitig). (Referenz: Bodén, M. und Hawkins (2005) Bioinformatik. 21(10): 2279-2286).
WOLF PSORT - (Nationales Institut für fortgeschrittene Wissenschaft und Technologie, Japan) (Referenz: Horton P et al. (2007) Nucleic Acids Res. 35 (Problem mit dem Webserver): W585&ndashW587).

ngLOC - ist ein n-Gramm-basierter Bayes-Klassifikator, der die subzelluläre Lokalisation von Proteinen sowohl in Prokaryoten als auch in Eukaryoten vorhersagt. Die Gesamtvorhersagegenauigkeit variiert von 85,3% bis 91,4% zwischen den Arten. Dieses Programm kann jeweils 11 verschiedene Standorte in Pflanzen- und Tierarten vorhersagen. ngLOC sagt auch 4 bzw. 5 unterschiedliche Positionen auf grampositiven bzw. gramnegativen Bakteriendatensätzen voraus. (Referenz: King BR et al. BMC Res Notes. 5: 351 ).

ProtComp (Softberry, USA) kann verwendet werden, um die subzelluläre Lokalisation für tierische/Pilz- und Pflanzenproteine ​​vorherzusagen.

SecretomeP - produziert von Anfang an Vorhersagen von nicht-klassischen d.h. nicht signalpeptidgesteuerte Proteinsekretion. Die Methode fragt eine große Anzahl anderer Feature-Prediction-Server ab, um Informationen über verschiedene posttranslationale und lokalisierte Aspekte des Proteins zu erhalten, die in die endgültige Sekretionsvorhersage integriert werden (Referenz: J.D. Bendtsen et al. 2005. BMC Microbiology 5: 58).

Andere Standorte für Sekundärstrukturvorhersagen sind:

JPred4 - ist die neueste Version des beliebten JPred-Protein-Sekundärstruktur-Vorhersageservers, der Vorhersagen durch den JNet-Algorithmus liefert, eine der genauesten Methoden zur Vorhersage der Sekundärstruktur. Zusätzlich zur Proteinsekundärstruktur macht JPred auch Vorhersagen zur Lösungsmittelzugänglichkeit und zu Coiled-Coil-Regionen. JPred4 bietet eine höhere Genauigkeit mit einer blinden Drei-Zustands-Vorhersagegenauigkeit (a-Helix, ß-Strang und Spule) von 82,0 %, während die Vorhersagegenauigkeit der Lösungsmittelzugänglichkeit für Rückstände <5 % zugänglich auf 90 % erhöht wurde. (Referenz: A. Drozdetskiy et al. 2015.Nucl. Acids Res. 43 (W1): W389-W394).

Netzwerk Proteinsequenz @nalysis at IBCP - (Institut de Biologie et Chemie des Proteines, Lyon, Frankreich) - hat DSC, GORIV, Predator, SOPMA und Heirarchical Neural Network Method sowie ältere Programme.

PSIPRED Protein Sequence Analysis Workbench – beinhaltet PSIPRED v3.3 (Predict Secondary Structure) DISOPRED3 & DISOPRED2 (Disorder Prediction) pGenTHREADER (Profile Based Fold Recognition) MEMSAT3 & MEMSAT-SVM (Membrane Helix Prediction) BioSerf v2.0 (Automated Homology Modeling) DomPred (Protein Domain Prediction) FFPred 3 (Eukaryotic Function Prediction) GenTHREADER (Rapid Fold Recognition) MEMPACK (SVM Prediction of TM Topology and Helix Packing) pDomTHREADER (Fold Domain Recognition) and, DomSerf v2.0 (Automated Domain Modelling by Homology). ( Reference: Buchan DWA et al. 2013. Nucl. Acids Res. 41 (W1): W340-W348).

For a full range of properties of your protein including hydrophobicity, alpha helix, beta-sheet plots see ProScale (ExPASy, Switzerland).

Disordered states:

Many proteins containing regions that do not form well-defined structures and the following new programs help define these regions:

D2P2 (Database of Disordered Protein Predictions) - A battery of disorder predictors and their variants, VL-XT, VSL2b, PrDOS, PV2, Espritz and IUPred, were run on all vast number of protein sequences. Searches are provided against the database and links are provided to each of the disordered servers. ( Reference: Oates ME et al. (2013). Nucleic Acids Res 41(D1): D508-D516).

RONN (Regional Order Neural Network) - ( Reference: Z.R. Yang et al. 2005. Bioinformatics 21: 3369-3376). For explanation of native disorder see here.
IUPred - The underlying assumption is that globular proteins are composed of amino acids which have the potential to form a large number of favorable interactions, whereas intrinsically unstructured proteins (IUPs) adopt no stable structure because their amino acid composition does not allow sufficient favorable interactions to form. ( Reference: Z. 3433-3434).
DISOPRED3 ( Reference: J.J. Ward et al. 2004. J. Molec. Biol. 337: 635-645).

PrDOS is a server to predict natively disordered regions of a protein chain from its amino acid sequence. PrDOS returns disorder probability of each residue as prediction results.( Reference: Ishida T, & Kinoshita K (2007) Nucleic Acids Res. 35(Web Server issue): W460-4.).

MFDp (multilayered Fusion-based Disorder Predictor) - aims to improve over the current disorder predictors.( Reference: M.J. Mizianty et al. 2010. Bioinformatics 26: i489-i496)

MoRFpred - Molecular Recognition Features (MoRFs) are short binding regions located within longer intrinsically disordered regions that bind to protein partners via disorder-to-order transitions. MoRFs are implicated in important processes including signaling and regulation. MoRFpred is a computational tool for sequence-based prediction and characterization of short disorder-to-order transitioning binding regions in proteins which identifies all MoRF types (a, ß, coil and complex). ( Reference: F.M. Disfani et al. 2012. Bioinformatics 28: i75-i83).

Scooby-domain (SequenCe hydrÖphobicitja predicts domains) is a method to identify globular regions in protein sequence that are suitable for structural studies. The Scooby-domain JAVA applet can be used as a tool to visually identify 'foldable' regions in protein sequence. Interesting graphics. ( Reference: R.A. George et al. 2005. Nucl. Acids Res. 33: W160-W163).

For estimations on the antigenicity of regions of proteins see:

Antigenicity Plot (JaMBW module) - Given a sequence of amino acids, this program computes and plots the antigenicity along the polypeptide chain, as predicted by the algorithm of Hopp & Woods (1981).
SAbPred - is a structure-based antibody prediction server ( Reference: J. Dunbar et al. Nucleic Acids Res . 2016 44(Web Server issue): W474&ndashW478.

EMBOSS Antigenic (EMBOSS package) - this program predicts potentially antigenic regions of a protein sequence, using the method of Kolaskar & Tongaonkar (1990). Also accessible here.

OptimumAntigen&trade Design Tool (GenScript) - peptides are optimized using the industry's most advanced antigen design algorithm. Each peptide is measured against several protein databases to confirm the desired epitope specificity. Benefits of using the OptimumAntigen&trade Design Tool include avoidance of unexposed epitopes, ability to specify desired cross-reactivity, strong antigenicity of chosen peptide, identification of the best conjugation and presentation options for your desired assay(s), use of built in peptide tutorial for synthesis and solubility, and guaranteed immune response.

EpiC (The ProteomeBinders Epitope Choice Resource) collates and presents a structure-function summary and antigenicity prediction of your protein to help you design antibodies that are appropriate to your planned experiments. ( Reference: Haslam, N. & Gibson. T. Proteome Res., 2010, 9 (7): 3759&ndash3763).

SVMTriP - is a method to predict antigenic epitopes using support vector machine to integrate tri-peptide similarity and propensity. ( Reference: B. Yao et al. PLoS ONE (2012) 7(9):e45152).

To screen for coiled-coil regions in proteins use:

Coils - prediction of coiled coil regions in troteins (Swiss node of EMBnet, Switzerland) - ( Reference: A. Lupas et al. 1991 Science 252: 1162-1164). See also PCOILS and MARCOILS.
Paircoils (MIT Laboratory for Computer Science, U.S.A.) - ( Reference: B. Berger et al. 1995. Proc. Natl. Acad. Sci. USA, 92: 8259-8263) or MultiCoil - is based on the PairCoil algorithm and is used for locating dimeric and trimeric coiled coils. ( Reference: E. Wolf et al. 1997. Protein Sci. 6: 1179-1189). CoilP

REPPER (REPeats and their PERiodicities) - detects and analyzes regions with short gapless repeats in proteins. It finds periodicities by Fourier Transform (FTwin) and internal similarity analysis (REPwin). FTwin assigns numerical values to amino acids that reflect certain properties, for instance hydrophobicity, and gives information on corresponding periodicities. REPwin uses self-alignments and displays repeats that reveal significant internal similarities. They are complemented by PSIPRED and coiled coil prediction (COILS), making the server a useful analytical tool for fibrous proteins. ( Reference: M. Gruber et al. 2005. Nucl. Acids Res. 33: W239-W243).

Beta-barrel outer membrane proteins: (Test sequence)

PRED-TMßß (Bagos, P. G., et al. Dept Cell Biology & Biophysics, University of Athens, Greece) - employs a Hidden Markov Model method, capable of predicting and discriminating beta-barrel outer membrane proteins. Gives one the opportunity to download a custom image plot or a 2D representation (see below):

BetaTPred2 (Bioinformatics Center, Institute of Microbial Technology, India) - predict ß turns in proteins from multiple alignment by using neural network from the given amino acid sequence. For ß turn prediction, it uses the position specific score matrices generated by PSI-BLAST and secondary structure predicted by PSIPRED. For a classification of the ß turn type use BetaTurns.

BOMP - The ß-barrel outer membrane protein predictor ( Reference: Berven, F.S. et al. 2004. Nucl. Acids Res. 32 (Web Server issue):W394-9 ).

HHomp - detection of outer membrane proteins by HMM-HMM comparisons

ConBBPred - Consensus Prediction of Transmembrane Beta-Barrel Proteins - gives one a choice of eight prediction programs.


Structural analysis of the interaction between Dishevelled2 and clathrin AP-2 adaptor, a critical step in noncanonical Wnt signaling

Wnt association with its receptor, Frizzled (Fz), and recruitment by the latter of an adaptor, Dishevelled (Dvl), initiates signaling through at least two distinct pathways ("canonical" and "noncanonical"). Endocytosis and compartmentalization help determine the signaling outcome. Our previous work has shown that Dvl2 links at least one Frizzled family member (Fz4) to clathrin-mediated endocytosis by interacting with the μ2 subunit of the AP-2 clathrin adaptor, through both a classical endocytic tyrosine motif and a so-called "DEP domain." We report here the crystal structure of a chimeric protein that mimics the Dvl2-μ2 complex. The DEP domain binds at one end of the elongated, C-terminal domain of μ2. This domain:domain interface shows that parts of the μ2 surface distinct from the tyrosine-motif site can help recruit specific receptors or adaptors into a clathrin coated pit. Mutation of residues at the DEP-μ2 contact or in the tyrosine motif reduce affinity of Dvl2 for μ2 and block efficient internalization of Fz4 in response to ligation by Wnt5a. The crystal structure has thus allowed us to identify the specific interaction that leads to Frizzled uptake and to downstream, noncanonical signaling events.

Copyright © 2010 Elsevier Ltd. All rights reserved.

Figuren

Figure 1. Structure of the Dvl2:μ2 complex

Figure 1. Structure of the Dvl2:μ2 complex

(A) Crystal packing in one asymmetric unit, showing…

Figure 2. The Dvl2 DEP domain

Figure 2. The Dvl2 DEP domain

(A) Superposition of the Dvl2 DEP domain from an…

Figure 3. Dvl2:μ2 interface

Figure 3. Dvl2:μ2 interface

(A) Interface of DEP domain and μ2. (B) Interface of YHEL…

Figure 4. Superposition of Dvl2:μ2 complex on…

Figure 4. Superposition of Dvl2:μ2 complex on the AP-2 clathrin adaptor core

Figure 5. Influence of specific mutations in…

Figure 5. Influence of specific mutations in μ2 on its association with the DEP domain…

Figure 6. Influence of specific mutations in…

Figure 6. Influence of specific mutations in the DEP domain of Dvl2 on its association…

Figure 7. Effect of mutations in Dvl2…

Figure 7. Effect of mutations in Dvl2 that interfere with AP-2 binding on internalization of…


<p>This section provides links to proteins that are similar to the protein sequence(s) described in this entry at different levels of sequence identity thresholds (100%, 90% and 50%) based on their membership in UniProt Reference Clusters (<a href="http://www.uniprot.org/help/uniref">UniRef</a>).<p><a href='/help/similar_proteins_section' target='_top'>More. </a></p> Similar proteins i

Sequenzdatenbanken

3D-Strukturdatenbanken

Datenbanken zur Protein-Protein-Interaktion

PTM databases

Proteomic databases

Genome annotation databases

Organismusspezifische Datenbanken

Phylogenomic databases

Diverse Datenbanken

Family and domain databases

MobiDB: a database of protein disorder and mobility annotations


Amino acid sequence in protein molecules

Since each protein molecule consists of a long chain of amino acid residues, linked to each other by peptide bonds, the hydrolytic cleavage of all peptide bonds is a prerequisite for the quantitative determination of the amino acid residues. Hydrolysis is most frequently accomplished by boiling the protein with concentrated hydrochloric acid. The quantitative determination of the amino acids is based on the discovery that amino acids can be separated from each other by chromatography on filter paper and made visible by spraying the paper with ninhydrin. The amino acids of the protein hydrolysate are separated from each other by passing the hydrolysate through a column of adsorbents, which adsorb the amino acids with different affinities and, on washing the column with buffer solutions, release them in a definite order. The amount of each of the amino acids can be determined by the intensity of the colour reaction with ninhydrin.

To obtain information about the sequence of the amino acid residues in the protein, the protein is degraded stepwise, one amino acid being split off in each step. This is accomplished by coupling the free α-amino group (―NH2) of the N-terminal amino acid with phenyl isothiocyanate subsequent mild hydrolysis does not affect the peptide bonds. The procedure, called the Edman degradation, can be applied repeatedly it thus reveals the sequence of the amino acids in the peptide chain.

Unavoidable small losses that occur during each step make it impossible to determine the sequence of more than about 30 to 50 amino acids by this procedure. For this reason the protein is usually first hydrolyzed by exposure to the enzyme trypsin, which cleaves only peptide bonds formed by the carboxyl groups of lysine and arginine. The Edman degradation is then applied to each of the few resulting peptides produced by the action of trypsin. Further information can be gained by hydrolyzing another portion of the protein with another enzyme, for instance with chymotrypsin, which splits predominantly peptide bonds formed by the amino acids tyrosine, phenylalanine, and tryptophan. The combination of results obtained with two or more different proteolytic (protein degrading) enzymes was first applied by English biochemist Frederick Sanger, and it enabled him to elucidate the amino acid sequence of insulin. The amino acid sequences of many other proteins subsequently were determined in the same manner.


Principal component analysis in protein tertiary structure prediction

We discuss applicability of principal component analysis (PCA) for protein tertiary structure prediction from amino acid sequence. The algorithm presented in this paper belongs to the category of protein refinement models and involves establishing a low-dimensional space where the sampling (and optimization) is carried out via particle swarm optimizer (PSO). The reduced space is found via PCA performed for a set of low-energy protein models previously found using different optimization techniques. A high frequency term is added into this expansion by projecting the best decoy into the PCA basis set and calculating the residual model. This term is aimed at providing high frequency details in the energy optimization. The goal of this research is to analyze how the dimensionality reduction affects the prediction capability of the PSO procedure. For that purpose, different proteins from the Critical Assessment of Techniques for Protein Structure Prediction experiments were modeled. In all the cases, both the energy of the best decoy and the distance to the native structure have decreased. Our analysis also shows how the predicted backbone structure of native conformation and of alternative low energy states varies with respect to the PCA dimensionality. Generally speaking, the reconstruction can be successfully achieved with 10 principal components and the high frequency term. We also provide a computational analysis of protein energy landscape for the inverse problem of reconstructing structure from the reduced number of principal components, showing that the dimensionality reduction alleviates the ill-posed character of this high-dimensional energy optimization problem. The procedure explained in this paper is very fast and allows testing different PCA expansions. Our results show that PSO improves the energy of the best decoy used in the PCA when the adequate number of PCA terms is considered.


Schau das Video: Enzyme (September 2022).