Protein design
Proteindesign ist der Rationales Design von neuen Protein Moleküle zur Gestaltung neuartiger Aktivität, Verhalten oder Zweck und zur Förderung des grundlegenden Verständnisses der Proteinfunktion.[1] Proteine können von Grund auf neu gestaltet werden (de novo Design) oder durch Berechnungsvarianten einer bekannten Proteinstruktur und ihrer Sequenz (bezeichnet Protein -Neugestaltung). Rationales Proteindesign Ansätze machen Proteinsequenzvorhersagen, die zu bestimmten Strukturen geklappt werden. Diese vorhergesagten Sequenzen können dann experimentell mit Methoden wie z. B. validiert werden Peptidsynthese, Stättengesteuerte Mutagenese, oder Künstliche Gensynthese.
Rational Protein Design stammt aus Mitte der 1970er Jahre.[2] In jüngster Zeit gab es jedoch zahlreiche Beispiele für erfolgreiches rationales Design von wasserlöslichen und sogar Transmembranpeptiden und Proteinen, teilweise auf ein besseres Verständnis der verschiedenen Faktoren, die dazu beitragen Proteinstruktur Stabilität und Entwicklung besserer Rechenmethoden.
Übersicht und Geschichte
Das Ziel des rationalen Proteindesigns ist vorherzusagen Aminosäure Sequenzen das wird falten zu einer bestimmten Proteinstruktur. Obwohl die Anzahl der möglichen Proteinsequenzen groß ist und exponentiell mit der Größe der Proteinkette wächst, wird nur eine Untergruppe von ihnen zuverlässig und schnell zu einem zusammengeklappt einheimischer Zustand. Das Proteindesign beinhaltet die Identifizierung neuer Sequenzen in dieser Untergruppe. Der native Zustand eines Proteins ist die Konformation freie Energie Minimum für die Kette. Das Proteindesign ist daher die Suche nach Sequenzen, die die ausgewählte Struktur als Minimum freien Energie haben. In gewissem Sinne ist es umgekehrt von Proteinstrukturvorhersage. Im Design, a Tertiärstruktur wird angegeben, und eine Sequenz, die sich dazu faltet, wird identifiziert. Daher wird es auch bezeichnet umgekehrte Faltung. Das Proteindesign ist dann ein Optimierungsproblem: Wenn Sie einige Bewertungskriterien verwenden, wird eine optimierte Sequenz ausgewählt, die zur gewünschten Struktur gefaltet wird.
Als die ersten Proteine in den 1970er und 1980er Jahren rational entworfen wurden, wurde die Sequenz dafür auf der Grundlage von Analysen anderer bekannter Proteine, der Sequenzzusammensetzung, der Aminosäure -Ladungen und der Geometrie der gewünschten Struktur manuell optimiert.[2] Die ersten entworfenen Proteine sind Bernd Gutte zugeordnet, der eine reduzierte Version eines bekannten Katalysators, Rinder-Ribonuklease und tertiären Strukturen entworfen hat Ddt. Urry und Kollegen später entworfen Elastin-wie faserig Peptide basierend auf Regeln zur Sequenzzusammensetzung. Richardson und Mitarbeiter entwarfen ein 79-Residen-Protein ohne Sequenzhomologie zu einem bekannten Protein.[2] In den 1990er Jahren das Aufkommen mächtiger Computer, Bibliotheken von Aminosäurekonformationenund Force Fields, die sich hauptsächlich für entwickelt haben Molekulare Dynamik Simulationen ermöglichten die Entwicklung strukturbasierter Computer-Protein-Design-Tools. Nach der Entwicklung dieser Computerwerkzeuge wurde in den letzten 30 Jahren im Proteindesign großer Erfolg erzielt. Das erste Protein erfolgreich vollständig entwickelt de novo wurde von Stephen Mayo und Mitarbeiter im Jahr 1997,[3] und kurz darauf 1999 Peter S. Kim und Mitarbeiter entworfen Dimere, Trimere und Tetramer unnatürlicher Rechtshänder Spulen gewickte.[4][5] In 2003, David BakerDas Labor hat ein vollständiges Protein zu einer Falte entwickelt, die noch nie zuvor in der Natur gesehen wurde.[6] Später, im Jahr 2008, konzipierte Baker's Group rechenintensive Enzyme für zwei verschiedene Reaktionen.[7] Im Jahr 2010 wurde eine der mächtigsten breit neutralisierenden Antikörper aus dem Patientenserum unter Verwendung einer rechenintensiven Proteinsonde isoliert.[8] Aufgrund dieser und anderer Erfolge (z. B. siehe Beispiele Im Folgenden) ist das Proteindesign eines der wichtigsten Tools geworden Eiweißtechnik. Es besteht eine große Hoffnung, dass das Design neuer und großer neuer Proteine verwendet wird Biomedizin und Biotechnik.
Zugrunde liegende Modelle der Proteinstruktur und -funktion
Proteindesign -Programme verwenden Computermodelle der molekularen Kräfte, die Proteine in Antrieb In vivo Umgebungen. Um das Problem vorhanden zu machen, werden diese Kräfte durch Proteindesignmodelle vereinfacht. Obwohl Proteindesign -Programme stark variieren, müssen sie vier Hauptmodellierungsfragen beantworten: Was ist die Zielstruktur des Designs, welche Flexibilität der Zielstruktur zulässig ist, welche Sequenzen in der Suche enthalten sind und welches Kraftfeld verwendet wird? Score -Sequenzen und -strukturen.
Zielstruktur
Die Proteinfunktion hängt stark von der Proteinstruktur ab, und das rationale Proteindesign verwendet diese Beziehung zur Entwurfsfunktion, indem sie Proteine mit einer Zielstruktur oder -faltung entwerfen. Somit muss im rationalen Proteindesign per Definition die Zielstruktur oder das Ensemble von Strukturen vorher bekannt sein. Dies steht im Gegensatz zu anderen Formen der Proteintechnik, wie z. Regie Evolution, wo eine Vielzahl von Methoden verwendet werden, um Proteine zu finden, die eine bestimmte Funktion erzielen, und mit Proteinstrukturvorhersage Wo die Sequenz bekannt ist, aber die Struktur unbekannt ist.
Am häufigsten basiert die Zielstruktur auf einer bekannten Struktur eines anderen Proteins. Neue Falten, die in der Natur nicht gesehen werden, wurden jedoch zunehmend möglich. Peter S. Kim und Mitarbeiter entwarfen Trimer und Tetramer unnatürlicher Spulen, die bisher nicht in der Natur gesehen worden waren.[4][5] Das Protein Top7, entwickelt in David BakerDas Labor wurde vollständig unter Verwendung von Protein -Design -Algorithmen zu einer völlig neuartigen Falte entwickelt.[6] In jüngerer Zeit haben Baker und Mitarbeiter eine Reihe von Prinzipien entwickelt, um Ideal zu entwerfen Globulärprotein Strukturen basierend auf Proteinfaltungstrichter Diese Brücke zwischen Sekundärstrukturvorhersage und tertiärer Strukturen. Diese Prinzipien, die sowohl auf der Proteinstruktur -Vorhersage als auch auf dem Proteindesign aufbauen, wurden verwendet, um fünf verschiedene neue Proteintopologien zu entwerfen.[9]
Sequenzraum

Im rationalen Proteindesign können Proteine aus der Sequenz und Struktur eines bekannten Proteins oder vollständig von Grund auf neu gestaltet werden de novo Proteindesign. Bei der Protein-Neugestaltung werden die meisten Reste in der Sequenz als ihre Wildtyp-Amino-Säure gehalten, während einige mutieren dürfen. Im de novo Design, die gesamte Sequenz ist neu gestaltet, basierend auf einer vorherigen Sequenz.
Beide de novo Designs und Protein -Redesigns können Regeln für die festlegen Sequenzraum: Die spezifischen Aminosäuren, die an jeder veränderlichen Restposition zulässig sind. Zum Beispiel die Zusammensetzung der Oberfläche der RSC3 -Sonde Die Auswahl von HIV-Broadly-neutralisierenden Antikörpern wurde basierend auf evolutionären Daten und Ladungsausgleich eingeschränkt. Viele der frühesten Versuche zum Proteindesign beruhten stark auf empirisch Regeln auf dem Sequenzraum.[2] Außerdem die Design von faserigen Proteinen Normalerweise folgt strenge Regeln für den Sequenzraum. Kollagen-Basierte ausgestattete Proteine beispielsweise bestehen häufig aus Wiederholungsmustern von Gly-Pro-X.[2] Das Aufkommen von Computertechniken ermöglicht das Entwerfen von Proteinen ohne menschliche Intervention in der Sequenzauswahl.[3]
Strukturelle Flexibilität

Im Proteindesign sind die Zielstruktur (oder Strukturen) des Proteins bekannt. Ein rationaler Ansatz des Proteindesigns muss jedoch einige modellieren Flexibilität Auf der Zielstruktur, um die Anzahl der Sequenzen zu erhöhen, die für diese Struktur ausgelegt werden können, und um die Wahrscheinlichkeit einer Sequenzfaltung zu einer anderen Struktur zu minimieren. Zum Beispiel in einer Proteinredesign einer kleinen Aminosäure (wie Alanin) im eng gepackten Kern eines Proteins würden nur sehr wenige Mutanten durch einen rationalen Designansatz zur Falten zur Zielstruktur vorhergesagt, wenn die umgebenden Seitenketten umgeben sind dürfen nicht umverpimmt werden.
Ein wesentlicher Parameter eines beliebigen Entwurfsprozesses ist daher die Menge an Flexibilität, die sowohl für die Seitenketten als auch das Rückgrat zulässig ist. In den einfachsten Modellen wird das Protein Rückgrat starr gehalten, während einige der Protein-Seitenketten die Konformationen verändern dürfen. Seitenketten können jedoch viele Freiheitsgrade in ihren Bindungslängen, Bindungswinkeln und haben χ Diedralwinkel. Um diesen Raum zu vereinfachen, verwenden Proteindesignmethoden Rotamer -Bibliotheken, die ideale Werte für Bindungslängen und Bindungswinkel annehmen, während sie einschränken χ Diedralwinkel auf einige häufig beobachtete Konformationen mit niedriger Energie bezeichnet Rotamer.
Rotamer -Bibliotheken stammen aus der statistischen Analyse vieler Proteinstrukturen. Backbone-unabhängige Rotamer-Bibliotheken beschreiben alle Rotamere.[10] Rückgrat-abhängige Rotamer-BibliothekenBeschreiben Sie im Gegensatz dazu die Rotamere als wie wahrscheinlich es ist, dass sie abhängig von der Protein -Rückgrat -Anordnung um die Seitenkette sind.[11] Die meisten Protein -Designprogramme verwenden eine Konformation (z. B. den Modalwert für Rotamer -Dihederlals im Raum) oder mehrere Punkte in der vom Rotamer beschriebenen Region; Im Gegensatz dazu modelliert das Osprey Protein Design -Programm im Gegensatz dazu die gesamte kontinuierliche Region.[12]
Obwohl das rationale Proteindesign das allgemeine Rückgrat falten muss, was ein Protein faltet, kann eine gewisse Flexibilität des Rückgrats die Anzahl der Sequenzen erheblich erhöhen, die sich zur Struktur falten und gleichzeitig die allgemeine Falte des Proteins beibehalten.[13] Die Flexibilität des Rückgrats ist besonders wichtig bei der Protein -Redesign, da Sequenzmutationen häufig zu kleinen Änderungen an der Rückgratstruktur führen. Darüber hinaus kann die Flexibilität für die Rückgrat für fortschrittlichere Anwendungen des Proteindesigns von wesentlicher Bedeutung sein, wie z. B. Bindungsvorhersage und Enzymdesign. Einige Modelle für die Flexibilität für das Rückgrat für die Backbone des Proteins sind kleine und kontinuierliche globale Rückgratbewegungen, diskrete Rückgratproben rund um die Zielfalte, BackRub -Bewegungen und Flexibilität der Proteinschleife.[13][14]
Energiefunktion

Rationale Proteindesign-Techniken müssen in der Lage sein, Sequenzen zu unterscheiden, die unter der Zielfalte stabil sind, die andere konkurrierende Zustände mit geringe Energie bevorzugen. Daher erfordert das Proteindesign genau Energiefunktionen Das kann Sequenzen rangieren und bewerten, wie gut sie zur Zielstruktur falten. Gleichzeitig müssen diese Energiefunktionen jedoch die Recheninformationen berücksichtigen Herausforderungen hinter Proteindesign. Eine der schwierigsten Anforderungen an ein erfolgreiches Design ist eine Energiefunktion, die sowohl für Rechenberechnungen genau als auch einfach ist.
Die genauesten Energiefunktionen basieren auf quantenmechanischen Simulationen. Solche Simulationen sind jedoch für das Proteindesign zu langsam und typischerweise unpraktisch. Stattdessen verwenden viele Proteindesignalgorithmen entweder physikbasierte Energiefunktionen, die angepasst wurden Molekulare Mechanik Simulationsprogramme, Wissensbasierte Energiefunktionen, oder eine hybride Mischung aus beiden. Der Trend besteht darin, mehr physikbasierte potenzielle Energiefunktionen zu verwenden.[15]
Physikbasierte Energiefunktionen wie z. BERNSTEIN und Charm, werden typischerweise aus quantenmechanischen Simulationen und experimentellen Daten aus Thermodynamik, Kristallographie und Spektroskopie abgeleitet.[16] Diese Energiefunktionen vereinfachen typischerweise die physikalische Energiefunktion und machen sie ein paarweise zersetzbar, was bedeutet, dass die Gesamtenergie einer Proteinkonformation berechnet werden kann, indem die paarweise Energie zwischen jedem Atompaar hinzugefügt wird, was sie für Optimierungsalgorithmen attraktiv macht. Physikbasierte Energiefunktionen modellieren typischerweise ein attraktives Repulsiv Lennard-Jones Begriff zwischen Atomen und paarweise Elektrostatik Coulombischer Begriff[17] zwischen nicht gebundenen Atomen.

Statistische Potentiale haben im Gegensatz zu physikbasierten Potentialen den Vorteil, schnell zu berechnen, implizit komplexe Effekte zu berücksichtigen und weniger empfindlich gegenüber kleinen Veränderungen in der Proteinstruktur zu sein.[19] Diese Energiefunktionen basieren auf der Ableitung von Energiewerten von der Häufigkeit des Erscheinungsbilds in einer strukturellen Datenbank.
Das Proteinkonstruktion hat jedoch Anforderungen, die manchmal in Kraftfeldern der molekularen Mechanik begrenzt werden können. Die Kraftfelder der molekularen Mechanik, die hauptsächlich in molekularen Dynamiksimulationen verwendet wurden, werden für die Simulation einzelner Sequenzen optimiert, aber Proteindesign sucht jedoch durch viele Konformationen vieler Sequenzen. Somit müssen die Kraftfelder der molekularen Mechanik auf das Proteindesign zugeschnitten werden. In der Praxis beinhalten Proteindesign-Energiefunktionen häufig sowohl statistische als auch physikalische Begriffe. Beispielsweise enthält die Rosetta-Energiefunktion, eine der am häufigsten verwendeten Energiefunktionen, physikbasierte Energiebegriffe, die aus der Charmm-Energiefunktion stammen, und statistische Energiebegriffe wie Rotamer-Wahrscheinlichkeit und wissensbasierte Elektrostatik. In der Regel sind Energiefunktionen zwischen Labors stark angepasst und speziell für jedes Design zugeschnitten.[16]
Herausforderungen für effektive Design -Energiefunktionen
Wasser bildet die meisten Moleküle, die Proteine umgeben, und ist der Haupttreiber für die Proteinstruktur. Die Modellierung der Wechselwirkung zwischen Wasser und Protein ist daher für das Proteindesign von entscheidender Bedeutung. Die Anzahl der Wassermoleküle, die zu einem bestimmten Zeitpunkt mit einem Protein interagieren, ist riesig und jeder hat eine große Anzahl von Freiheitsgraden und Interaktionspartnern. Stattdessen modellieren Proteindesign -Programme die meisten Wassermoleküle als Kontinuum, wodurch sowohl die hydrophobe Wirkung als auch die Solvatationspolarisation modelliert werden.[16]
Einzelne Wassermoleküle können manchmal eine entscheidende strukturelle Rolle im Kern von Proteinen sowie bei Protein -Protein- oder Protein -Ligand -Wechselwirkungen spielen. Das Versäumnis, solche Gewässer zu modellieren, kann zu Fehlverhalten der optimalen Sequenz einer Protein -Protein -Grenzfläche führen. Alternative können Wassermoleküle zu Rotameren hinzugefügt werden.
Als Optimierungsproblem

Das Ziel des Proteindesigns ist es, eine Proteinsequenz zu finden, die zu einer Zielstruktur gefaltet wird. Ein Protein-Design-Algorithmus muss somit alle Konformationen jeder Sequenz in Bezug auf die Zielfalte durchsuchen und Sequenzen gemäß der niedrigsten Energiekonformation jedes einzelnen Rangs rangieren, wie durch die Protein-Design-Energiefunktion bestimmt. Ein typischer Eingabe des Proteindesignalgorithmus ist daher die Zielfalte, der Sequenzraum, die strukturelle Flexibilität und die Energiefunktion, während der Ausgang eine oder mehrere Sequenzen ist, von denen vorhergesagt wird, dass sie stabil zur Zielstruktur falten.
Die Anzahl der Kandidatenproteinsequenzen wächst jedoch exponentiell mit der Anzahl der Proteinreste; Zum Beispiel gibt es 20100 Proteinsequenzen von Länge 100. Auch wenn Aminosäureseitenkettenkonformationen auf einige Rotamere beschränkt sind (siehe strukturelle Flexibilität), führt dies zu einer exponentiellen Anzahl von Konformationen für jede Sequenz. In unserem 100 -Rest -Protein und unter der Annahme, dass jede Aminosäure genau 10 Rotamere hat, muss ein Suchalgorithmus, der diesen Raum durchsucht, über 200 durchsuchen muss100 Proteinkonformationen.
Die häufigsten Energiefunktionen können in paarweise zwischen Rotameren und Aminosäure -Typen zersetzt werden, was das Problem als kombinatorisch aufgibt, und leistungsstarke Optimierungsalgorithmen können zur Lösung verwendet werden. In diesen Fällen kann die Gesamtenergie jeder Konformation zu jeder Sequenz als Summe individueller und paarweise Begriffe zwischen Restpositionen formuliert werden. Wenn ein Designer nur an der besten Sequenz interessiert ist, erfordert der Protein-Design-Algorithmus nur die Konformation mit niedrigster Energie der niedrigsten Energiesequenz. In diesen Fällen kann die Aminosäureidentität jedes Rotamers ignoriert werden und alle Rotamere, die zu verschiedenen Aminosäuren gehören, können gleich behandelt werden. Lassen ri Sei ein Rotamer in der Rückstandposition i in der Proteinkette und E (ri) die potentielle Energie zwischen den inneren Atomen des Rotamers. Lassen E(ri, rj) Sei die potentielle Energie zwischen ri und Rotamer rj in Restposition j. Dann definieren wir das Optimierungsproblem als die Ermittlung der Konformation der minimalen Energie (ET):
-
(1)
Das Problem der Minimierung ET ist ein Np-harte Problem.[14][20][21] Obwohl die Klasse der Probleme NP-HART ist, können in der Praxis viele Fälle des Proteindesigns genau oder optimiert durch heuristische Methoden gelöst oder optimiert werden.
Algorithmen
Für das Proteindesignproblem wurden mehrere Algorithmen entwickelt. Diese Algorithmen können in zwei breite Klassen unterteilt werden: exakte Algorithmen, wie z. Dead-End-Eliminierung, dieser Mangel Laufzeit garantiert aber die Qualität der Lösung; und Heuristik Algorithmen wie Monte Carlo, die schneller als genaue Algorithmen sind, aber keine Garantien für die Optimalität der Ergebnisse haben. Genaue Algorithmen garantieren, dass der Optimierungsprozess das Optimal gemäß dem Protein -Design -Modell erzeugt hat. Wenn die Vorhersagen der exakten Algorithmen bei experimentell validiertem Fehlschlag fehlen, kann die Fehlerquelle der Energiefunktion, der zulässigen Flexibilität, dem Sequenzraum oder der Zielstruktur (z. B. wenn sie nicht ausgelegt werden) zugeordnet werden.[22]
Einige Proteindesignalgorithmen sind unten aufgeführt. Obwohl diese Algorithmen nur die grundlegendste Formulierung des Proteindesignproblems, Gleichung (1) Wenn sich das Optimierungsziel ändert, weil Designer Verbesserungen und Erweiterungen des Proteindesignmodells einführen, wie z. sind auf diesen Algorithmen gebaut. Zum Beispiel enthält Rosetta Design anspruchsvolle Energiebegriffe und Flexibilität für das Rückgrat unter Verwendung von Monte Carlo als zugrunde liegender Optimierungsalgorithmus. Ospreys Algorithmen bauen auf dem Algorithmus zur Eliminierung des Sackgasses und A* auf, um kontinuierliches Rückgrat und Seitenkettenbewegungen zu integrieren. Somit bieten diese Algorithmen eine gute Perspektive auf die verschiedenen Arten von Algorithmen, die für das Proteindesign verfügbar sind.
Im Juli 2020 berichteten Wissenschaftler über die Entwicklung eines KI-basierten Prozesses, der verwendet wurde Genomdatenbanken zum Evolution basiert Entwerfen neuer Proteine. Sie benutzten tiefes Lernen Design-Rules identifizieren.[23][24]
Mit mathematischen Garantien
Dead-End-Eliminierung
Der DEE-Algorithmus (Dead-End Elimination) verringert den Suchraum des Problems iterativ, indem sie Rotamere entfernen, die nachweislich nicht Teil der globalen Konformation mit niedrigster Energie (GMEC) sind. Bei jeder Iteration vergleicht der Eliminierungsalgorithmus für die Dead-End alle möglichen Rotamerepaare an jeder Restposition und entfernt jeden Rotamer r'i Es kann gezeigt werden, dass es immer von höherer Energie ist als ein anderer Rotamer ri und ist daher nicht Teil des GMEC:
Andere mächtige Erweiterungen des Algorithmus zum Dead-End-Eliminierungsalgorithmus sind die Pairs -Eliminierungskriterium, und die Verallgemeinerte Kriterium für die Eliminierung des Sackgasses. Dieser Algorithmus wurde ebenfalls erweitert, um kontinuierliche Rotamere mit nachweisbaren Garantien zu verarbeiten.
Obwohl der Algorithmus zur Eliminierung des Sackgasses in der Polynomzeit für jede Iteration läuft, kann er keine Konvergenz garantieren. Wenn nach einer bestimmten Anzahl von Iterationen der Algorithmus zur Eliminierung von Sackgassen nicht mehr Rotamere beschnitten, müssen entweder Rotamere zusammengeführt werden oder ein anderer Suchalgorithmus muss verwendet werden, um den verbleibenden Suchraum zu durchsuchen. In solchen Fällen wirkt die Dead-End-Eliminierung als Vorfilteralgorithmus, um den Suchraum zu reduzieren, während andere Algorithmen wie A*, Monte-Carlo, lineare Programmierung oder schneller verwendet werden, um den verbleibenden Suchraum zu durchsuchen.[14]
Zweig und gebunden
Der Proteindesign -Konformationsraum kann als Baum, wo die Proteinreste auf willkürliche Weise geordnet werden, und die Baumzweige an jedem der Rotamere in einem Rest. Zweig und gebunden Algorithmen verwenden diese Darstellung, um den Konformationsbaum effizient zu untersuchen: an jedem Verzweigung, Zweig- und gebundene Algorithmen gebunden Der Konformationsraum und erforschen nur die vielversprechenden Zweige.[14][25][26]
Ein beliebter Suchalgorithmus für Proteindesign ist das Ein* Suchalgorithmus.[14][26] A* berechnet eine untere Punktzahl auf jedem teilweisen Baumpfad, der die Energie jedes der erweiterten Rotamere unteren (mit Garantien). Jede partielle Konformation wird zu einer Prioritätswarteschlange hinzugefügt, und bei jeder Iteration wird der Teilweg mit der niedrigsten Untergrenze aus der Warteschlange gestoßen und erweitert. Der Algorithmus stoppt, sobald eine vollständige Konformation aufgezählt wurde und garantiert, dass die Konformation optimal ist.
Die a* Punktzahl f Im Proteindesign besteht aus zwei Teilen, f = g+h. g ist die genaue Energie der Rotamere, die bereits in der Teilkonformation zugewiesen wurden. h ist eine untere Grenze für die Energie der Rotamere, die noch nicht zugewiesen wurden. Jedes ist wie folgt gestaltet, wo d ist der Index des zuletzt zugewiesenen Rückstands in der Teilkonformation.
Ganzzahl lineare Programmierung
Das Problem der Optimierung ET (Gleichung (1)) kann leicht als formuliert werden Ganzzahl lineares Programm (ILP).[27] Eine der leistungsstärksten Formulierungen verwendet binäre Variablen, um das Vorhandensein eines Rotamers und Kanten in der endgültigen Lösung darzustellen, und beschränkt die Lösung so, dass sie genau einen Rotamer für jeden Rest und eine paarweise Wechselwirkung für jedes Restpaar aufweisen:
S.T.
ILP -Löser wie z. Cplex, kann die genaue optimale Lösung für große Instanzen von Proteindesignproblemen berechnen. Diese Löser verwenden a Lineare Programmierrelaxation des Problems, wo qi und qij dürfen kontinuierliche Werte in Kombination mit a nehmen Zweig und Schnitt Algorithmus, um nur einen kleinen Teil des Konformationsraums nach optimaler Lösung zu durchsuchen. Es wurde gezeigt, dass ILP-Solvers viele Fälle des Problems der Seitenketten-Platzierung lösen.[27]
Nachrichtenbasis auf dem linearen Programmieren Dual basiert
ILP -Löser hängen von linearen Programmieralgorithmen (LP) ab, wie die Simplex oder Barriere-Basierend Methoden zur Durchführung der LP -Relaxation an jedem Zweig. Diese LP-Algorithmen wurden als allgemeine Optimierungsmethoden entwickelt und sind für das Protein-Designproblem nicht optimiert (Gleichung (Gleichung (1)). Infolgedessen wird die LP -Relaxation zum Engpass der ILP -Löser, wenn die Problemgröße groß ist.[28] Kürzlich mehrere Alternativen basieren auf Nachrichten-Passing-Algorithmen wurden speziell für die Optimierung der LP -Relaxation des Proteindesignproblems entwickelt. Diese Algorithmen können beide annähern Dual oder der ursprünglich Instanzen der Ganzzahl -Programmierung, aber um die Garantie für Optimalität zu erhalten, sind sie am nützlichsten, wenn sie verwendet werden, um das Dual des Protein -Designproblems zu approximieren, da sie den doppelten Garantien nähern, dass keine Lösungen übersehen werden. Annäherungen basiert auf dem Nachrichtenbasis sind die Bäume neugewichtete Maxproduktnachricht zum Bestehen Algorithmus,[29][30] und die Nachrichtenübergabe linearer Programmieren Algorithmus.[31]
Optimierungsalgorithmen ohne Garantien
Monte Carlo und simuliertes Tempern
Monte Carlo ist einer der am häufigsten verwendeten Algorithmen für das Proteindesign. In seiner einfachsten Form wählt ein Monte -Carlo -Algorithmus zufällig einen Rückstand aus, und in diesem Rückstand wird ein zufällig ausgewählter Rotamer (von jeder Aminosäure) bewertet.[21] Die neue Energie des Proteins, ENeu wird mit der alten Energie verglichen Ealt Und der neue Rotamer ist akzeptiert mit einer Wahrscheinlichkeit von:
wo β ist der Boltzmann Konstante und die Temperatur T kann so ausgewählt werden, dass es in den Anfangsrunden hoch ist und langsam ist geglüht lokale Minima überwinden.[12]
SCHNELLER
Der schnellere Algorithmus verwendet eine Kombination aus deterministischen und stochastischen Kriterien, um Aminosäuresequenzen zu optimieren. Schneller verwendet Dee, um Rotamere zu eliminieren, die nicht Teil der optimalen Lösung sind. Dann optimieren eine Reihe iterativer Schritte die Rotamerzuordnung.[32][33]
Glaubensverbreitung
Im Glaubensverbreitung Für das Proteindesign tauscht der Algorithmus Nachrichten aus, die die beschreiben, die die beschreiben Glauben dass jeder Rest über die Wahrscheinlichkeit jedes Rotamers in benachbarten Rückständen verfügt. Der Algorithmus aktualisiert Nachrichten über jede Iteration und iteriert bis zur Konvergenz oder bis zu einer festen Anzahl von Iterationen. Konvergenz ist im Proteindesign nicht garantiert. Die Nachricht mi → j(rj das ein Rückstand i sendet an jeden Rotamer (rj bei benachbarten Rückständen j ist definiert als:
Sowohl Maxprodukt- als auch Summenprodukt-Glaubensausbreitung wurden verwendet, um das Proteindesign zu optimieren.
Anwendungen und Beispiele für entworfene Proteine
Enzymdesign
Das Design von neu Enzyme ist eine Verwendung des Proteindesigns mit riesigen Bioengineer- und biomedizinischen Anwendungen. Im Allgemeinen kann das Entwerfen einer Proteinstruktur sich von der Gestaltung eines Enzyms unterscheiden, da das Design von Enzymen viele Zustände berücksichtigen muss, die daran beteiligt sind katalytischer Mechanismus. Das Proteindesign ist jedoch eine Voraussetzung von de novo Enzymdesign Da zumindest das Design von Katalysatoren ein Gerüst erfordert, in dem der katalytische Mechanismus eingeführt werden kann.[34]
Großartige Fortschritte in de novo Enzymdesign und Neugestaltung wurden im ersten Jahrzehnt des 21. Jahrhunderts hergestellt. In drei Hauptstudien, David Baker und Kollegen de novo Entworfene Enzyme für den Retro-Aldol -Reaktion,[35] eine Kemp-Eliminierungsreaktion,[36] und für die Diels-Alder-Reaktion.[37] Darüber hinaus entwickelten Stephen Mayo und Mitarbeiter eine iterative Methode, um das effizienteste bekannte Enzym für die KEMP-Eliminierungsreaktion zu entwerfen.[38] Auch im Labor von Bruce DonaldDas Design des Computerproteins wurde verwendet, um die Spezifität eines der zu wechseln Proteindomänen des Nicht ribosomale Peptidsynthetase das produziert Gramicidin saus seinem natürlichen Substrat Phenylalanin an andere nicht geeignete Substrate, einschließlich geladener Aminosäuren; Die neu gestalteten Enzyme hatten Aktivitäten nahe der des Wildtyps.[39]
Design für Affinität
Protein -Protein -Wechselwirkungen sind an den meisten biotischen Prozessen beteiligt. Viele der schwersten Krankheiten, wie z. Alzheimer'S, viele Formen von Krebs (z.B., TP53) und menschliches Immundefizienzvirus (HIV) Infektion umfasst Protein -Protein -Wechselwirkungen. Um solche Krankheiten zu behandeln, ist es wünschenswert, Protein oder Protein-ähnliche Therapeutika zu entwerfen, die einen der Partner der Wechselwirkung binden und somit die krankheitsverursachende Wechselwirkung stören. Dies erfordert die Gestaltung von Protein-Therapeutika für Affinität gegenüber seinem Partner.
Protein -Protein -Wechselwirkungen können unter Verwendung von Proteindesignalgorithmen entwickelt werden, da die Prinzipien, die Proteinstabilität regieren, auch Protein -Protein -Bindung regieren. Das Protein -Protein -Wechselwirkungsdesign stellt jedoch Herausforderungen dar, die nicht häufig im Proteindesign vorhanden sind. Eine der wichtigsten Herausforderungen besteht darin, dass die Grenzflächen zwischen Proteinen im Allgemeinen polarer sind als Proteinkerne, und die Bindung beinhaltet einen Kompromiss zwischen Desolvation und Wasserstoffbindungsbildung.[40] Um diese Herausforderung zu überwinden, entwickelten Bruce Tidor und Mitarbeiter eine Methode zur Verbesserung der Affinität von Antikörpern, indem sie sich auf elektrostatische Beiträge konzentrierten. Sie fanden heraus, dass für die in der Studie entworfenen Antikörper die Reduzierung der Desolvationskosten der Reste in der Grenzfläche die Affinität des Bindungspaars erhöhte.[40][41][42]
Bewertung von Bindungsvorhersagen
Proteindesign-Energiefunktionen müssen an Bewertungsbindungsvorhersagen angepasst werden, da die Bindung einen Kompromiss zwischen dem niedrigsten beinhaltet.Energie Konformationen der freien Proteine (EP und EL) und die niedrigste Konformation des gebundenen Komplexes (EPl):
.
Der k* -Algorithmus nähert sich der Bindungskonstante des Algorithmus durch Einbeziehung der Konformationsentropie in die Berechnung der freien Energie. Der K* -Algorithmus betrachtet nur die niedrigsten Konformationen der freien und gebundenen Komplexe (mit den Sätzen bezeichnet P, L, und Pl) um die Partitionsfunktionen jedes Komplexes zu approximieren:[14]
Design für Spezifität
Das Design von Protein -Protein -Wechselwirkungen muss hochspezifisch sein, da Proteine mit einer großen Anzahl von Proteinen interagieren können. Erfolgreiches Design erfordert selektive Bindemittel. Somit müssen Protein-Design-Algorithmen in der Lage sein, zwischen dem Target (oder zwischen dem Ziel zu unterscheiden Positives Design) und Off-Target-Bindung (oder negatives Design).[2][40] Eines der bekanntesten Beispiele für die Spezifität ist das Design von Spezifikum BZIP-Bindende Peptide von Amy Keating und Mitarbeitern für 19 von 20 BZIP -Familien; 8 dieser Peptide waren spezifisch für ihren beabsichtigten Partner über konkurrierende Peptide.[40][43][44] Weitere positive und negative Designs wurden auch von Anderson und Mitarbeitern verwendet, um Mutationen im aktiven Zentrum eines Arzneimittelziels vorherzusagen, das einem neuen Arzneimittel Resistenz verlieh; Positives Design wurde verwendet, um die Wildtypaktivität aufrechtzuerhalten, während negatives Design verwendet wurde, um die Bindung des Arzneimittels zu stören.[45] Die jüngste rechnerische Neugestaltung von Costas Maranas und Mitarbeitern war auch in der Lage, das experimentell zu wechseln Cofaktor Spezifität von Candida boidinii Xylose -Reduktase von NADPH zu NADH.[46]
Protein -Reservierung
Die Protein -Reservierung besteht darin, die Oberfläche eines Proteins zu entwerfen und gleichzeitig die gesamten Falt-, Kern- und Randregionen des Proteins beizubehalten. Die Protein -Reservierung ist besonders nützlich, um die Bindung eines Proteins an andere Proteine zu verändern. Eine der wichtigsten Anwendungen der Protein -Resufferung war das Design der RSC3 -Sonde, um im NIH -Impfstoffforschungszentrum breit neutralisierende HIV -Antikörper auszuwählen. Erstens wurden Reste außerhalb der Bindungsgrenzfläche zwischen dem GP120-HIV-Hüllprotein und dem früher entdeckten B12-Antikörper ausgewählt, um zu entwerfen. Anschließend wurde die Abstandssequenz basierend auf evolutionären Informationen, Löslichkeit, Ähnlichkeit mit dem Wildtyp und anderen Überlegungen ausgewählt. Dann wurde die Rosettadesign -Software verwendet, um optimale Sequenzen im ausgewählten Sequenzraum zu finden. RSC3 wurde später verwendet, um den breit neutralisierenden Antikörper VRC01 im Serum einer langfristigen HIV-infizierten Nicht-Progressor-Person zu entdecken.[47]
Design von kugelförmigen Proteinen
Kugelproteine sind Proteine, die einen hydrophoben Kern und eine hydrophile Oberfläche enthalten. Globuläre Proteine nehmen häufig eine stabile Struktur an, anders als als Faserproteine, die mehrere Konformationen haben. Die dreidimensionale Struktur von kugelförmigen Proteinen ist in der Regel einfacher zu bestimmen Röntgenkristallographie und Kernspinresonanz als beide faserigen Proteine und Membranproteine, was kugelförmige Proteine für das Proteindesign attraktiver machen als die anderen Arten von Proteinen. Die meisten erfolgreichen Proteindesigns haben globuläre Proteine beteiligt. Beide RSD-1, und Top7 war de novo Entwürfe von kugelförmigen Proteinen. Fünf weitere Proteinstrukturen wurden 2012 von der Baker Group entworfen, synthetisiert und verifiziert. Diese neuen Proteine erfüllen keine biotische Funktion, aber die Strukturen sollen als Gebäudeblocks fungieren, die erweitert werden können, um funktionelle aktive Stellen einzubeziehen. Die Strukturen wurden rechnerisch unter Verwendung neuer Heuristiken gefunden, basierend auf der Analyse der Verbindungsschleifen zwischen Teilen der Sequenz, die sekundäre Strukturen festlegen.[48]
Design von Membranproteinen
Mehrere Transmembranproteine wurden erfolgreich entwickelt,[49] zusammen mit vielen anderen membranassoziierten Peptiden und Proteinen.[50] Vor kurzem entwickelten Costas Maranas und seine Mitarbeiter ein automatisiertes Werkzeug[51] Um die Porengröße von äußerer Membranporin Typ-F (OMPF) von neu zu gestalten E coli zu jeder gewünschten Sub-NM-Größe und montierten sie in Membranen, um eine präzise Angstrom-Skala-Trennung durchzuführen.
Andere Anwendungen
Eine der wünschenswertesten Verwendungen für das Proteindesign ist für Biosensoren, Proteine, die das Vorhandensein spezifischer Verbindungen spüren. Einige Versuche bei der Gestaltung von Biosensoren sind Sensoren für unnatürliche Moleküle einschließlich Tnt.[52] In jüngerer Zeit entwarfen Kuhlman und Mitarbeiter einen Biosensor der PAK1.[53]
In gewissem Sinne ist das Proteindesign eine Untergruppe von Batteriedesign.[Weitere Erklärung erforderlich]
Siehe auch
- Molekulare Designsoftware
- Eiweißtechnik
- Proteinstruktur -Vorhersage -Software
- Vergleich der Software für die molekulare Mechanikmodellierung
Verweise
- ^ Korendovych, Ivan (19. März 2018). "Minimalistisches Design von Peptid- und Proteinkatalysatoren". American Chemical Society. Abgerufen 22. März, 2018.
- ^ a b c d e f Richardson, JS; Richardson, DC (Juli 1989). "Das De -novo -Design von Proteinstrukturen". Trends in biochemischen Wissenschaften. 14 (7): 304–9. doi:10.1016/0968-0004 (89) 90070-4. PMID 2672455.
- ^ a b c Dahiyat, bi; Mayo, SL (3. Oktober 1997). "De novo Protein Design: Vollautomatisierte Sequenzauswahl". Wissenschaft. 278 (5335): 82–7. Citeseerx 10.1.1.72.7304. doi:10.1126/Science.278.5335.82. PMID 9311930.
- ^ a b Gordon, DB; Marshall, SA; Mayo, SL (August 1999). "Energiefunktionen für Proteindesign". Aktuelle Meinung in der Strukturbiologie. 9 (4): 509–13. doi:10.1016/s0959-440x (99) 80072-4. PMID 10449371.
- ^ a b Harbury, PB; PLECS, JJ; Tidor, b; Alber, t; Kim, PS (20. November 1998). "Hochauflösendes Proteindesign mit Rückgratfreiheit". Wissenschaft. 282 (5393): 1462–7. doi:10.1126/science.282.5393.1462. PMID 9822371.
- ^ a b c Kuhlman, b; Dantas, G; Ireton, GC; Varani, G; Stoddard, BL; Baker, D (21. November 2003). "Design einer neuartigen globulären Proteinfalte mit Genauigkeit auf Atomebene". Wissenschaft. 302 (5649): 1364–8. Bibcode:2003Sci ... 302.1364K. doi:10.1126/Science.1089427. PMID 14631033. S2CID 1939390.
- ^ Sterner, R; Merkl, R; Raulushel, FM (Mai 2008). "Computerdesign von Enzymen". Chemie & Biologie. 15 (5): 421–3. doi:10.1016/j.chembiol.2008.04.007. PMID 18482694.
- ^ Wu, x; Yang, Zy; Li, y; Hogerkorp, CM; Schief, WR; Seemann, MS; Zhou, t; Schmidt, SD; Wu, L; Xu, l; Longo, NS; McKee, K; O'Dell, s; Lauter, MK; Wycuff, DL; Feng, y; Nason, M; Doria-Rose, n; Connors, M; Kwong, PD; Roederer, M; Wyatt, RT; Nabel, GJ; Mascola, jr (13. August 2010). "Rationales Design der Hülle identifiziert weitgehend neutralisierende menschliche monoklonale Antikörper gegen HIV-1". Wissenschaft. 329 (5993): 856–61. Bibcode:2010Sci ... 329..856W. doi:10.1126/Science.1187659. PMC 2965066. PMID 20616233.
- ^ Höcker, B (8. November 2012). "Strukturbiologie: Eine Toolbox für Proteindesign". Natur. 491 (7423): 204–5. Bibcode:2012natur.491..204h. doi:10.1038/491204a. PMID 23135466. S2CID 4426247.
- ^ a b c Lovell, SC; Wort, JM; Richardson, JS; Richardson, DC (15. August 2000). "Die vorletzte Rotamer -Bibliothek". Proteine. 40 (3): 389–408. Citeseerx 10.1.1.555.4071. doi:10.1002/1097-0134 (20000815) 40: 3 <389 :: AIDProt50> 3.0.co; 2-2. PMID 10861930.
- ^ Shapovalov, MV; Dunbrack RL, JR (8. Juni 2011). "Eine geglättete Rückgrat-abhängige Rotamer-Bibliothek für Proteine, die aus adaptiven Kernendichteschätzungen und Regressionen abgeleitet sind". Struktur. 19 (6): 844–58. doi:10.1016/j.str.2011.03.019. PMC 3118414. PMID 21645855.
- ^ a b Samish, ich; Macdermaid, CM; Perez-Aguilar, JM; Saven, JG (2011). "Theoretisches und rechnerisches Proteindesign". Jährliche Überprüfung der physikalischen Chemie. 62: 129–49. Bibcode:2011Arpc ... 62..129s. doi:10.1146/Annurev-Physchem-032210-103509. PMID 21128762.
- ^ a b Mandell, DJ; Kortemme, t (August 2009). "Rückgrat Flexibilität im Computerproteindesign" (PDF). Aktuelle Meinung in der Biotechnologie. 20 (4): 420–8. doi:10.1016/j.copbio.2009.07.006. PMID 19709874.
- ^ a b c d e f Donald, Bruce R. (2011). Algorithmen in der strukturellen molekularen Biologie. Cambridge, MA: MIT Press.
- ^ a b Boas, F. E. & Harbury, P. B. (2007). "Potentielle Energiefunktionen für das Proteindesign". Aktuelle Meinung in der Strukturbiologie. 17 (2): 199–204. doi:10.1016/j.sbi.2007.03.006. PMID 17387014.
- ^ a b c d Boas, Fe; Harbury, PB (April 2007). "Potentielle Energiefunktionen für das Proteindesign". Aktuelle Meinung in der Strukturbiologie. 17 (2): 199–204. doi:10.1016/j.sbi.2007.03.006. PMID 17387014.
- ^ Vizcarra, CL; Mayo, SL (Dezember 2005). "Elektrostatik im Computerproteindesign". Aktuelle Meinung in der chemischen Biologie. 9 (6): 622–6. doi:10.1016/j.cbpa.2005.10.014. PMID 16257567.
- ^ Zhou, t; Georgiev, ich; Wu, x; Yang, Zy; Dai, K; Finzi, a; Kwon, YD; Scheid, JF; Shi, W; Xu, l; Yang, y; Zhu, J; Nussenzweig, MC; Sodroski, J; Shapiro, L; Nabel, GJ; Mascola, JR; Kwong, PD (13. August 2010). "Strukturelle Basis für die breite und starke Neutralisation von HIV-1 durch Antikörper VRC01". Wissenschaft. 329 (5993): 811–7. Bibcode:2010Sci ... 329..811z. doi:10.1126/Science.1192819. PMC 2981354. PMID 20616231.
{{}}
: Cs1 montiert: Mehrfachnamen: Autorenliste (Link) - ^ Mendes, J; Guerois, R; Serrano, L (August 2002). "Energieschätzung im Proteindesign". Aktuelle Meinung in der Strukturbiologie. 12 (4): 441–6. doi:10.1016/s0959-440x (02) 00345-7. PMID 12163065.
- ^ Pierce, NA; Winfree, E (Oktober 2002). "Proteindesign ist np-hard". Eiweißtechnik. 15 (10): 779–82. doi:10.1093/Protein/15.10.779. PMID 12468711.
- ^ a b Voigt, CA; Gordon, DB; Mayo, SL (9. Juni 2000). "Handelsgenauigkeit für Geschwindigkeit: Ein quantitativer Vergleich von Suchalgorithmen im Proteinsequenzdesign". Journal of Molecular Biology. 299 (3): 789–803. Citeseerx 10.1.1.138.2023. doi:10.1006/jmbi.2000.3758. PMID 10835284.
- ^ Hong, EJ; Lippow, SM; Tidor, b; Lozano-Pérez, T (September 2009). "Rotamer-Optimierung für das Proteindesign durch Kartenschätzung und Reduzierung der Problemgröße". Journal of Computational Chemistry. 30 (12): 1923–45. doi:10.1002/jcc.21188. PMC 3495010. PMID 19123203.
- ^ "Maschinelles Lernen zeigt ein Rezept für den Aufbau künstlicher Proteine". Phys.org. Abgerufen 17. August, 2020.
- ^ Russ, William P.; Figliuzzi, Matteo; Stocker, Christian; Barrat-Charlaix, Pierre; Socolich, Michael; Kast, Peter; Hilvert, Donald; Monasson, Remi; Cocco, Simona; Weigt, Martin; Ranganathan, Rama (2020). "Ein auf Evolution basierendes Modell zur Gestaltung von Chorismatemutase-Enzymen". Wissenschaft. 369 (6502): 440–445. Bibcode:2020Sci ... 369..440r. doi:10.1126/science.aba3304. PMID 32703877. S2CID 220714458.
- ^ Gordon, DB; Mayo, SL (15. September 1999). "Branch-and-Termination: Ein kombinatorischer Optimierungsalgorithmus für das Proteindesign". Struktur. 7 (9): 1089–98. doi:10.1016/s0969-2126 (99) 80176-2. PMID 10508778.
- ^ a b Leach, AR; Lemon, AP (1. November 1998). "Erforschen des Konformationsraums der Protein-Seitenketten mithilfe der Dead-End-Eliminierung und des A* -Algorithmus". Proteine. 33 (2): 227–39. Citeseerx 10.1.1.133.7986. doi:10.1002/(SICI) 1097-0134 (19981101) 33: 2 <227 :: AID-PROT7> 3.0.CO; 2-F.. PMID 9779790.
- ^ a b Kingsford, CL; Chazelle, b; Singh, M (1. April 2005). "Lösen und Analysieren von Seitenkettenpositionierungsproblemen mithilfe der linearen und ganzzahligen Programmierung". Bioinformatik. 21 (7): 1028–36. doi:10.1093/bioinformatics/bti144. PMID 15546935.
- ^ Yanover, Chen; Talya Meltzer; Yair Weiss (2006). "Lineare Programmierrelaxationen und Glaubensausbreitung - eine empirische Studie". Journal of Machine Learning Research. 7: 1887–1907.
- ^ Wainwright, Martin J; Tommi S. Jaakkola; Alan S. Willsky (2005). "Kartenschätzung durch Übereinstimmung auf Bäumen: Nachrichten-Passing und lineare Programmierung". IEEE -Transaktionen zur Informationstheorie. 51 (11): 3697–3717. Citeseerx 10.1.1.71.9565. doi:10.1109/tit.2005.856938. S2CID 10007532.
- ^ Kolmogorov, Vladimir (28. Oktober 2006). "Konvergent-baumweicher Nachrichten für die Energieminimierung". IEEE -Transaktionen zur Musteranalyse und Maschinenintelligenz. 28 (10): 1568–1583. doi:10.1109/tpami.2006.200. PMID 16986540. S2CID 8616813.
- ^ Globerson, Amir; Tommi S. Jaakkola (2007). "Reparieren von Max-Product: Convergent Message Passing-Algorithmen für MAP-LP-Relaxationen". Fortschritte in den neuronalen Informationsverarbeitungssystemen.
- ^ Allen, BD; Mayo, SL (30. Juli 2006). "Dramatische Leistungsverbesserungen für den schnelleren Optimierungsalgorithmus". Journal of Computational Chemistry. 27 (10): 1071–5. Citeseerx 10.1.1.425.5418. doi:10.1002/jcc.20420. PMID 16685715. S2CID 769053.
- ^ Desmet, J; Spriet, J; Lasters, I (1. Juli 2002). "Schnelle und genaue Nebenkettentopologie und Energieverfeinerung (schneller) als neue Methode zur Proteinstrukturoptimierung". Proteine. 48 (1): 31–43. doi:10.1002/prot.10131. PMID 12012335. S2CID 21524437.
- ^ Baker, D (Oktober 2010). "Ein aufregender, aber herausfordernder Weg für das Computer -Enzym -Design". Proteinwissenschaft. 19 (10): 1817–9. doi:10.1002/pro.481. PMC 2998717. PMID 20717908.
- ^ Jiang, Lin; Althoff, Eric A.; Clemente, Fernando R.; Doyle, Lindsey; Rothlisberger, Daniela; Zanghellini, Alexandre; Gallaher, Jasmine L.; Betker, Jamie L.; Tanaka, Fujie (2008). "De-novo Computational Design von Retro-Aldol-Enzymen". Wissenschaft. 319 (5868): 1387–91. Bibcode:2008sci ... 319.1387J. doi:10.1126/Science.1152692. PMC 3431203. PMID 18323453.
- ^ Röttlisberger, Daniela; Kherssonsky, Olga; Wollacott, Andrew M.; Jiang, Lin; DeChancie, Jason; Betker, Jamie; Gallaher, Jasmine L.; Althoff, Eric A.; Zanghellini, Alexandre (2008). "Kemp -Eliminierungskatalysatoren durch Computational Enzym Design". Natur. 453 (7192): 190–5. Bibcode:2008natur.453..190r. doi:10.1038/nature06879. PMID 18354394.
- ^ Siegel, JB; Zanghellini, a; Lovick, HM; Kuss, G; Lambert, AR; St Clair, JL; Gallaher, JL; Hilvert, d; Gelb, MH; Stoddard, BL; Houk, KN; Michael, FE; Baker, D (16. Juli 2010). "Berechnungsdesign eines Enzymkatalysators für eine stereoselektive bimolekulare Diels-Alder-Reaktion". Wissenschaft. 329 (5989): 309–13. Bibcode:2010Sci ... 329..309s. doi:10.1126/Science.1190239. PMC 3241958. PMID 20647463.
{{}}
: Cs1 montiert: Mehrfachnamen: Autorenliste (Link) - ^ Privett, HK; Kuss, G; Lee, TM; Blomberg, R; Chica, RA; Thomas, LM; Hilvert, d; Houk, KN; Mayo, SL (6. März 2012). "Iterativer Ansatz für das Computer -Enzymdesign". Verfahren der Nationalen Akademie der Wissenschaften der Vereinigten Staaten von Amerika. 109 (10): 3790–5. Bibcode:2012pnas..109.3790p. doi:10.1073/pnas.1118082108. PMC 3309769. PMID 22357762.
- ^ Chen, Cy; Georgiev, ich; Anderson, AC; Donald, Br (10. März 2009). "Rechenstrukturbasierte Neugestaltung der Enzymaktivität". Verfahren der Nationalen Akademie der Wissenschaften der Vereinigten Staaten von Amerika. 106 (10): 3764–9. Bibcode:2009pnas..106.3764c. doi:10.1073/pnas.0900266106. PMC 2645347. PMID 19228942.
- ^ a b c d Karanicolas, J; Kuhlman, b (August 2009). "Berechnungsdesign von Affinität und Spezifität an Protein -Protein -Schnittstellen". Aktuelle Meinung in der Strukturbiologie. 19 (4): 458–63. doi:10.1016/j.sbi.2009.07.005. PMC 2882636. PMID 19646858.
- ^ Shoichet, BK (Oktober 2007). "Keine freie Energie Mittagessen". Naturbiotechnologie. 25 (10): 1109–10. doi:10.1038/NBT1007-1109. PMID 17921992. S2CID 5527226.
- ^ Lippow, SM; Wittrup, KD; Tidor, B (Oktober 2007). "Berechnungsdesign der Antikörper-Affinitäts-Verbesserung jenseits der In-vivo-Reifung". Naturbiotechnologie. 25 (10): 1171–6. doi:10.1038/nbt1336. PMC 2803018. PMID 17891135.
- ^ Schreiber, G; Keating, AE (Februar 2011). "Proteinbindungsspezifität gegenüber Promiskuität". Aktuelle Meinung in der Strukturbiologie. 21 (1): 50–61. doi:10.1016/j.sbi.2010.10.002. PMC 3053118. PMID 21071205.
- ^ Grigoryan, G; Reinke, AW; Keating, AE (16. April 2009). "Das Design der Protein-Interaktionsspezifität ergibt selektive bzip-bindende Peptide". Natur. 458 (7240): 859–64. Bibcode:2009natur.458..859g. doi:10.1038/nature07885. PMC 2748673. PMID 19370028.
- ^ Frey, km; Georgiev, ich; Donald, Br; Anderson, AC (3. August 2010). "Vorhersage von Resistenzmutationen unter Verwendung von Proteindesignalgorithmen". Verfahren der Nationalen Akademie der Wissenschaften der Vereinigten Staaten von Amerika. 107 (31): 13707–12. Bibcode:2010pnas..10713707f. doi:10.1073/pnas.1002162107. PMC 2922245. PMID 20643959.
- ^ Khoury, GA; Fazelinia, H; Chin, JW; Pantazes, RJ; Cirino, PC; Maranas, CD (Oktober 2009). "Computerdesign von Candida Boidinii Xylose -Reduktase für veränderte Cofaktorspezifität". Proteinwissenschaft. 18 (10): 2125–38. doi:10.1002/pro.227. PMC 2786976. PMID 19693930.
- ^ Burton, Dr. Weiss, RA (13. August 2010). "AIDS/HIV. Ein Schub für HIV -Impfstoffdesign". Wissenschaft. 329 (5993): 770–3. Bibcode:2010Sci ... 329..770b. doi:10.1126/Science.1194693. PMID 20705840. S2CID 206528638.
- ^ Jessica Marshall (7. November 2012). "Proteine auf Bestellung gemacht". Naturnachrichten. Abgerufen 17. November, 2012.
- ^ Entworfene Transmembran-Alpha-Hairpin-Proteine in OPM -Datenbank
- ^ Entworfene membranassoziierte Peptide und Proteine in OPM -Datenbank
- ^ Chowdhury, Ratul; Kumar, Manish; Maranas, Costas D.; Golbeck, John H.; Baker, Carol; Prabhakar, Jeevan; Grisewood, Matthew; Decker, Karl; Shankla, Manish (10. September 2018). "Poresigner zum Stimmen der gelösten Selektivität in einer robusten und hochdurchlässigen Außenmembranpore". Naturkommunikation. 9 (1): 3661. Bibcode:2018natco ... 9.3661c. doi:10.1038/s41467-018-06097-1. ISSN 2041-1723. PMC 6131167. PMID 30202038.
- ^ Looger, Loren L.; Dwyer, Mary A.; Smith, James J. & Hellinga, Homme W. (2003). "Berechnungsdesign von Rezeptor- und Sensorproteinen mit neuartigen Funktionen". Natur. 423 (6936): 185–190. Bibcode:2003Natur.423..185l. doi:10.1038/nature01556. PMID 12736688. S2CID 4387641.
- ^ JHA, RK; Wu, yi; Zawistowski, JS; MacNevin, C; Hahn, Km; Kuhlman, B (21. Oktober 2011). "Neugestaltung der PAK1 Autoinhibitoric -Domäne für verbesserte Stabilität und Affinität in Biosensoranwendungen". Journal of Molecular Biology. 413 (2): 513–22. doi:10.1016/j.jmb.2011.08.022. PMC 3202338. PMID 21888918.
Weitere Lektüre
- Donald, Bruce R. (2011). Algorithmen in der strukturellen molekularen Biologie. Cambridge, MA: MIT Press.
- Sander, Chris; Vriend, Gerrit; Bazan, Fernando; Horovitz, Amnon; Nakamura, Haruki; Ribas, Luis; Finkelstein, Alexei V.; Lockhart, Andrew; Merkl, Rainer; et al. (1992). "Proteindesign auf Computern. Fünf neue Proteine: Shpilka, Grendel, Fingerclasp, Leder und Aida". Proteine: Struktur, Funktion und Bioinformatik. 12 (2): 105–110. doi:10.1002/prot.340120203. PMID 1603799. S2CID 38986245.
- Jin, Wenzhen; Kambara, Ohki; Sasakawa, Hiroaki; Tamura, ATSUO & Takada, Shoji (2003). "De -novo -Design von faltbaren Proteinen mit reibungslosen Falttrichter: Automatisiertes negatives Design und experimentelle Überprüfung". Struktur. 11 (5): 581–590. doi:10.1016/s0969-2126 (03) 00075-3. PMID 12737823.
- Pokala, Navin & Handel, Tracy M. (2005). "Energiefunktionen für das Proteindesign: Anpassung mit Protein -Protein -Komplex -Affinitäten, Modelle für den entfalteten Zustand und negatives Design von Löslichkeit und Spezifität". Journal of Molecular Biology. 347 (1): 203–227. doi:10.1016/j.jmb.2004.12.019. PMID 15733929.