Nationales Zentrum für Biotechnologie Information

Nationales Zentrum für
Biotechnologieinformationen
US-NLM-NCBI-Logo.svg
Abkürzung NCBI
Gegründet 1988; Vor 34 Jahren
Hauptquartier Bethesda, Maryland
Ort
Koordinaten 38 ° 59'45 ″ n 77 ° 05'56 ″ w/38,9959 ° N 77,0989 ° W
Offizielle Sprache
Englisch
Direktor
Stephen Sherry (Schauspiel)
(Seit dem 31. März 2020)
Elternorganisation
National Library of Medicine der Vereinigten Staaten der Vereinigten Staaten
Zugehörigkeiten Nationales Gesundheitsinstitut
Webseite ncbi.nlm.nih.gov

Das Nationales Zentrum für Biotechnologie Information (NCBI)[1][2] ist Teil von National Library of Medicine der Vereinigten Staaten der Vereinigten Staaten (NLM), ein Zweig der Nationales Gesundheitsinstitut (NIH). Es wird von der Regierung der genehmigt und finanziert Vereinigte Staaten. Der NCBI befindet sich in Bethesda, Marylandund wurde 1988 durch Gesetzgebung gegründet, die vom US -Kongressabgeordneten gesponsert wurde Claude Pfeffer.

Die NCBI beherbergt eine Reihe von Datenbanken, die für relevant sind Biotechnologie und Biomedizin und ist eine wichtige Ressource für Tools und Dienste von Bioinformatik. Zu den wichtigsten Datenbanken gehören GenBank für DNA -Sequenzen und PubMed, eine bibliografische Datenbank für biomedizinische Literatur. Andere Datenbanken sind die NCBI -Epigenomics Datenbank. Alle diese Datenbanken sind online über die verfügbar Entrez Suchmaschine. NCBI wurde von inszeniert von David Lipman,[2] Einer der ursprünglichen Autoren der SPRENGEN Sequenzausrichtungsprogramm[3] und eine allgemein angesehene Figur in Bioinformatik.

GenBank

NCBI hatte die Verantwortung dafür, die GenBank zur Verfügung zu stellen DNA Sequenzdatenbank seit 1992.[4] GenBank koordiniert mit einzelnen Labors und anderen Sequenzdatenbanken, wie z. B. denen der Europäisches Labor der Molekularbiologie (Embl) und die DNA -Datenbank von Japan (Ddbj).[4]

Seit 1992 ist NCBI zusätzlich zu GenBank zu anderen Datenbanken gewachsen. NCBI liefert Gen, Online -Mendelianer Erbschaft beim Menschen, die molekulare Modellierungsdatenbank (3D -Proteinstrukturen), DBSNP (eine Datenbank von Einzelnukleotidpolymorphismen), die Referenzsequenzsammlung, eine Karte der Menschliches Genom, und ein Taxonomie Browser und koordiniert mit dem National Cancer Institute, um das Anatomie -Projekt von Cancer Genome zu liefern. Der NCBI weist jeder Art des Organismus eine eindeutige Kennung (Taxonomie -ID) zu.[5]

Das NCBI verfügt über Software -Tools, die über Internetbrowser oder von verfügbar sind Ftp. Zum Beispiel, SPRENGEN ist eine Sequenzähnlichkeitssuche. Blast kann Sequenzvergleiche mit der GenBank -DNA -Datenbank in weniger als 15 Sekunden durchführen.

NCBI -Bücherregal

Das NCBI -Bücherregal[6] ist eine Sammlung von frei zugänglichen, herunterladbaren Online -Versionen ausgewählter biomedizinischer Bücher. Das Bücherregal deckt eine breite Palette von Themen ab, einschließlich Molekularbiologie, Biochemie, Zellen-Biologie, Genetik, Mikrobiologie, Krankheitszustände aus molekularer und zellulärer Sicht, Forschungsmethoden und Virologie. Einige der Bücher sind Online -Versionen zuvor veröffentlichter Bücher, andere, wie z. Kaffeepause, werden von NCBI -Mitarbeitern geschrieben und bearbeitet. Das Bücherregal ist eine Ergänzung zum Entrez PubMed Repository von Peer-Review-Veröffentlichung Abstracts, in denen Bücherregalinhalte festgelegte Perspektiven auf sich entwickelnde Studienbereiche und einen Kontext bieten, in dem viele unterschiedliche einzelne Teile der gemeldeten Forschung organisiert werden können.

Grundlegende lokale Ausrichtungssuche Tool (BLAST)

SPRENGEN ist ein Algorithmus zur Berechnung der Sequenzähnlichkeit zwischen biologischen Sequenzen, wie z. B. Nukleotidsequenzen von DNA und Aminosäuresequenzen von Proteinen.[7] Blast ist ein leistungsstarkes Werkzeug, um Sequenzen zu finden, die der Abfragesequenz im selben Organismus oder in verschiedenen Organismen ähneln. Es durchsucht die Abfragesequenz in NCBI -Datenbanken und -Invers und veröffentlicht die Ergebnisse im ausgewählten Format an den Browser der Person. Eingangssequenzen zur Explosion sind hauptsächlich im Fasta- oder GenBank -Format, während die Ausgabe in einer Vielzahl von Formaten wie HTML, XML -Formatierung und einfachem Text geliefert werden kann. HTML ist das Standardausgabeformat für die Webseite des NCBI. Die Ergebnisse für NCBI-Blast werden im grafischen Format mit allen gefundenen Treffern dargestellt, eine Tabelle mit Sequenzidentifikatoren für die Treffer mit bewerteten Daten sowie die Ausrichtungen für die Interessensequenz und die mit analogen BLAST-Scores empfangenen Treffer für diese.[8]

Entrez

Das Entrez Das globale Query-Cross-Daten-Suchsystem wird bei NCBI für alle wichtigen Datenbanken wie Nucleotid- und Proteinsequenzen, Proteinstrukturen, PubMed, Taxonomie, vollständige Genome, Omim und mehrere andere verwendet.[9] Entrez ist sowohl ein Indexierungs- als auch ein Abrufsystem mit Daten aus verschiedenen Quellen für die biomedizinische Forschung. NCBI verteilte 1991 die erste Version von Entrez, die aus Nukleotidsequenzen von bestand PDB und GenBank, Proteinsequenzen aus Schweizer Protokoll, übersetzte GenBank, PIR, PRF, PDB und assoziierte Abstracts und Zitate von PubMed. Entrez wurde speziell entwickelt, um die Daten aus verschiedenen Quellen, Datenbanken und Formaten in ein einheitliches Informationsmodell und Abrufsystem zu integrieren, das diese relevanten Referenzen, Sequenzen und Strukturen effizient abrufen kann.[10]

Gen

Gene wurde bei NCBI implementiert, um die Informationen über Gene zu charakterisieren und zu organisieren. Es dient als Hauptknoten im Zusammenhang der Genomkarte, der Expression, der Sequenz, der Proteinfunktion, der Struktur und der Homologiedaten. Ein einzigartigem Gene wird jedem Gen -Datensatz zugeordnet, der durch Revisionszyklen verfolgt werden kann. Gen Aufzeichnungen für bekannte oder vorhergesagte Gene werden hier festgelegt und durch MAP -Positionen oder Nukleotidsequenzen abgegrenzt. Gene hat mehrere Vorteile gegenüber seinem Vorgänger, LocusLink, einschließlich einer besseren Integration mit anderen Datenbanken in NCBI, einem breiteren taxonomischen Bereich und verbesserten Optionen für Abfragen und Abrufen, die vom Entrez -System bereitgestellt werden.[11]

Protein

Die Proteindatenbank verwaltet den Textdatensatz für einzelne Proteinsequenzen, die aus vielen verschiedenen Ressourcen abgeleitet sind, z. Proteinaufzeichnungen sind in verschiedenen Formaten vorhanden, einschließlich Fasta und Xml und sind mit anderen NCBI -Ressourcen verbunden. Protein liefert die relevanten Daten für Benutzer wie Gene, DNA/RNA -Sequenzen, biologische Wege, Expression und Variationsdaten und Literatur. Es liefert auch die festgelegten Sätze ähnlicher und identischer Proteine ​​für jede Sequenz, wie sie durch die Explosion berechnet wird. Die Strukturdatenbank von NCBI enthält 3D-Koordinatensätze für experimentell festgelegte Strukturen in PDB, die von NCBI importiert werden. Die konservierte Domain -Datenbank (CDD) des Proteins enthält Sequenzprofile, die hochkonservierte Domänen in Proteinsequenzen charakterisieren. Es enthält auch Aufzeichnungen von externen Ressourcen wie Smart und Pfam. Es gibt eine andere Datenbank in einem Protein, das als Protein -Cluster -Datenbank bekannt ist, die Sätze von Proteinensequenzen enthält, die gemäß den maximalen Ausrichtungen zwischen den durch BLAST berechneten einzelnen Sequenzen geclustert werden.[12]

Pubchem -Datenbank

Pubchem Die Datenbank von NCBI ist eine öffentliche Ressource für Moleküle und ihre Aktivitäten gegen biologische Assays. Pubchem ist durchsuchbar und zugänglich von durch Entrez Informationsabrufsystem.[13]

Siehe auch

Verweise

  1. ^ "Das menschliche Genomprojekt". Die New York Times.
  2. ^ a b "Research Institute veröffentlicht Gendaten im Internet". Die New York Times. 26. Juni 1997.
  3. ^ "Sinn aus Sequenzen: Stephen F. Altschul über Bessere Blast". 2000. archiviert von das Original Am 2007-10-07.
  4. ^ a b Mizrachi, Ilene (22. August 2007). GenBank: Die Nukleotidsequenzdatenbank. Nationales Zentrum für Biotechnologieinformationen (USA) - über www.ncbi.nlm.nih.gov.
  5. ^ "Home - Taxonomie - NCBI". www.ncbi.nlm.nih.gov.
  6. ^ USA (2019-05-06). "Home - Bücher - NCBI". Ncbi.nlm.nih.gov. Abgerufen 2019-06-12.
  7. ^ Altschul Stephen; Gish Warren; Miller Webb; Myers Eugene; Lipman David (1990). "Grundlegende lokale Ausrichtungs -Suchwerkzeug". Journal of Molecular Biology. 215 (3): 403–410. doi:10.1016/s0022-2836 (05) 80360-2. PMID 2231712.
  8. ^ Madden T. (2002). Das NCBI -Handbuch, 2. Ausgabe, Kapitel 16, The Blast Sequence Analysis Tool
  9. ^ NCBI -Ressourcenkoordinatoren (2012). "Datenbankressourcen des Nationalen Zentrums für Biotechnologieinformationen". Nukleinsäuren Research 41 (Datenbankproblem): D8 - D20.
  10. ^ Ostell J. (2002). Das NCBI -Handbuch, 2. Ausgabe, Kapitel 15, Das Entrez Search and Retrieval System
  11. ^ Maglott D., Pruitt K. & Tatusova T. (2005). Das NCBI -Handbuch, 2. Ausgabe, Kapitel 19, Gen: Ein Geneverzeichnis
  12. ^ Sayers E. (2013). Das NCBI -Handbuch, 2. Auflage, NCBI -Proteinressourcen
  13. ^ Wang Y. & Bryant S H. (2014). Das NCBI -Handbuch, 2. Auflage, NCBI Pubchem Bioassay -Datenbank

Externe Links