Protein Data Bank
Protein Data Bank | ||||
---|---|---|---|---|
Type | databank | |||
Taal | Engels | |||
Registratie | optioneel | |||
Eigenaar | Worldwide Protein Data Bank | |||
Status | actief | |||
Link | Officiële website | |||
|
De Protein Data Bank (PDB) is een vrij toegankelijke databank met gegevens van grote biomoleculen zoals eiwitten en nucleïnezuren. De PDB wordt beheerd door de organisatie Worldwide Protein Data Bank (wwPDB). De gegevens in de databank zijn voornamelijk afkomstig van röntgendiffractie en NMR-spectroscopie door wetenschappers over de hele wereld.[1]
De PDB is een belangrijke bron voor onder meer de verschillende takken van de systeembiologie, zoals structurele genomica. De meeste belangrijke journals en organisaties, zoals de National Institutes of Health in de Verenigde Staten, eisen van wetenschappers dat ze hun structuurgegevens op de PDB plaatsen.
Andere databanken maken gebruik van de gegevens in de PDB om eiwitten te classificeren volgens bepaalde patronen. Zo verdelen bijvoorbeeld SCOP en CATH de structuren onder in groepen volgens het type structuur en de veronderstelde evolutionaire relaties; Gene Ontology categoriseert de structuren op basis van genen.[2]
Geschiedenis
[bewerken | brontekst bewerken]In 1971 werd de gegevensbank opgezet in Brookhaven.[2] Tussen 1998 en 1999 kwam de PDB terecht bij het Research Collaboratory for Structural Bioinformatics (RCSB). In 2003 werd het wwPDB opgezet als formalisering van een bestaande samenwerking, waarmee de PDB een internationale organisatie werd. De vier leden van de wwPDB fungeren daarbij als centrum om de gegevens te plaatsen, te verwerken (o.a. annoteren) en te verdelen.
Inhoud
[bewerken | brontekst bewerken]De PDB wordt wekelijks geactualiseerd. De statistieken zijn te volgen op de PDB Holdings List.
De meeste structuren zijn bepaald met röntgendiffractie, ongeveer 15% van de structuren is bepaald door NMR en enkele zijn zelfs met elektronenmicroscopie bepaald. Voor structuren die bepaald zijn door röntgendiffractie zijn ook bestanden beschikbaar die de elektronendichtheid beschrijven, en waarmee deze in een geschikt programma grafisch kan worden weergegeven. Deze bestanden staan op de Electron Density Server.[3]
In het verleden steeg het aantal structuren in de PDB bijna exponentieel. Die stijging is nu minder sterk. In 2009 werden nog 7448 structuren toegevoegd, het hoogste aantal ooit.
Bestandsformaat
[bewerken | brontekst bewerken]Het eerste bestandstype voor de PDB was het PDB-bestand. Dit oorspronkelijke formaat was in de breedte beperkt tot de omvang van ponskaarten: 80 tekens per regel. Omstreeks 1996 werd het macromolecular Crystallographic Information file-bestandstype, kortweg mmCIF, ingevoerd. Een XML-versie van dit type, PDBML, werd in 2005 gelanceerd.[4] De structuren kunnen in elk van deze drie formaten gedownload worden. De individuele bestanden kunnen ook als gecomprimeerde bestanden gedownload worden naar grafische pakketten met behulp van webadressen:
- voor PDB-bestanden:
http://www.pdb.org/pdb/files/4hhb.pdb.gz
; - voor PDBML-bestanden (XML):
http://www.pdb.org/pdb/files/4hhb.xml.gz
;
waarbij "4hhb
" de zogenaamde "PDB identifier" is, een vierdelige, alfanumerieke en unieke naam om het molecuul mee te identificeren. De gewone naam van het molecuul wordt niet gebruikt omdat meerdere structuren dezelfde naam hebben of omdat van één structuur meerdere versies aanwezig zijn.
Software om de bestanden grafisch voor te stellen kan onder meer op het internet gevonden worden, vaak als vrije software.
Externe links
[bewerken | brontekst bewerken]- The Worldwide Protein Data Bank (wwPDB), overkoepelende site van de regionale hosts:
- PDBe (Europa)
- PDBj (Japan)
- BMRB, Biological Magnetic Resonance Data Bank (VS)
- wwPDB Documentation, documentatie over de PDB- en PDBML-bestandstypen
- Nucleic Acid Database, NDB, een PDB-mirror om nucleïnezuren mee te zoeken
- Molecular Graphics Software Links (RCBS), een lijst met software om de moleculen grafisch mee voor te stellen
- ↑ (en) wwPDB, Consortium (2019). Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Res. 47 (D1): 520-528. PMID 30357364. PMC 6324056. DOI: 10.1093/nar/gky949.
- ↑ a b (en) Berman, H. M. (January 2008). The Protein Data Bank: a historical perspective. Acta Crystallographica Section A A64 (1): 88–95. PMID 18156675. DOI: 10.1107/S0108767307035623.
- ↑ Electron Density Server, Universiteit van Uppsala
- ↑ (en) Westbrook, J., et al. (2005). PDBML: the representation of archival macromolecular structure data in XML. Bioinformatics 21 (7): 988–992. DOI: 10.1093/bioinformatics/bti082. Gearchiveerd van origineel op 19 februari 2009.