Банка на податоци за белковини

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето
Банка на податоци за белковини
Database.png
Содржина
Опис
Контакт
Пристап
Податотечен форматPDB
Мреж. место
Алатки
Разно

Банката на податоци за белковини (анг. Protein Data Bank - PDB) е база на податоци на тродимензионални структури на биолошки макромолекули, како што се белковините (протеините) и нуклеинските киселини. Податоците главно се добиваат со рендгенска кристалографија, NMR спектроскопија или крио-електронска микроскопија и после поднесувањето од страна на истражувачите стануваат слободно достапни на Интернет преку веб-страниците на организациите членки (PDBe,[1] PDBj,[2] и RCSB[3]). PDB е надгледувана од страна на организацијата наречена Worldwide Protein Data Bank, wwPDB.

PDB е клучен извор на информации во областа на структурната биологија, како што е структурната геномика. Повеќето големи научни списанија и некои донаторски агенции, бараат од научниците да ги поднесат структурите добиени од нивните истражувања на PDB. Многу други бази на податоци користат протеински структури депонирани во PDB. На пример, SCOP и CATH ги класифицираат протеинските структури, додека PDBsum обезбедува графички преглед на записите во PDB со користење на информации од други извори, како што е Онтологија на гени (анг. Gene ontology - GO).[4][5]

Историја[уреди | уреди извор]

Иницијацијата на PDB се случила како резултат на конвергенцијата на две нешта: 1) мала, но растечка колекција на податоци за протеински структури добиени со дифракција на Х-зраци; и 2) новодостапното (1968 година) прикажување на молекуларна графика за визуелизација на овие структури во 3-D. Во 1969 година, со спонзорството на Волтер Хамилтон од Брукхејвенската национална лабораторија, Едгар Мејер (Тексашки А&М универзитет) започнал да пишува софтвер за складирање на датотеки со атомски координати во еден заеднички формат за да ги направи достапни за геометриска и графичка евалуација. До 1971 година, една од Мејеровите програми, SEARCH, им овозможила на истражувачите далечински пристап до информации од базата на податоци за офлајн проучување на протеински структури.[6] SEARCH бил инструментален во овозможувањето на вмрежувањето, а на тој начин го одбележал функционалниот почеток на PDB.

Банката на податоци за белковини, била објавена во октомври 1971 година во списанието Nature New Biology[7] како заеднички потфат на Кембричкиот центар за кристалографски податоци во Обединетото Кралство и Брукхејвенската национална лабораторија во САД.

По смртта на Хамилтон во 1973 година, Том Кецл го презел водството на PDB во следните 20 години. Во јануари 1994 година, Џоел Сусман од израелскиот Научен институт Вајзман бил назначен за раководител на PDB. Во октомври 1998 година,[8] PDB била префрлена на Истражувачката соработка за структурна биоинформатика (Research Collaboratory for Structural Bioinformatics - RCSB); трансферот завршил во јуни 1999 година. Нов директор била Хелен М. Берман од Рутгерс универзитетот (една од менаџерските институции на RCSB, а другата е Суперкомпјутерскиот центар во Сан Диего при Калифорнискиот универзитет во Сан Диего).[9] Во 2003 година, со формирањето на wwPDB (од анг. Worldwide Protein Data Bank), PDB станала меѓународна организација. Оснивачки членки се PDBe (Европа),[1] RCSB (САД) и PDBj (Јапонија).[2] Банката на податоци за биолошка магнетна резонанца (Biological Magnetic Resonance Data Bank - BMRB)[10] се приклучила во 2006 година. Секоја од четирите членки на wwPDB може да игра улога на центар за депонирање, центар за обработка на податоци и дистрибутивен центри за податоци на PDB. Обработката на податоците се однесува на фактот што персоналот на wwPDB го прегледува и анотира секој поднесен запис.[11] Потоа податоците автоматски се проверуваат за веродостојност (изворниот код[12] за овој софтвер за валидација е достапен за јавноста, без надомест).

Содржина[уреди | уреди извор]

Примери за белковински структури од PDB (создадени со UCSF Chimera)
Стапка на одредување на белковински структури по метод и година

PDB базата на податоци се ажурира неделно (UTC+0 среда). Исто така, PDB листата[13] исто така се ажурира неделно. До 17 октомври 2018 година, тековната листа е следна:

Експериментален метод Протеини Нуклеински киселини Комплекси на

протеини/нуклеински киселини

Други Вкупно
Дифракција на Х-зраци 121935 1963 6289 4 130191
NMR 10872 1260 251 8 12391
Електронската микроскопија 1810 31 652 0 2493
Хибридни методи 123 5 2 1 131
Други 244 4 6 13 267
Вкупно: 134984 3263 7200 26 145473
120,052 структури во PDB имаат датотека за структурен фактор.
9,734 структури имаат NMR датотека.
3,486 структури во PDB имаат датотека за хемиски шифт.
2,531 структури во PDB имаат 3DEM мапна датотека депонирана во електронско-микроскопската банка на податоци (Electron Microscopy Data Bank - EMDB)

Овие податоци покажуваат дека повеќето структури се определени со дифракција на Х-зраци, но околу 10% од структурите сега се добиваат со нуклеарно магнетно резонантна спектроскопија на белковини. Кога се користи дифракција на Х-зраци, се добиваат приближни вредности за координатите на атомите на протеинот, додека проценките за растојанијата помеѓу парови на атоми на протеинот се добиваат со NMR експерименти. Затоа, конечната конформација на протеинот се добива, во вториот случај, со решавање на геометриски проблем. Неколку структури на протеини се одредуваат со крио-електронска микроскопија.

Значењето на датотеките на структурниот фактор, споменато погоре, е дека, за PDB структурите определени со дифракција на Х-зраци кои имаат структурна датотека, може да се набљудува мапата на електронска густина. Податоците за таквите структури се складираат на „серверот за електронска густина“.[14][15]

Во минатото, бројот на структури во PDB има пораснато со приближно експоненцијална стапка; во 1982 година биле надминати 100 регистрирани структури, во 1993 година биле надминати 1000 структури, во 1999 година 10,000 структури, а во 2014 година 100,000 структури.[16][17] Сепак, од 2007 година, стапката на акумулација на нови протеински структури се чини дека го достигнала своето плато.

Формат на датотека[уреди | уреди извор]

Форматот на датотеката кој првично бил користен од PDB бил наречен формат на PDB-датотека (анг. Protein Data Bank (pdb) file format). Овој оригинален формат бил ограничен од ширината на компјутерските перфорирани картички до 80 карактери по линија. Околу 1996 година, форматот „макромолекуларен кристалографски информациски фајл“, mmCIF, кој е екстензија на CIF форматот, започнал постепено да се внесува. MmCIF сега е главниот формат на PDB архивата.[18] XML верзија на овој формат, наречена PDBML, била опишана во 2005 година.[19] Датотеките за структури можат да се преземат во кој било од овие три формати. Всушност, индивидуалните датотеки лесно се преземаат во графички пакети со користење на веб-адреси:

  • За PDB формат на датотеки се користи, на пример, http://www.pdb.org/pdb/files/4hhb.pdb.gz или http://pdbe.org/download/4hhb
  • За PDBML (XML) датотеки се користи, на пример, http://www.pdb.org/pdb/files/4hhb.xml.gz или http://pdbe.org/pdbml/4hhb

„4hhb“ е PDB идентификатор. Секоја структура објавена во PDB добива алфанумерички идентификатор со четири знаци, нејзината PDB ID. (Ова не може да се користи како идентификатор за биомолекули, бидејќи честопати неколку структури за истата молекула - во различни средини или конформации - се содржани во PDB со различни PDB IDs.)

Прикажување на податоците[уреди | уреди извор]

Структурните датотеки може да се гледаат со користење на еден од неколкуте бесплатни и со отворен код компјутерски програми, вклучувајќи ги Jmol, Pymol, Visual molecular dynamics (VMD) и RasMol. Други неслободни шервер програми вклучуваат ICM-прелистувач,[20] MDL Chime, UCSF Chimera, Swiss-PDB Viewer,[21] StarBiochem[22] (интерактивен молекуларен прегледник базиран на Java со интегрирано пребарување на база на податоци за белковини), Sirius visualization software и VisProt3DS (алатка за визуелизација на протеини во 3D стереоскопски преглед во анаглит и други режими) и Discovery Studio. Веб-страницата RCSB PDB содржи опсежна листа на бесплатни и комерцијални програми за визуелизација на молекули и приклучоци за веб-прелистувач.

Поврзано[уреди | уреди извор]

Наводи[уреди | уреди извор]

  1. 1,0 1,1 EMBL-EBI. „PDBe home < Node < EMBL-EBI“. www.pdbe.org. 
  2. 2,0 2,1 „Protein Data Bank Japan - PDB Japan - PDBj“. www.pdbj.org. 
  3. Bank, RCSB Protein Data. „RCSB PDB: Homepage“. www.rcsb.org. 
  4. Berman, H. M. (јануари 2008 г). The Protein Data Bank: a historical perspective. „Acta Crystallographica Section A“ том  A64 (1): 88–95. doi:10.1107/S0108767307035623. PMID 18156675. http://journals.iucr.org/a/issues/2008/01/00/sc5004/sc5004.pdf. 
  5. PDBsum: a Web-based database of summaries and analyses of all PDB structures. „Trends Biochem. Sci.“ том  22 (12): 488–90. декември 1997 г. doi:10.1016/S0968-0004(97)01140-7. PMID 9433130. 
  6. Meyer EF. The first years of the Protein Data Bank. „Protein Science“ (Cambridge University Press) том  6 (7): 1591–1597. doi:10.1002/pro.5560060724. PMID 9232661. 
  7. Protein Data Bank. „Nature New Biology“. doi:10.1038/newbio233223b0. 
  8. Berman, H. M.; Westbrook, J.; Feng, Z.; Gilliland, G.; Bhat, T. N.; Weissig, H.; Shindyalov, I. N.; Bourne, P. E. (1 јануари 2000 г). The Protein Data Bank. „Nucleic Acids Research“ том  28 (1): 235–242. ISSN 0305-1048. PMID 10592235. https://www.ncbi.nlm.nih.gov/pubmed/10592235. 
  9. Bank, RCSB Protein Data. „RCSB PDB: RCSB PDB Newsletter Archive“. www.rcsb.org. конс. 2018-11-13. 
  10. „BMRB - Biological Magnetic Resonance Bank“. www.bmrb.wisc.edu (en-US). конс. 2018-11-13. 
  11. Wood, David (2010-11-10) (на en). Linking Enterprise Data. Springer Science & Business Media. ISBN 9781441976659. https://books.google.mk/books?id=DsMrnk9-4NsC&lpg=PA25&pg=PA25&redir_esc=y#v=onepage&q&f=false. 
  12. „PDB Validation Suite“. sw-tools.rcsb.org. конс. 2018-11-13. 
  13. „PDB Current Holdings Breakdown“. RCSB. 
  14. „The Uppsala Electron Density Server“. Uppsala University. конс. 2013-04-06. 
  15. The Uppsala Electron-Density Server. „Acta Crystallogr D“ том  60 (Pt 12 Pt 1): 2240–2249. декември 2004 г. doi:10.1107/S0907444904013253. PMID 15572777. 
  16. Anon. Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures. „Nature“ том  509 (7500): 260. doi:10.1038/509260a. PMID 24834514. 
  17. „Content Growth Report“. RCSB PDB. конс. 2013-04-06. 
  18. wwPDB.org. „wwPDB: 2013 News“. www.wwpdb.org. конс. 2018-11-13. 
  19. Westbrook, John; Ito, Nobutoshi; Nakamura, Haruki; Henrick, Kim; Berman, Helen M. (1 април 2005 г). PDBML: the representation of archival macromolecular structure data in XML. „Bioinformatics (Oxford, England)“ том  21 (7): 988–992. doi:10.1093/bioinformatics/bti082. ISSN 1367-4803. PMID 15509603. https://www.ncbi.nlm.nih.gov/pubmed/15509603. 
  20. „Molsoft L.L.C.: ICM-Browser“. www.molsoft.com. конс. 2018-11-13. 
  21. „Swiss PDB Viewer - Home“. spdbv.vital-it.ch. конс. 2018-11-13. 
  22. „STAR: Biochem - Home“. star.mit.edu. конс. 2018-11-13. 

Надворешни врски[уреди | уреди извор]