Структурна класификација на белковините

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето
SCOP
Содржина
ОписСтруктурна класификација на белковините
Контакт
Истражувачки центарЛабораторија за молекуларна биологија
АвториAlexey G. Murzin, Steven E. Brenner, Tim J. P. Hubbard, и Cyrus Chothia
Објавена на1994
Пристап
Мреж. местоhttp://scop.mrc-lmb.cam.ac.uk/scop/
Алатки
Разно

Структурната класификација на белковините (анг. Structural Classification Оf Proteins database - SCOP) е база на податоци која содржи мануелна класификација на белковинските структурни домени врз основа на сличностите во структурата и аминокиселинската секвенца. Мотивацијата за оваа класификација е да се утврди еволутивниот однос помеѓу белковините (протеините). Протеините со иста структура, но со мала сличност во секвенците или функцијата, се класифицирани во истата белковинска суперфамилија, а се претпоставува дека имаат многу далечен заеднички предок. Протеините со иста структура и со значителна сличност во секвенците и/или функцијата, се класифицирани во истата белковинска фамилија, а се претпоставува дека имаат поблизок заеднички предок.

SCOP базата на податоци е слободно достапна на интернет. Таа била создадена во 1994 година во Центарот за инженеринг на белковини (анг. Centre for Protein Engineering, CPE) и Лабораторијата за молекуларна биологија (анг. Laboratory of Molecular Biology) во Кембриџ, Обединетото Кралство.[1] Сè до нејзиното затворање во 2010 година, таа била одржувана од страна на Алексеј Г. Мурзин и неговите колеги во Центарот за инженеринг на белковини и потоа во Лабораторијата за молекуларна биологија.[2][3][4] Во јануари 2014 година, работата на SCOP била прекината и последната официјална верзија на SCOP е 1.75 (објавена во јуни 2009 година). Прототипот на новата база на податоци Структурна класификација на белковините 2 (SCOP2) е јавно достапен. SCOP2 има нов приод кон класификацијата на белковините, кој суштински е различен од SCOP, но ги задржува најдобрите карактеристики на SCOP.

Слично на базите на податоци CATH и Pfam, SCOP ги класифицира индивидуалните структурни домени на белковините, а не целите белковински молекули, кои во својот состав може да поседуваат повеќе различни структурни домени.

Хиерархиска организација[уреди | уреди извор]

Изворот на белковински структури е PDB (од анг. Protein Data Bank - банка на податоци за белковини). Единицата за класификација на структурите во SCOP е белковинскиот домен. Она што авторите на SCOP мислат под поимот „домен“ е искажано во нивната изјава дека малите протеини и повеќето средно големи протеини поседуваат само еден домен,[5] и со забелешката дека на човековиот хемоглобин,[6] кој има α2β2 структура, му се доделуваат два SCOP домени, еден за α и еден за β подединицата.

Формите на домените се нарекува „склопови“ (анг. folds) во SCOP. Домените кои припаѓаат на истиот склоп ги имаат истите главни секундарни структурни елементи, во истиот аранжман и со истите тополошки врски. Во SCOP верзијата 1.75 наведени се 1195 склопови. Дадени се и кратки описи за секој од склоповите. Склопот на кој припаѓа еден домен се утврдува со инспекција, а не со софтвер.

Нивоата на SCOP се:

  1. Класа: типови на склопови, на пример, бета плочи. Тука спаѓаат структури со сличен состав на секундарни структурни елементи, но различни терциерни структури. Немаат заедничко еволутивно потекло.
  2. Склоп: различните форми на домени во рамките на една класа.
  3. Суперфамилија: домените во рамките на еден склоп се групирани во суперфамилии, кои имаат далечен заеднички предок.
  4. Фамилија: домените во рамките на една суперфамилија се групирани во фамилии, кои имаат поскорешен заеднички предок. Услов е да имаат или минимум 30% идентични секвенци или 15% идентични секвенци и идентична функција.
  5. Белковински домен: домените во рамките на една фамилија се групирани во белковински домени.
  6. Видови: домените во рамките на „белковинските домени“ се групирани според видовите на организми кај кои се среќаваат.
  7. Домен: дел од протеин. За едноставни протеини, тоа може да претставува целиот протеин.

Споредба со другите класификациони системи[уреди | уреди извор]

Класификацијата во SCOP базата на податоци е повеќе зависна од мануелни одлуки отколку од полуавтоматизирана класификација, како што се среќава кај CATH. За да се одлучи дали одредени протеини се еволутивно сродни и поради тоа треба да бидат класифицирани во истата суперфамилија се користи човечка експертиза. Друга база на податоци, FSSP (анг. Families of Structurally Similar Proteins database), е потполно автоматизирана (вклучува и редовни автоматски ажурирања), но не нуди класификација на протеините, давајќи му на корисникот можност самиот да донесува заклучоци.

Наследници на SCOP[уреди | уреди извор]

До 2009 година, оригиналната SCOP база на податоци мануелно класифицирала 38.000 протеини од PDB во строго хиерархиска структура. Меѓутоа, ограничената автоматизација на класификацијата на SCOP не можела да го следи забрзаното темпо на новообјавените протеински структури, што довело до несеопфатна база на податоци. Базата на податоци Structural Classification of Proteins extended (SCOPe) била објавена во 2012 година со многу поголема автоматизација на истиот хиерархиски систем и е целосно компатибилна со SCOP. Во 2014 година, повторно била воведена мануелната испекција во SCOPe за да се одржи точноста. До февруари 2015 година, SCOPe 2.05 имала класифицирано 71.000 од вкупно 110.000 PDB записи.[7]

SCOP2 е прототипски класификационен систем кој има за цел повеќе да ја интегрира еволутивната комплексност својствена за еволуцијата на протеинските структури. Затоа не станува збор за едноставна хиерархија, туку мрежа која ги поврзува протеинските суперфамилии и прикажува структурни и еволутивни односи како што се кружни пермутации, фузија на домени и распаѓање на домени. Следствено, домените не се разделени со строги фиксни граници, туку се дефинирани според нивните врски со најсличните други структури. До февруари 2015 година, прототипот SCOP2 има класифицирано 995 PDB записи.[7]

Поврзано[уреди | уреди извор]

Наводи[уреди | уреди извор]

  1. Andreeva, A.; Howorth, D.; Chandonia, J. -M.; Brenner, S. E.; Hubbard, T. J. P.; Chothia, C.; Murzin, A. G.. Data growth and its impact on the SCOP database: New developments. „Nucleic Acids Research“ том  36 (Database issue): D419–D425. doi:10.1093/nar/gkm993. PMID 18000004. 
  2. Hubbard, T. J.; Ailey, B.; Brenner, S. E.; Murzin, A. G.; Chothia, C.. SCOP: A Structural Classification of Proteins database. „Nucleic Acids Research“ том  27 (1): 254–256. doi:10.1093/nar/27.1.254. PMID 9847194. 
  3. Lo Conte, L.; Ailey, B.; Hubbard, T. J.; Brenner, S. E.; Murzin, A. G.; Chothia, C.. SCOP: A Structural Classification of Proteins database. „Nucleic Acids Research“ том  28 (1): 257–259. doi:10.1093/nar/28.1.257. PMID 10592240. 
  4. Andreeva, A.; Howorth, D.; Brenner, S. E.; Hubbard, T. J.; Chothia, C.; Murzin, A. G.. SCOP database in 2004: Refinements integrate structure and sequence family data. „Nucleic Acids Research“ том  32 (90001): D226–D229. doi:10.1093/nar/gkh039. PMID 14681400. 
  5. Murzin, A. G.; Brenner, S.; Hubbard, T.; Chothia, C.. SCOP: A structural classification of proteins database for the investigation of sequences and structures. „Journal of Molecular Biology“ том  247 (4): 536–540. doi:10.1016/S0022-2836(05)80134-2. PMID 7723011. http://scop.mrc-lmb.cam.ac.uk/scop/ref/1995-jmb-scop.pdf. 
  6. PDB: 2DN1 ; 1.25 Å resolution crystal structures of human haemoglobin in the oxy, deoxy and carbonmonoxy forms. „J. Mol. Biol.“ том  360 (3): 690–701. јули 2006 г. doi:10.1016/j.jmb.2006.05.036. PMID 16765986. 
  7. 7,0 7,1 „What is the relationship between SCOP, SCOPe, and SCOP2“. scop.berkeley.edu. конс. 2015-08-22. 

Надворешни врски[уреди | уреди извор]

  • Structural Classification of Proteins (англиски)
  • Structural Classification of Proteins extended - Поавтоматизираниот наследник на SCOP (англиски)
  • Structural Classification of Proteins 2 - Прототип на нов нехиерархиски класификационен систем со подетална репрезентација на комплексни еволутивни односи (англиски)
  • SUPERFAMILY - Библиотека на HMM (скриени модели на Марков) кои ги претставуваат SCOP суперфамилиите и база на податоци за анотации за комплетно секвенционирани организми (англиски)
  • Protein Structure Classification - поглавје од книга кое во детали ги опишува различните класификации на белковините (англиски)