Белковинска фамилија

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето
Човечката циклофилинска фамилија на белковини, претставена со структурите на изомеразните домени на некои од нејзините членови.

Белковинска фамилија е група на еволутивно сродни белковини (протеини). Во многу случаи белковинската фамилија има одговарачка генска фамилија, во која секој ген кодира соодветен протеин во однос 1:1. Терминот белковинска фамилија не треба да се меша со терминот фамилија (или семејство) кој се користи во таксономијата на организмите.

Белковините кои спаѓаат во истата белковинската фамилија имаат заеднички предок и обично имаат слични тродимензионални структури, функции и значителна сличност во секвенцата. Најважна е сличноста во секвенцата (обично аминокиселинската секвенца), бидејќи таа е најстрогиот индикатор за хомологност, а оттаму и најочигледниот индикатор за заедничко потекло. Сличноста во секвенците се одредува со методи на порамнување на секвенците. Протеините кои не споделуваат заеднички предок многу малку е веројатно да имаат статистички значителна сличност во секвенците, па затоа порамнувањето на секвенците претставува моќна алатка за идентификација на членовите на белковинските фамилии.

Белковинските фамилии понекогаш се групираат заедно во поголеми кладови, наречени суперфамилии, врз основа на структурни и механистички сличности, дури и ако нема очигледна хомологија во секвенците.

Досега, дефинирани се над 60,000 белковински фамилии,[1] иако понекогаш двосмисленоста на дефиницијата за белковинска фамилија предизвикува да различни истражувачи доаѓаат до многу различни бројки.

Терминологија и употреба[уреди | уреди извор]

Како и со многу други биолошки термини, употребата на терминот белковинска фамилија донекаде зависи од контекстот; може да се однесува на голема група на протеини со најниско можно ниво на сличност во секвенците, или може да се однесува на мала група на протеини со речиси идентични секвенци, функции и тродимензионални структури. За да се направи разлика помеѓу овие случаи, терминот белковинска суперфамилија често се користи за далечно сродни протеини, чија сродност не мора да соодветствува со голема сличност во секвенците, но се одредува преку заедничките структурни карактеристики.[2][3][4] Други термини, како што се белковинска класа, група, клан и под-фамилија, биле воведени со текот на годините, но сите го имаат истиот недостаток на двосмисленост. Во употреба е хиерархијата во која суперфамилиите (структурна хомологија) содржат фамилии (секвенциска хомологија), кои, пак, содржат под-фамилии.

Горе, секвенциска сочуваност на 250 членови од PA кланот на протеази (суперфамилија). Долу, секвенциска сочуваност на 70 членови од C04 фамилијата на протеази. Стрелките ги означуваат аминокиселинските остатоци од каталитичките тријади. Порамнети врз основа на структура од „Distance-matrix ALIgnment“ (DALI) алгоритмот.

Белковински домени и мотиви[уреди | уреди извор]

Концептот на белковинска фамилија бил измислен во време кога биле познати многу малку протеински структури и секвенци; во тоа време структурно биле разработени главно мали, едно-доменски протеини, како што се миоглобинот, хемоглобинот и цитохром ц. Денес е познато дека многу протеини содржат повеќе независни структурни и функционални единици наречени белковински домени. Поради еволутивното мешање, различните домени во склоп на еден протеин еволуирале независно. Затоа, во скорешно време, фокусот е во класификацијата на протеинските домени во фамилии.

Регионите на секој протеин имаат различни функционални ограничувања (карактеристики критични за структурата и функцијата на протеинот). На пример, активното место на еден ензим поседува одредени аминокиселински остатоци кои се прецизно ориентирани во трите димензии. Од друга страна, интерфејсот на врзување на два протеина може да се состои од голема површина со ограничувања на хидрофобноста или поларитетот на аминокиселинските остатоци. Функционално ограничените региони на протеините еволуираат побавно од функционално неограничените региони, како што се површинските петелки, што резултира со забележливи блокови на сочувани секвенци кога се споредуваат секвенците на белковините кои припаѓаат на истата белковинска фамилија (види порамнување на повеќе секвенци). Овие блокови најчесто се нарекуваат мотиви, иако во употреба се и многу други термини (блокови, ознаки, отпечатоци, итн.). Голем број на онлајн ресурси се посветени на идентификација и каталогизација на протеинските мотиви (види ја листата на крајот од статијата).

Еволуција на белковински фамилии[уреди | уреди извор]

Според моменталниот консензус, белковинските фамилии настануваат на два начина. Првиот начин е со разделување на два генетски изолирани видови кои се потомци на еден родителски вид, што им овозможува самостојно да акумулираат варијации (мутации) во одреден ген/протеин. Ова резултира со појава на фамилии на ортологни протеини, кои обично имаат сочувани секвенциски мотиви. Вториот начин е со генска дупликација, со која може да се создаде втора копија на истиот ген (наречен паралог). Бидејќи оригиналниот ген сѐ уште е способен да ја извршува својата функција, дуплираниот ген слободно може да дивергира и може да се здобие со нови функции (со случајна мутација). Одредени гени/белковински фамилии, особено кај еукариотите, се подложени на екстремни експанзии и контракции во текот на еволуцијата, кои понекогаш се одвиваат заедно со дупликации на целиот геном. Овие експанзии и контракции на белковинските фамилии претставуваат една од најважните карактеристики на геномската еволуција.

Филогенетско дрво на RAS суперфамилијата. Дрвото е создадено со користење на FigTree (бесплатен онлајн софтвер).

Употреба и значење на белковинските фамилии[уреди | уреди извор]

Како што вкупниот број на секвенционирани протеини постојано се зголемува, постои постојан напор протеините да се организираат во фамилии и да се опишат нивните составни домени и мотиви. Веродостојната идентификација на белковинските фамилии е од клучно значење за филогенетските анализи, назначувањето на функции и проучувањето на диверзитетот на протеински функции во дадена филогенетска гранка. Иницијативата за ензимска функција (анг. Enzyme Function Initiative, EFI) ги користи белковинските фамилии и суперфамилии како основа за развој на стратегија базирана на секвенца/структура за назначување на функции на ензими со непознати функции.[5]

Алгоритамските средства за утврдување на белковинските фамилии се базираат на поимот на сличност. Најчесто, единствената сличност со која располагаат истражувачите е сличноста во секвенците.

Ресурси за белковински фамилии[уреди | уреди извор]

Постојат многу биолошки бази на податоци кои ги евидентираат примерите на белковински фамилии и им овозможуваат на корисниците да идентификуваат дали новоидентификуваните протеини припаѓаат на некоја од познатите фамилии. Еве неколку примери:

  • Pfam - База на податоци за белковински фамилии со порамнувања и HMMs
  • PROSITE - База на податоци за белковински домени, фамилии и функционални места
  • PIRSF - Систем за класификација на суперфамилии
  • PASS2 - Protein Alignment as Structural Superfamilies v2 - PASS2@NCBS[6]
  • SUPERFAMILY - база на податоци за структурни и функционални назначувања за сите протеини и геноми
  • SCOP и CATH - класификација на протеинските структури во суперфамилии, фамилии и домени

Постојат и многу алгоритми за пребарување на базите на податоци, на пример:

  • BLAST - Пребарување на сличност на ДНК секвенца
  • BLASTp - Пребарување на сличност на протеинска секвенца
  • OrthoFinder: брз и точен метод за групирање на протеините во фамилии (ортогрупи)[7]

Поврзано[уреди | уреди извор]

Наводи[уреди | уреди извор]

  1. Kunin, V.; Cases, I.; Enright, A. J.; De Lorenzo, V.; Ouzounis, C. A.. Myriads of protein families, and still counting. „Genome Biology“ том  4 (2): 401. doi:10.1186/gb-2003-4-2-401. PMID 12620116. 
  2. Dayhoff, M. O.. Computer analysis of protein sequences. „Federation Proceedings“ том  33 (12): 2314–2316. PMID 4435228. 
  3. Dayhoff, M. O.; McLaughlin, P. J.; Barker, W. C.; Hunt, L. T.. Evolution of sequences within protein superfamilies. „Die Naturwissenschaften“ том  62 (4): 154–161. doi:10.1007/BF00608697. Bibcode1975NW.....62..154D. 
  4. Dayhoff, M. O.. The origin and evolution of protein superfamilies. „Federation Proceedings“ том  35 (10): 2132–2138. PMID 181273. 
  5. Gerlt, J. A.; Allen, K. N.; Almo, S. C.; Armstrong, R. N.; Babbitt, P. C.; Cronan, J. E.; Dunaway-Mariano, D.; Imker, H. J.; и др.. The Enzyme Function Initiative. „Biochemistry“ том  50 (46): 9950–9962. doi:10.1021/bi201312u. PMID 21999478. 
  6. Gandhimathi, A.; Nair, A. G.; Sowdhamini, R.. PASS2 version 4: An update to the database of structure-based sequence alignments of structural domain superfamilies. „Nucleic Acids Research“ том  40 (Database issue): D531–D534. doi:10.1093/nar/gkr1096. PMID 22123743. 
  7. Emms DM, Kelly S. (август 2015 г). OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy. „Genome Biology“ том  16 (157): 157. doi:10.1186/s13059-015-0721-2. PMID 26243257.