Белковинско семејство

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето
Човечката циклофилинско семејство на белковини, претставена со структурите на изомеразните домени на некои од нејзините членови.

Белковинско семејство е група на еволутивно сродни белковини (протеини). Во многу случаи белковинското семејство има складно генско семејство, во која секој ген кодира соодветен протеин во однос 1:1. Поимот белковинско семејство не треба да се меша со поимот семејство кој се користи во таксономијата на организмите.

Белковините кои спаѓаат во истата белковинското семејство имаат заеднички предок и обично имаат слични тродимензионални структури, функции и значителна сличност во секвенцата. Најважна е сличноста во секвенцата (обично аминокиселинската секвенца), бидејќи таа е најстрогиот индикатор за хомологност, а оттаму и најочигледниот индикатор за заедничко потекло. Сличноста во секвенците се одредува со методи на порамнување на секвенците. Протеините кои не споделуваат заеднички предок многу малку е веројатно да имаат статистички значителна сличност во секвенците, па затоа порамнувањето на секвенците претставува моќна алатка за идентификација на членовите на белковинските семејства.

Белковинските семејства понекогаш се групираат заедно во поголеми кладови, наречени натсемејства, врз основа на структурни и механистички сличности, дури и ако нема очигледна хомологија во секвенците.

Досега, дефинирани се над 60,000 белковински семејства,[1] иако понекогаш двосмисленоста на дефиницијата за белковинско семејство предизвикува да различни истражувачи доаѓаат до многу различни бројки.

Терминологија и употреба[уреди | уреди извор]

Како и со многу други биолошки поими, употребата на поимот белковинско семејство донекаде зависи од контекстот; може да се однесува на голема група на протеини со најниско можно ниво на сличност во секвенците, или може да се однесува на мала група на протеини со речиси идентични секвенци, функции и тродимензионални структури. За да се направи разлика помеѓу овие случаи, поимот белковинско натсемејство често се користи за далечно сродни протеини, чија сродност не мора да соодветствува со голема сличност во секвенците, но се одредува преку заедничките структурни карактеристики.[2][3][4] Други поими, како што се белковинска класа, група, клан и потсемејство, биле воведени со текот на годините, но сите го имаат истиот недостаток на двосмисленост. Во употреба е хиерархијата во која натсемејствата (структурна хомологија) содржат семејства (секвенциска хомологија), кои, пак, содржат под-семејства.

Горе, секвенциска сочуваност на 250 членови од PA кланот на протеази (натсемејство). Долу, секвенциска сочуваност на 70 членови од C04 семејството на протеази. Стрелките ги означуваат аминокиселинските остатоци од каталитичките тријади. Порамнети врз основа на структура од „Distance-matrix ALIgnment“ (DALI) алгоритмот.

Белковински домени и мотиви[уреди | уреди извор]

Концептот на белковинско семејство бил измислен во време кога биле познати многу малку белковински структури и секвенци; во тоа време структурно биле разработени главно мали, едно-доменски протеини, како што се миоглобинот, хемоглобинот и цитохром ц. Денес е познато дека многу протеини содржат повеќе независни структурни и функционални единици наречени белковински домени. Поради еволутивното мешање, различните домени во склоп на еден протеин еволуирале независно. Затоа, во скорешно време, фокусот е во класификацијата на белковинските домени во семејства.

Регионите на секој протеин имаат различни функционални ограничувања (карактеристики критични за структурата и функцијата на протеинот). На пример, активното место на еден ензим поседува одредени аминокиселински остатоци кои се прецизно ориентирани во трите димензии. Од друга страна, интерфејсот на врзување на два протеина може да се состои од голема површина со ограничувања на хидрофобноста или поларитетот на аминокиселинските остатоци. Функционално ограничените региони на протеините еволуираат побавно од функционално неограничените региони, како што се површинските петелки, што резултира со забележливи блокови на сочувани секвенци кога се споредуваат секвенците на белковините кои припаѓаат на истата белковинско семејство (види порамнување на повеќе секвенци). Овие блокови најчесто се нарекуваат мотиви, иако во употреба се и многу други поими (блокови, ознаки, отпечатоци, итн.). Голем број на онлајн ресурси се посветени на идентификација и каталогизација на белковинските мотиви (види го списокот на крајот од статијата).

Еволуција на белковински семејства[уреди | уреди извор]

Според моменталниот консензус, белковинските семејства настануваат на два начина. Првиот начин е со разделување на два генетски изолирани видови кои се потомци на еден родителски вид, што им овозможува самостојно да акумулираат варијации (мутации) во одреден ген/протеин. Ова резултира со појава на семејства на ортологни протеини, кои обично имаат сочувани секвенциски мотиви. Вториот начин е со генска дупликација, со која може да се создаде втора копија на истиот ген (наречен паралог). Бидејќи оригиналниот ген сѐ уште е способен да ја извршува својата функција, дуплираниот ген слободно може да дивергира и може да се здобие со нови функции (со случајна мутација). Одредени гени/белковински семејства, особено кај еукариотите, се подложени на екстремни експанзии и контракции во текот на еволуцијата, кои понекогаш се одвиваат заедно со дупликации на целиот геном. Овие експанзии и контракции на белковинските семејства претставуваат една од најважните карактеристики на геномската еволуција.

Филогенетско дрво на RAS натсемејствата. Дрвото е создадено со користење на FigTree (бесплатен онлајн софтвер).

Употреба и значење на белковинските семејства[уреди | уреди извор]

Како што вкупниот број на секвенционирани протеини постојано се зголемува, постои постојан напор протеините да се организираат во семејства и да се опишат нивните составни домени и мотиви. Веродостојната идентификација на белковинските семејства е од клучно значење за филогенетските анализи, назначувањето на функции и проучувањето на диверзитетот на белковински функции во дадена филогенетска гранка. Иницијативата за ензимска функција (анг. Enzyme Function Initiative, EFI) ги користи белковинските семејства и натсемејства како основа за развој на стратегија заснована на секвенца/структура за назначување на функции на ензими со непознати функции.[5]

Алгоритамските средства за утврдување на белковинските семејства се засноваат на поимот на сличност. Најчесто, единствената сличност со која располагаат истражувачите е сличноста во секвенците.

Ресурси за белковински семејства[уреди | уреди извор]

Постојат многу биолошки бази на податоци кои ги евидентираат примерите на белковински семејства и им овозможуваат на корисниците да идентификуваат дали новоидентификуваните протеини припаѓаат на некоја од познатите семејства. Еве неколку примери:

  • Pfam - База на податоци за белковински семејства со порамнувања и HMMs
  • PROSITE - База на податоци за белковински домени, семејства и функционални места
  • PIRSF - Систем за класификација на натсемејства
  • PASS2 - Protein Alignment as Structural Superfamilies v2 - PASS2@NCBS[6]
  • SUPERFAMILY - база на податоци за структурни и функционални назначувања за сите протеини и геноми
  • SCOP и CATH - класификација на белковинските структури во натсемејства, семејства и домени

Постојат и многу алгоритми за пребарување на базите на податоци, на пример:

  • BLAST - Пребарување на сличност на ДНК секвенца
  • BLASTp - Пребарување на сличност на белковинска секвенца
  • OrthoFinder: брз и точен метод за групирање на протеините во семејства (ортогрупи)[7]

Поврзано[уреди | уреди извор]

Наводи[уреди | уреди извор]

  1. Kunin, V.; Cases, I.; Enright, A. J.; De Lorenzo, V.; Ouzounis, C. A. (2003). „Myriads of protein families, and still counting“. Genome Biology. 4 (2): 401. doi:10.1186/gb-2003-4-2-401. PMC 151299. PMID 12620116.
  2. Dayhoff, M. O. (1974). „Computer analysis of protein sequences“. Federation Proceedings. 33 (12): 2314–2316. PMID 4435228.
  3. Dayhoff, M. O.; McLaughlin, P. J.; Barker, W. C.; Hunt, L. T. (1975). „Evolution of sequences within protein superfamilies“. Die Naturwissenschaften. 62 (4): 154–161. Bibcode:1975NW.....62..154D. doi:10.1007/BF00608697.
  4. Dayhoff, M. O. (1976). „The origin and evolution of protein superfamilies“. Federation Proceedings. 35 (10): 2132–2138. PMID 181273.
  5. Gerlt, J. A.; Allen, K. N.; Almo, S. C.; Armstrong, R. N.; Babbitt, P. C.; Cronan, J. E.; Dunaway-Mariano, D.; Imker, H. J.; Jacobson, M. P. (2011). „The Enzyme Function Initiative“. Biochemistry. 50 (46): 9950–9962. doi:10.1021/bi201312u. PMC 3238057. PMID 21999478.
  6. Gandhimathi, A.; Nair, A. G.; Sowdhamini, R. (2011). „PASS2 version 4: An update to the database of structure-based sequence alignments of structural domain superfamilies“. Nucleic Acids Research. 40 (Database issue): D531–D534. doi:10.1093/nar/gkr1096. PMC 3245109. PMID 22123743.
  7. Emms DM, Kelly S. (Aug 2015). „OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy“. Genome Biology. 16 (157): 157. doi:10.1186/s13059-015-0721-2. PMC 4531804. PMID 26243257.