Белковинска суперфамилија

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето

Белковинска суперфамилија е највисокиот степен на групирање (клад) на белковините за кои постојат докази за заедничко потекло (види хомологија). Обично заедничкото потекло се заклучува по пат на структурно порамнување[1] и механистичка сличност, дури и доколку не постои очигледна сличност во аминокиселинската секвенца.[2] Но и покрај малата сличност во секвенците, понекогаш може да биде откриена секвенциска хомологија. Една белковинска суперфамилија обично содржи повеќе белковински фамилии, а членовите во рамките на една фамилија покажуваат значителна сличност во секвенците. Терминот белковински клан обично се користи за именување на суперфамилиите на протеази и гликозил хидролази, во MEROPS и CAZy класификационите системи.[2][3]

Идентификација[уреди | уреди извор]

Горе, сочуваност на секундарната структура на 80 членови од PA кланот на протеази (суперфамилија). H се однесува на алфа хеликс, E се однесува на бета плоча, а L на петелка. Долу, сочуваност на секвенцата за истото порамнување. Стрелките ги означуваат остатоците на каталитичката тријада. Порамнувањето е на база на структури од страна на DALI.

Белковинските суперфамилии можат да бидат идентификувани со голем број на методи.

Сличност во секвенцата[уреди | уреди извор]

Порамнување на секвенците на хистони од цицачи. Сличноста во секвенците сугерира дека тие еволуирале по пат на генска дупликација. Аминокиселинските остатоци кои се сочувани во сите секвенци се означени со сива боја. Под протеинските секвенци има клуч кој ги означува сочуваните секвенци (*), конзервативните мутации (:), полу-конзервативните мутации (.), и не-конзервативните мутации ( ).[4]

Историски гледано, сличноста помеѓу различните аминокиселински секвенци е најчестиот метод за откривање на хомологија.[5] Сличноста во секвенците се смета за добар предвидувач на сродност, бидејќи сличните секвенци најверојатно се резултат на генска дупликација и дивергентна еволуција, отколку на конвергентна еволуција. Аминокиселинската секвенца се смета за почувствителен метод за детекција на хомологност, бидејќи аминокиселинските секвенци обично се посочувани во текот на еволуцијата од ДНК секвенците (поради дегенеративноста на генетскиот код). Бидејќи некои од аминокиселините имаат слични физичко-хемиски својства (на пример, електричен полнеж, хидрофобност, големина), конзервативните мутации често се неутрални и немаат влијание на функцијата. Најсочуваните региони во секвенцата на белковините се оние кои се функционално најважни, како што се каталитичките и врзувачките места, бидејќи овие региони најмалку толерираат промени.

Употребата на сличноста во секвенцата за откривање на хомологија има неколку ограничувања. Не постои минимално ниво на сличност во секвенцата кое гарантира добивање на идентични структури. После долги периоди на еволуција, сродните протеини може да ја изгубат сличноста во секвенците. Секвенците кои претрпеле мноштво на инсерции и делеции во текот на еволуцијата, понекогаш тешко може да се порамнат за да се идентификуваат хомологните региони. Во PA кланот на протеази, на пример, не е сочуван ниту еден аминокиселински остаток во секвенците на различните припадници на оваа суперфамилија, дури и оние во склоп на каталитичката тријада. Спротивно на тоа, индивидуалните фамилии кои ја сочинуваат суперфамилијата се дефинирани врз основа на порамнувањето на секвенците, на пример C04 фамилијата на протеази во рамките на PA кланот.

Сепак, сличноста во секвенцата е најчесто користениот доказ за сродство, бидејќи бројот на познати секвенци е многу поголем од бројот на познати терциерни структури.[6] Во отсуство на структурни информации, сличноста во секвенците ги стеснува границите за вклучување на нови протеини кон одредена суперфамилија.[6]

Структурна сличност[уреди | уреди извор]

Структурна хомологија во PA суперфамилијата (PA клан). Двојниот β-цилиндер кој ја карактеризира суперфамилијата е обележан со црвена боја. Прикажани се репрезентативни структури од неколку фамилии во рамките на PA суперфамилијата. Химотрипсин (1gg6), TEV протеаза (1lvm), калцивирин (1wqs), WNV протеаза (1fp7), ексфолијатин токсин (1exf), HtrA протеаза (1l1j), змијски отров плазминогенски активатор (1bqy), хлоропластна протеаза (4fln) и EVA протеаза (1mbm).

Структурата е еволутивно посочувана од секвенцата, така што протеини со многу слични структури можат да имаат сосема различни секвенци.[7] Во текот на многу долги временски периоди на еволуција, многу малку аминокиселински остатоци се сочувани во секвенцата, сепак елементите на секундарната структура и терциерните структурни мотиви се доста сочувани. Одредена белковинска динамика[8] и конформациони промени на протеинската структура исто така може да бидат сочувани, како што се среќава кај серпинската суперфамилија.[9] Од овие причини, терциерната структура на белковините може да се користи за откривање на хомологност помеѓу белковините, дури и кога во нивните секвенци нема докази за сродство. Програмите за структурно порамнување, како што е DALI, ја користат 3D структурата на протеинот од интерес за да најде протеини со слични склопови.[10] Меѓутоа, во ретки случаи, сродните протеини може да еволуираат за да станат структурно различни, па во овие случаи сродноста може да се заклучи само со употреба на други посебни методи.[11][12][13]

Механистичка сличност[уреди | уреди извор]

Каталитичкиот механизам на ензимите во рамките на една суперфамилија најчесто е сочуван, иако специфичноста кон супстратот може да биде значително различна.[14] Исто така, каталитичките аминокиселински остатоци имаат тенденција да се појават во ист редослед во протеинските секвенци.[15] Фамилиите во рамките на PA кланот на протеази имаат сличен механизам на ковалентна, нуклеофилна катализа на протеини, пептиди или аминокиселини, иако покажуваат дивергентна еволуција на остатоците од каталитичката тријада.[16] Сепак, механизмот сам по себе не е доволен за да се докаже сродство. Некои каталитички механизми имаат еволуирано независно едни од други по конвергентен пат, па затоа формираат посебни суперфамилии,[17][18][19] а во некои суперфамилии може да се сретне спектар на различни (иако често хемиски слични) механизми.[14][20]

Еволутивно значење[уреди | уреди извор]

Белковинските суперфамилии ја претставуваат моменталната граница на нашата способност за идентификување на заедничко потекло кај белковините.[21] Тие се моментално најголемото можно еволутивно групирање добиено врз основа на директни докази. Некои суперфамилии имаат членови кои се присутни во сите царства на животот, што укажува на тоа дека последниот заеднички предок на таа суперфамилија бил присутен во последниот универзален заеднички предок на сите живи организми (LUCA, од анг. Last Universal Common Ancestor).[22]

Членови на една суперфамилија може да се најдат во различни видови кои имаат заедничко потекло, т.е. заеднички предок (ортологија). Спротивно на тоа, тие може да се најдат во рамките на истиот вид, а еволуирале од еден ист протеин чијшто ген подлегнал на генска дупликација (паралогија).

Диверзификација[уреди | уреди извор]

Повеќето белковини содржат повеќе домени во својата структура. Меѓу 66-80% од сите еукариотски протеини имаат повеќе домени, а 40-60% од сите прокариотски протеини имаат повеќе домени.[5] Со текот на времето, многу од суперфамилиите на домени се имаат искомбинирано меѓусебе во структурите на повеќедоменските протеини. Всушност, многу ретко се среќаваат т.н. „конзистентно изолирани суперфамилии“.[5] Кога домените се комбинираат, N- до C-терминалниот редослед во доменот („доменска архитектура“) најчесто добро е сочувана. Дополнително, бројот на комбинации на домени кои се среќаваат во природата е многу помал во споредба со бројот на можните комбинации, што укажува на тоа дека можните комбинации подлегнуваат на процесот на селекција.[5]

Примери[уреди | уреди извор]

Суперфамилија на α/β хидролази - Членовите на оваа суперфамилија споделуваат α/β плоча која содржи 8 бета нишки поврзани со алфа хеликси, со ист редослед на остатоците од каталитичката тријада.[23] Тие имаат активности на протеази, липази, пероксидази, естерази, епоксид хидролази и дехалогенази.[24]

Суперфамилија на алкални фосфатази - Членовите на оваа суперфамилија споделуваат структура на αβα сендвич,[25] како и промискуитетни реакции со заеднички механизам.[26]

Глобинска суперфамилија - Членовите на оваа суперфамилија споделуваат глобински склоп од 8 алфа хеликси.[27][28]

Имуноглобулинска суперфамилија - Членовите на оваа суперфамилија споделуваат структура на сендвич од две бета плочи со антипаралелни бета нишки (Ig-склоп), а имаат улога на препознавање, врзување, и адхезија.[29][30]

PA клан - Членовите на оваа суперфамилија споделуваат структура слична на химотрипсин и слични механизми на протеолиза, иако имаат секвенциска сличност <10%. Овој клан ги содржи цистеинските и серинските протеази.[2][31]

Ras суперфамилија - Членовите на оваа суперфамилија споделуваат ист каталитички G домен на β-плоча од 6 β-нишки опкружена со 5 α-хеликси.[32]

Серпинска суперфамилија - Членовите на оваа суперфамилија споделуваат високо-енергетски, нестабилен склоп кој може да подлегне на голема конформациона промена, која служи за инхибиција на цистеинските и серинските протеази со нарушување на нивната структура.[33]

Суперфамилија на TIM цилиндер - Членовите на оваа суперфамилија споделуваат голем α8β8 цилиндер. Тој е еден од најчестите белковински склопови.[34][35]

Ресурси за белковински суперфамилии[уреди | уреди извор]

Постојат неколку биолошки бази на податоци кои ги документираат белковинските суперфамилии и белковинските склопови, на пример:

  • Pfam - База на податоци за белковински фамилии со порамнувања и HMMs
  • PROSITE - База на податоци за белковински домени, фамилии и функционални места
  • PIRSF - Систем за класификација на суперфамилии
  • PASS2 - Protein Alignment as Structural Superfamilies v2 - PASS2@NCBS
  • SUPERFAMILY - База на податоци за структурни и функционални назначувања за сите протеини и геноми
  • SCOP и CATH - Класификација на протеинските структури во суперфамилии, фамилии и домени

Постојат и алгоритми за пребарување на базите на податоци, како Protein Data Bank (PDB), со цел наоѓање на структурна хомологија, на пример:

  • DALI - Структурно порамнување врз основа на методот „distance alignment matrix method“

Поврзано[уреди | уреди извор]

Наводи[уреди | уреди извор]

  1. Dali server: conservation mapping in 3D. „Nucleic Acids Research“ том  38 (Web Server issue): W545-9. јули 2010 г. doi:10.1093/nar/gkq366. PMID 20457744. 
  2. 2,0 2,1 2,2 MEROPS: the database of proteolytic enzymes, their substrates and inhibitors. „Nucleic Acids Research“ том  40 (Database issue): D343-50. јануари 2012 г. doi:10.1093/nar/gkr987. PMID 22086950. 
  3. Updating the sequence-based classification of glycosyl hydrolases. „The Biochemical Journal“ том  316 (Pt 2): 695–6. јуни 1996 г. doi:10.1042/bj3160695. PMID 8687420. PMC: 1217404. https://archive-ouverte.unige.ch/unige:36909/ATTACHMENT01. 
  4. „Clustal FAQ #Symbols“. Clustal. http://www.ebi.ac.uk/Tools/msa/clustalw2/help/faq.html#23. посет. 8 декември 2014 г. 
  5. 5,0 5,1 5,2 5,3 The folding and evolution of multidomain proteins. „Nature Reviews Molecular Cell Biology“ том  8 (4): 319–30. април 2007 г. doi:10.1038/nrm2144. PMID 17356578. 
  6. 6,0 6,1 SUPFAM--a database of potential protein superfamily relationships derived by comparing sequence-based and structure-based families: implications for structural genomics and function annotation in genomes. „Nucleic Acids Research“ том  30 (1): 289–93. јануари 2002 г. doi:10.1093/nar/30.1.289. PMID 11752317. 
  7. Protein families and their evolution-a structural perspective. „Annual Review of Biochemistry“ том  74 (1): 867–900. 2005 г. doi:10.1146/annurev.biochem.74.082803.133029. PMID 15954844. 
  8. Sequence evolution correlates with structural dynamics. „Molecular Biology and Evolution“ том  29 (9): 2253–63. септември 2012 г. doi:10.1093/molbev/mss097. PMID 22427707. 
  9. The serpins are an expanding superfamily of structurally similar but functionally diverse proteins. Evolution, mechanism of inhibition, novel functions, and a revised nomenclature. „The Journal of Biological Chemistry“ том  276 (36): 33293–6. септември 2001 г. doi:10.1074/jbc.R100016200. PMID 11435447. 
  10. Dali server update. „Nucleic Acids Research“ том  44 (W1): W351-5. јули 2016 г. doi:10.1093/nar/gkw357. PMID 27131377. 
  11. Evolution of primate α and θ defensins revealed by analysis of genomes. „Molecular Biology Reports“ том  41 (6): 3859–66. јуни 2014 г. doi:10.1007/s11033-014-3253-z. PMID 24557891. 
  12. Structural drift: a possible path to protein fold change. „Bioinformatics“ том  21 (8): 1308–10. април 2005 г. doi:10.1093/bioinformatics/bti227. PMID 15604105. 
  13. Proteins that switch folds. „Current Opinion in Structural Biology“ том  20 (4): 482–8. август 2010 г. doi:10.1016/j.sbi.2010.06.002. PMID 20591649. 
  14. 14,0 14,1 Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), "Function Diversity Within Folds and Superfamilies", From Protein Structure to Function with Bioinformatics (Springer Netherlands): 295–325, ISBN 9789402410679, doi:10.1007/978-94-024-1069-3_9, конс. 2018-10-12 
  15. Causes of evolutionary rate variation among protein sites (на En). „Nature Reviews. Genetics“ том  17 (2): 109–21. февруари 2016 г. doi:10.1038/nrg.2015.18. PMID 26781812. 
  16. Handicap-Recover Evolution Leads to a Chemically Versatile, Nucleophile-Permissive Protease. „Chembiochem“ том  16 (13): 1866–1869. септември 2015 г. doi:10.1002/cbic.201500295. PMID 26097079. 
  17. Intrinsic evolutionary constraints on protease structure, enzyme acylation, and the identity of the catalytic triad. „Proceedings of the National Academy of Sciences of the United States of America“ том  110 (8): E653-61. февруари 2013 г. doi:10.1073/pnas.1221050110. PMID 23382230. 
  18. An evolving hierarchical family classification for glycosyltransferases. „Journal of Molecular Biology“ том  328 (2): 307–17. април 2003 г. doi:10.1016/S0022-2836(03)00307-3. PMID 12691742. 
  19. Independent evolution of four heme peroxidase superfamilies. „Archives of Biochemistry and Biophysics“ том  574: 108–19. мај 2015 г. doi:10.1016/j.abb.2014.12.025. PMID 25575902. 
  20. Akiva, Eyal; Brown, Shoshana; Almonacid, Daniel E.; Barber, Alan E.; Custer, Ashley F.; Hicks, Michael A.; Huang, Conrad C.; Lauck, Florian; и др. (23 ноември 2013 г). The Structure–Function Linkage Database (на en). „Nucleic Acids Research“ том  42 (D1): D521–D530. doi:10.1093/nar/gkt1130. ISSN 0305-1048. https://academic.oup.com/nar/article/42/D1/D521/1052469. 
  21. Protein structure and evolutionary history determine sequence space topology. „Genome Research“ том  15 (3): 385–92. март 2005 г. doi:10.1101/gr.3133605. PMID 15741509. 
  22. Protein superfamily evolution and the last universal common ancestor (LUCA). „Journal of Molecular Evolution“ том  63 (4): 513–25. октомври 2006 г. doi:10.1007/s00239-005-0289-7. PMID 17021929. 
  23. Alpha/beta hydrolase fold: an update. „Protein and Peptide Letters“ том  16 (10): 1137–48. PMID 19508187. 
  24. Alpha/beta hydrolase fold enzymes: the family keeps growing. „Current Opinion in Structural Biology“ том  9 (6): 732–7. декември 1999 г. doi:10.1016/S0959-440X(99)00037-8. PMID 10607665. 
  25. „SCOP“. http://scop.mrc-lmb.cam.ac.uk/scop/data/scop.b.d.bah.A.html. посет. 28 мај 2014 г. 
  26. Efficient, crosswise catalytic promiscuity among enzymes that catalyze phosphoryl transfer. „Biochimica et Biophysica Acta“ том  1834 (1): 417–24. јануари 2013 г. doi:10.1016/j.bbapap.2012.07.015. PMID 22885024. 
  27. Branden, Carl; Tooze, John (1999). Introduction to protein structure (2nd издание). New York: Garland Pub.. ISBN 978-0815323051. 
  28. Aplysia limacina myoglobin. Crystallographic analysis at 1.6 A resolution. „Journal of Molecular Biology“ том  205 (3): 529–44. февруари 1989 г. doi:10.1016/0022-2836(89)90224-6. PMID 2926816. 
  29. The immunoglobulin fold. Structural classification, sequence patterns and common core. „Journal of Molecular Biology“ том  242 (4): 309–20. септември 1994 г. doi:10.1006/jmbi.1994.1582. PMID 7932691. 
  30. Cell adhesion molecules 1: immunoglobulin superfamily. „Protein Profile“ том  2 (9): 963–1108. PMID 8574878. 
  31. Viral cysteine proteases are homologous to the trypsin-like family of serine proteases: structural and functional implications. „Proceedings of the National Academy of Sciences of the United States of America“ том  85 (21): 7872–6. ноември 1988 г. doi:10.1073/pnas.85.21.7872. PMID 3186696. 
  32. The guanine nucleotide-binding switch in three dimensions. „Science“ том  294 (5545): 1299–304. ноември 2001 г. doi:10.1126/science.1062023. PMID 11701921. 
  33. The serpins are an expanding superfamily of structurally similar but functionally diverse proteins. Evolution, mechanism of inhibition, novel functions, and a revised nomenclature. „The Journal of Biological Chemistry“ том  276 (36): 33293–6. септември 2001 г. doi:10.1074/jbc.R100016200. PMID 11435447. 
  34. One fold with many functions: the evolutionary relationships between TIM barrel families based on their sequences, structures and functions. „Journal of Molecular Biology“ том  321 (5): 741–65. август 2002 г. doi:10.1016/s0022-2836(02)00649-6. PMID 12206759. 
  35. An α/β-barrel full of evolutionary trouble. „Current Opinion in Structural Biology“ том  3 (3): 409–412. doi:10.1016/S0959-440X(05)80114-9.