Протеогеномика

Од Википедија — слободната енциклопедија
Протеогеномиката користи интегриран пристап со комбинирање на геномиката, протеомиката и транскриптомиката.

Протеогеномика ― поле на биолошко истражување што користи комбинација од протеомика, геномика и транскриптомика за да помогне во откривањето и идентификацијата на пептидите. Протеогеномика е користена за да бидат идентификувани нови пептиди со споредување на спектрите на тандемската масена спектрометрија со базата на податоци за белковини што е изведена од геномски и транскриптомски информации. Протеогеномиката често се однесува на студии кои користат протеомски информации, често добиени од масена спектрометрија, за да ги подобрат генските прибелешки. Употребата и на податоците од протеомика и геномика заедно со напредокот во достапноста и моќта на спектрографската и хроматографската технологија довело до појава на протеогеномика како свое поле во 2004 година.

Протеомиката се занимава со белковината на ист начин како што геномиката го проучува генетскиот код на целите организми, додека транскриптомиката се занимава со проучување на секвенционирањето на РНК и транскриптите. Додека сите три полиња можат да користат облици на масена спектрометрија и хроматографија за да ги утврдуваат и проучуваат функциите на ДНК, РНК и белковините, протеомиката се потпира на претпоставката дека сегашните генски модели се точни и дека сите релевантни белковински секвенци може да бидат најдени во референтна база на податоци како што е Идентификациската податочна база за протеомика. Протеогеномиката помага да биде отстрането ова потпирање на постоечките, ограничени генетски модели со сврзување на збирки на податоци од повеќе полиња со цел да се произведе база на податоци на белковини или генетски маркери. Дополнително, појавата на нови белковински секвенци поради мутации често не може да биде земено предвид во традиционалните протеомски бази на податоци, но може да биде предвидено и проучувано со помош на синтеза на геномски и транскриптомски податоци.

Резултатите од истражувањето имаат примена во подобрувањето на генските прибелешки, проучувањето на мутациите и разбирањето на ефектите од генетската манипулација.

Во поново време, заедничкото профилирање на површинските белковини и транскриптите на информациската РНК од единечни клетки со методи како што се клеточното индексирање на транскриптоми и епитопи со секвенционирање и ESCAPE[1] било означено како протеогеномиката на една клетка,[2][3][4] иако целите на овие студии не се поврзани со пептидната идентификација. Од 2019 година овие методи почесто се нарекувани повеќемодални омики или мултиомики.[5]

Историја[уреди | уреди извор]

Протеогеномиката се појавила како независно поле во 2004 година, заснована на интеграцијата на технолошкиот напредок во геномиката на секвенционирање со техниката „следна генерација“ и протеомиката на масената спектрометрија.[6] Самиот поим стапил во употреба таа година, со објавување на труд од истражувачката група на Џорџ Чрч во кое е опишувано нивното откритие на техника на протеогеномско картирање која користела податоци од протеомика за подобро да го означи геномот на бактеријата M. pneumoniae. Со користење на современа база на податоци за белковини, лабораторијата ги картирала пептидите откриени во цела клетка на генетско скеле користејќи тандемска масена спектрометрија, а потоа ги искористила генерираните „удари“ со цел да создаде „протеогеномска карта“ заснована на традиционални генетски сигнали. Резултирачката карта се покажа исклучително точна, со над 81% од предвидените геномски рамки за читање откриени во проучуваните бактериски клетки. Дополнително, лабораторијата открила неколку нови рамки кои не се предвидени преку чисто генетски методи, како и некои докази што ја поддржуваат идејата дека неколку генетски модели засновани на предвидувања би можеле да бидат лажни, што ја докажува точноста и економичноста на хибридната техника.[7][8]

Областа било проширено во текот на следните две децении, првично користејќи податоци од протеомиката за да помогне во рафинирањето на генетските модели преку белковинските бази на податоци.[6] Во 2020-тите, една од најчестите техники за идентификување на пептидите вклучува користење на тандемска масена спектрометрија. Оваа техника потекнува од Енг и Јејтс во 1994 година, која вклучува споредување на теоретски спектар на фрагмент на пептид за да се спореди опитно изведен пептиден спектар со и да бидат излезени најверојатните пронајдени совпаѓања.[7] Меѓутоа, во отсуство на воспоставена база на податоци за пептиди, Протеогеномиката наместо тоа го споредува опитниот спектар со геномска база на податоци, која потоа може да биде користена за прибелешка на геномот - како што е опишано во работата на Џорџ Чрч. Последната техника станала пошироко користена во текот на последната деценија во голем дел поради зголемената достапност и брзината на техниките за геномско секвенционирање заедно со зголемената чувствителност на протеомиката заснована на масена спектрометрија.[6]

Методологија[уреди | уреди извор]

Слика на еукариотска клетка која илустрира како се создавани белковините: ДНК во јадрото е читано со РНК полимераза, а потоа рибозомите во цитоплазмата произведуваат аминокиселинска нишка која се преклопува во функционална белковина.

Главната идеја зад протеогеномскиот пристап е да бидат идентификувани пептидите со споредување на податоците од тандемска масена спектрометрија со белковинските бази на податоци кои содржат предвидени белковински секвенци.[9] Базата на податоци за белковините е создавана на различни начини преку користење на геномски и транскриптомски податоци. Подолу се дадени некои од начините на кои се создавани белковинските бази на податоци:

Превод со шест рамки[уреди | уреди извор]

Преводите со шест рамки може да бидат користени за да биде создадена база на податоци што предвидува белковински секвенци. Ограничувањето на овој метод е што базите на податоци ќе бидат многу големи поради бројот на секвенци кои се создавани, а некои од нив не постојат во природата.[10]

Од почеток генско предвидување[уреди | уреди извор]

Во овој метод, белковинската база е создавана со алгоритми за предвидување на гени кои овозможуваат идентификација на белковински кодирани региони. Базата на податоци е слична на онаа создавана преку превод од шест рамки во однос на фактот дека базите на податоци можат да бидат многу големи.[10]

Изразени податоци за ознаки за секвенца[уреди | уреди извор]

Преводите со шест рамки можат да користат ознака за изразена секвенца за да создаваат белковински бази на податоци. Податоците со ознака за изразена секвенца обезбедуваат информации за транскрипција кои можат да помогнат во творењето на базата на податоци. Базата на податоци може да биде многу голема и има недостаток на присуство на повеќе копии од дадена низа; сепак, овој проблем може да се заобиколи со компресирање на белковинската секвенца создадена преку сметачки стратегии.[10]

Други методи[уреди | уреди извор]

Белковинските бази на податоци може да бидат створени и со користење на податоци за секвенционирање на РНК, означени транскрипти на РНК и варијантни белковински секвенци. Исто така, постојат и други поспецијализирани бази на податоци за белковини кои можат да се направат за соодветно да го идентификуваат пептидот од интерес.[10]

Друг метод за идентификација на белковините преку протеогеномика е споредбената протеогеномика. Споредбената протеогеномика ги споредува протеомските податоци од повеќе сродни видови истовремено и ја искористува хомологијата помеѓу нивните белковини за да ги подобри прибелешките со поголема статистичка сигурност.[11][12]

Примени[уреди | уреди извор]

Протеогеномиката може да биде применета на различни начини. Една од примени е подобрување на генските прибелешки кај различни организми. Прибелешката на гените вклучува откривање на гени и нивните функции.[13] Протеогеномиката станала особено корисна во откривањето и подобрувањето на генските прибелешки кај прокариотските организми. На пример, различни микроорганизми ја проучувале нивната геномска прибелешка преку протеогеномски пристап, вклучувајќи ги Escherichia coli, Mycobacterium и повеќе видови на бактериите Shewanella.[14]

Покрај подобрувањето на прибелешките на гените, протеогеномските студии можат исто така да обезбедат вредни информации за присуството на програмирани поместувања на рамки, N-терминална ексцизија на метионин, сигнални пептиди, протеолиза и други послепреведувачки модификации.[11][15] Протеогеномиката има потенцијална примена во медицината, особено во онколошките истражувања. Ракот се јавува преку генетски мутации како што се метилација, транслокација и соматски мутации. Истражувањата покажале дека и геномските и протеомските информации се потребни за да бидат разбрани молекуларните варијации кои водат до рак.[16][17] Протеогеномиката помогнала во ова преку идентификација на белковински секвенци кои може да имаат функционална улога во ракот.[18] Специфичен пример за ова се случило во една студија која вклучува рак на дебелото црево што резултирало со откривање на потенцијални цели за третман на рак.[16] Протеогеномиката, исто така, довела до персонализирани имунотерапии насочени кон рак, каде што се предвидувани антителни епитопи за антигени на ракот со користење на протеогеномика за создавање лекови кои делуваат на специфичниот тумор на пациентот.[19] Покрај третманот, протеогеномиката може да обезбеди увид во дијагнозата на ракот. Во студиите кои вклучуваат рак на дебелото црево и ректумот, протеогеномиката била искористена за да бидат идентификувани соматските мутации. Идентификацијата на соматски мутации кај пациенти може да биде користена за дијагностицирање на рак кај пациенти. Покрај директните примени во третманот и дијагнозата на ракот, може да биде користен протеогеномски пристап за проучување на белковините што резултираат со отпорност на хемотерапија.[17]

Предизвици[уреди | уреди извор]

Протеогеномиката може да понуди методи за идентификација на пептиди без да има недостаток на нецелосни или неточни бази на податоци за белковини со кои се соочува протеомиката; сепак, постојат предизвици со протеогеномскиот пристап.[10] Еден од најголемите предизвици на протеогеномиката е огромната големина на создадените бази на податоци за белковини, статистички, големата база на податоци за белковини е поверојатно да резултира со неправилно совпаѓање на податоците од белковинската база на податоци со податоците на тандемската спектрометрија, ова прашање може да го попречи идентификацијата на нови пептиди. Лажните позитиви се исто така проблем преку протеогеномските пристапи. Лажни позитиви може да се појават како резултат на крајно големи белковински бази на податоци каде што неуспешните податоци доведуваат до неточна идентификација. Друг проблем е неправилното совпаѓање на спектрите на тандемската спектрометрија со податоците од белковинската секвенца што одговара на сличен пептид наместо вистинскиот пептид. Постојат случаи на примање податоци за пептид сместен на повеќе места на гени, што може да доведе до податоци што може да бидат толкувани на различни начини. И покрај овие предизвици, постојат начини да се намалат многу од грешките што се случуваат. На пример, кога се работи со многу голема база на податоци за белковини, може да се споредат идентификуваните нови пептидни секвенци со сите секвенци во базата на податоци и потоа да бидат споредувани модификациите по преведувањето. Потоа може да се утврди дали двете секвенци претставуваат ист пептид или дали се два различни пептиди.[10]

Наводи[уреди | уреди извор]

  1. „Proteona ESCAPE RNA Sequencing“. 11 декември 2018.
  2. „Proteona Driving Adoption of Immune Profiling Platform for CAR-T, Multiple Myeloma Research“. Precision Oncology News (англиски). 2021-05-07. Посетено на 4 февруари 2024.
  3. „TotalSeq eBook“. BioLegend. Посетено на 4 февруари 2024.
  4. „Proteona releases ESCAPE™ RNA sequencing for measuring protein and RNA in single cells with a focus on clinical questions“. Proteona. Посетено на 4 февруари 2024.
  5. „Method of the Year 2019: Single-cell multimodal omics“. Nature Methods (англиски). 17 (1): 1. јануари 2020. doi:10.1038/s41592-019-0703-5. ISSN 1548-7105. PMID 31907477.
  6. 6,0 6,1 6,2 Menschaert, Gerben; Fenyö, David (2017). „Proteogenomics from a bioinformatics angle: A growing field“. Mass Spectrometry Reviews (англиски). 36 (5): 584–599. Bibcode:2017MSRv...36..584M. doi:10.1002/mas.21483. ISSN 1098-2787. PMC 6101030. PMID 26670565.
  7. 7,0 7,1 Ruggles, Kelly V.; Krug, Karsten; Wang, Xiaojing; Clauser, Karl R.; Wang, Jing; Payne, Samuel H.; Fenyö, David; Zhang, Bing; Mani, D. R. (2017-06-01). „Methods, Tools and Current Perspectives in Proteogenomics*“. Molecular & Cellular Proteomics (англиски). 16 (6): 959–981. doi:10.1074/mcp.MR117.000024. ISSN 1535-9476. PMC 5461547. PMID 28456751.
  8. Jaffe, Jacob D.; Berg, Howard C.; Church, George M. (јануари 2004). „Proteogenomic mapping as a complementary method to perform genome annotation“. Proteomics. 4 (1): 59–77. doi:10.1002/pmic.200300511. ISSN 1615-9853. PMID 14730672.
  9. Nesvizhskii, Alexey I. (ноември 2014). „Proteogenomics: concepts, applications and computational strategies“. Nature Methods (англиски). 11 (11): 1114–1125. doi:10.1038/nmeth.3144. ISSN 1548-7105. PMC 4392723. PMID 25357241.
  10. 10,0 10,1 10,2 10,3 10,4 10,5 Nesvizhskii, Alexey I (1 ноември 2014). „Proteogenomics: concepts, applications and computational strategies“. Nature Methods. 11 (11): 1114–1125. doi:10.1038/nmeth.3144. PMC 4392723. PMID 25357241.
  11. 11,0 11,1 Gupta N., Benhamida J., Bhargava V., Goodman D., Kain E., Kerman I., Nguyen N., Ollikainen N., Rodriguez J., Wang J., et al. Comparative proteogenomics: Combining mass spectrometry and comparative genomics to analyze multiple genomes. Genome Res. 2008;18:1133–1142.
  12. Gallien S., Perrodou E., Carapito C., Deshayes C., Reyrat J. M., Van Dorsselaer A., Poch O., Schaeffer C., Lecompte O. ( 2009) Ortho-proteogenomics: multiple proteomes investigation through orthology and a new MS-based protocol. Genome Res 19, 128– 135.
  13. Ansong, C.; Purvine, S. O.; Adkins, J. N.; Lipton, M. S.; Smith, R. D. (7 March 2008). „Proteogenomics: needs and roles to be filled by proteomics in genome annotation“. Briefings in Functional Genomics and Proteomics. 7 (1): 50–62. doi:10.1093/bfgp/eln010. PMID 18334489.
  14. Kucharova, Veronika; Wiker, Harald G. (декември 2014). „Proteogenomics in microbiology: Taking the right turn at the junction of genomics and proteomics“. Proteomics. 14 (23–24): 2360–2675. doi:10.1002/pmic.201400168. PMID 25263021. |hdl-access= бара |hdl= (help)
  15. Gupta N., Tanner S., Jaitly N., Adkins J.N., Lipton M., Edwards R., Romine M., Osterman A., Bafna V., Smith R.D., et al. Whole proteome analysis of post-translational modifications: Applications of mass-spectrometry for proteogenomic annotation. Genome Res. 2007;17:1362–1377.
  16. 16,0 16,1 Sajjad, Wasim; Rafiq, Muhammad; Ali, Barkat; Hayat, Muhammad; Zada, Sahib; Sajjad, Wasim; Kumar, Tanweer (јули 2016). „Proteogenomics: New Emerging Technology“. HAYATI Journal of Biosciences. 23 (3): 97–100. doi:10.1016/j.hjb.2016.11.002.
  17. 17,0 17,1 Shukla, Hem D.; Mahmood, Javed; Vujaskovic, Zeljko (декември 2015). „Integrated proteo-genomic approach for early diagnosis and prognosis of cancer“. Cancer Letters. 369 (1): 28–36. doi:10.1016/j.canlet.2015.08.003. PMID 26276717.
  18. Chambers, Matthew C.; Jagtap, Pratik D.; Johnson, James E.; McGowan, Thomas; Kumar, Praveen; Onsongo, Getiria; Guerrero, Candace R.; Barsnes, Harald; Vaudel, Marc (2017-11-01). „An Accessible Proteogenomics Informatics Resource for Cancer Researchers“. Cancer Research. 77 (21): e43–e46. doi:10.1158/0008-5472.can-17-0331. PMC 5675041. PMID 29092937.
  19. Creech, Amanda L.; Ting, Ying S.; Goulding, Scott P.; Sauld, John FK; Barthelme, Dominik; Rooney, Michael S.; Addona, Terri A.; Abelin, Jennifer G. (2018). „The role of mass spectrometry and proteogenomics in the advancement of HLA epitope prediction“. Proteomics (англиски). 18 (12): e1700259. doi:10.1002/pmic.201700259. ISSN 1615-9861. PMC 6033110. PMID 29314742.