Функционална геномика

Од Википедија — слободната енциклопедија
Длабоко мутациско скенирање на мотивот за препознавање на РНК (РРМ2) на белковината за врзување на квасец PolyA (Pab1)

Функционална геномика ― поле на молекуларната биологија која се обидува да ги опише функциите и меѓудејствијата на генитебелковините). Функционалната геномика ги користи огромните податоци создадени од геномски и транскриптомски проекти (како што се проекти за секвенционирање на геном и секвенционирање на РНК). Функционалната геномика се насочува на динамичките гледишта како што се генска транскрипција, превод, регулација на генското изразивање и меѓудејствијата белковина со белковина, наспроти статичните аспекти на геномските информации како што се секвенцата на ДНК или структурите. Клучна одлика на студиите за функционална геномика е нивниот пристап на овие прашања за геномот во широка смисла, кој воглавно вклучува методи со висок пропуст, наместо потрадиционален пристап „кандидат-ген“.

Дефиниција и цели на функционалната геномика[уреди | уреди извор]

За да биде разбрана функционалната геномика, важно е прво да биде дефинирана функцијата. Во нивниот труд,[1] Граур и други соработници ја дефинираат функцијата на два можни начини. Тоа се „избран ефект“ и „причинска улога“. Функцијата „избран ефект“ се однесува на функцијата за која е избрана одлика (ДНК, РНК, белковина итн.). Функцијата „причинска улога“ се однесува на функцијата за која е доволна и неопходна одлика. Функционалната геномика обично ја тестира дефиницијата за функцијата „причинска улога“.

Целта на функционалната геномика е да се разбере функцијата на гените или белковините, на крајот на сите компоненти на геномот. Поимот функционална геномика често е користен за да се однесува на многу технички пристапи за проучување на гените и белковините на организмот, вклучувајќи ги „биохемиските, клеточните и/или физиолошките својства на секој генски производ“[2] додека некои автори ја вклучуваат студијата на негенски елементи во нивната дефиниција.[3] Функционалната геномика може да вклучува и студии за природните генетски варијации со текот на времето (како што е развојот на организмот) или просторот (како што се неговите делови од телото), како и функционални нарушувања како што се мутациите.

Ветувањето за функционална геномика е да создава и синтетизира геномско и протеомско знаење во разбирање на динамичките својства на организмот. Ова потенцијално би можело да обезбеди поцелосна слика за тоа како геномот ја одредува функцијата во споредба со студиите за поединечни гени. Вклучувањето на функционалните геномски податоци често е дел од пристапите на системската биологија.

Техники и примени[уреди | уреди извор]

Функционалната геномика вклучува гледишта поврзани со функцијата на самиот геном, како што се мутација и полиморфизам (како што е анализата на полиморфизмот на еден нуклеотид, како и мерење на молекуларните активности. Последниве опфаќаат голем број „ -омики “ како што се транскриптомика (генско изразување), протеомика (производство на белковини) и метаболомика. Функционалната геномика користи претежно мултиплексни техники за мерење на изобилството на многу или сите генски производи како што се информациска РНК или белковини во биолошки примерок. Пофокусиран пристап на функционална геномика може да ја тестира функцијата на сите варијанти на еден ген и да ги измери ефектите на мутантите со користење на секвенционирање како отчитување на активноста. Заедно, овие мерни модалитети се трудат да ги квантифицираат различните биолошки постапки и да го подобрат нашето разбирање за функциите и меѓудејствијата на гените и белковините.

На ниво на ДНК[уреди | уреди извор]

Картирање на генетските меѓудејствија[уреди | уреди извор]

Систематско парно бришење на гени или инхибиција на генското изразување може да биде користено за да бидат идентификувани гените со сродна функција, дури и ако тие не општат физички. Епистазата се однесува на фактот дека ефектите за два различни генски соборувања може да не бидат адитивни; односно, фенотипот што произлегува кога два гена се инхибирани може да се разликува од збирот на ефектите од единечните соборувања.

ДНК-ови/белковински меѓудејствија[уреди | уреди извор]

Белковините создадени со превод на информациска РНК (кодирана информација од ДНК за синтеза на белковини) играат главна улога во регулирањето на генското изразување. За да се разбере како тие ја регулираат генското изразување, неопходно е да бидат идентификувани секвенците на ДНК со кои што тие општат. Развиени се техники за да се идентификуваат местата на меѓудејствија на ДНК со белковина. Тие се секвенционирање на чипови, секвенционирање CUT&RUN и повикувачки картички.[4]

Анализи за пристапност на ДНК[уреди | уреди извор]

Развиени се анализи за да бидат идентификувани регионите на геномот кои се достапни. Овие региони на пристапен хроматин се кандидатски регулаторни региони. Овие анализи се ATAC-seq, DNase-Seq и FAIRE-Seq.

На ниво на РНК[уреди | уреди извор]

Микрочипови[уреди | уреди извор]

ДНК-микрочип.

Микрочиповите го мерат количеството на информациска РНК во примерок што одговара на даден ген или секвенца на ДНК со сонда. Секвенците со сонда се имобилизирани на цврста површина и се оставаат да се хибридираат со флуоресцентно означена „целна“ информациска РНК. Интензитетот на флуоресценцијата на точката е пропорционален на количината на целната секвенца што се хибридизирала со тоа место и затоа на изобилството на таа секвенца на информациска РНК во примерокот. Микрочиповите овозможуваат идентификација на кандидатски гени вклучени во дадена постапка врз основа на варијации помеѓу нивоата на транскрипти за различни услови и заеднички модели на изразување со гени со позната функција.

Сериска анализа на генското изразување[уреди | уреди извор]

Сериската анализа на генското изразување е алтернативен метод на анализа заснован на секвенционирање на РНК наместо хибридизација. Оваа анализа се потпира на секвенционирање на ознаки од 10-17 базни парови кои се единствени за секој ген. Овие ознаки се произведувани од поли-А информациска РНК и се врзувани од крај до крај пред да бидат секвенционирани. SAGE дава непристрасно мерење на бројот на транскрипти по клетка, бидејќи тоа не зависи од претходното знаење за тоа кои транскрипти да бидат проучувани (како што прават микрочиповите).

Секвенционирање на РНК[уреди | уреди извор]

Секвенционирањето на РНК ја презело технологијата на микросреди и сериската анализа на генското изразување во последниве години, како што било забележано во 2016 година, и стана најефикасниот начин за проучување на транскрипцијата и генското изразување. Ова обично се прави со секвенционирање со т.н. „следна генерација“.[5]

Подгрупа на секвенционирани РНК се мали РНК, класа на некодирачки молекули на РНК кои се клучни регулатори на транскрипциското и послетранскрипциското потиштување на гените или потиштувањето на РНК. Секвенционирањето со „следна генерација“ е златна стандардна алатка за откривање, профилирање и анализа на изразување некодирачка РНК.

Масовно напоредни известувачки анализи[уреди | уреди извор]

Масовно напоредните известувачки анализи се технологија за тестирање на цис-регулаторната активност на секвенците на ДНК.[6][7] Овие анализи користат плазмид со синтетички цис-регулаторен елемент горе од промоторот кој управува со синтетички ген како што е зелената флуоресцентна белковина. Библиотеката на цис-регулаторни елементи обично се тестира со користење вакви анализи, библиотеката може да содржи од стотици до илјадници цис-регулаторни елементи. Цис-регулаторната активност на елементите се проценува со користење на активноста на известувачот низводно. Активноста на сите членови на библиотеката е анализирана напоредно со користење на баркодови за секој цис-регулаторен елемент. Едно ограничување на овие аналиси е тоа што активноста е испитувана на плазмид и може да не ги опфати сите гледишта на генската регулација забележани во геномот.

Секвенционирање со самотранскрибирачки активен регулаторен регион[уреди | уреди извор]

Секвенционирањето со самотранскрибирачки активен регулаторен регион е техника слична на Масовно напоредните известувачки анализи за да биде анализирана активноста на засилувачот на случајно скратените геномски фрагменти. Во изворната публикација,[8] случајно исечените фрагменти од геномот на Drosophila биле поставени низводно од минимален промотор. Кандидатите за засилувачи меѓу случајно исечените фрагменти ќе се транскрибираат со помош на минималниот промотор. Со користење на секвенционирање како отчитување и контролирање на влезните количини на секоја секвенца, јачината на наводните засилувачи се оценува со овој метод.

Пертурбациско секвенционирање[уреди | уреди извор]

Преглед на работниот тек на пертурбациско секвенционирање.

Пертурбациското секвенционирање ги спарува посредуваните генски падови со генско изразување на една клетка преку групирано редовните меѓупросторни кратки палиндромски повторувања. Линеарни модели се користени за пресметување на ефектот на падот на еден ген врз изразувањето на повеќе гени.

На белковинско ниво[уреди | уреди извор]

Квасен двохибриден систем[уреди | уреди извор]

Двохибридниот преглед на квасец ја тестира белковината „мамка“ против многу потенцијални интерактивни белковини („плен“) за да бидат идентификувани физичките меѓудејствија белковина со белковина. Овој систем се заснова на фактор на транскрипција, првично GAL4,[9] чиишто посебни домени за врзување на ДНК и активирање на транскрипција се потребни за белковината да предизвика транскрипција на генот известувач. Во двохибридниот преглед, белковината „мамка“ се спојува со сврзувачкиот домен на GAL4, а библиотека на потенцијални „пленови“ (меѓудејствија) белковини е рекомбинантно изразена во вектор со доменот на активирање. Меѓудејствието, во живо, на белковините мамка и плен во клетка на квасец ги доближува домените на активирање и врзување на GAL4 доволно блиску еден до друг за да резултира со изразување на известувачки ген. Исто така, можно е систематски да биде тестирана библиотека со белковини од мамка против библиотека со белковини од плен за да се идентификуваат сите можни меѓудејствија во клетката.

Масена спектрометрија и афинитетно прочистување/масена спектрометрија[уреди | уреди извор]

Масовната спектрометрија може да ги идентификува белковините и нивните релативни нивоа, па затоа може да биде користена за проучување на белковинското изразување. Кога е користена во комбинација со афинитетното прочистување, масената спектрометрија може да бидат користени за проучување на белковинските комплекси, односно, кои белковини меѓудејствуваат еден со друг во комплексите и во кои соодноси. Со цел да бидат прочистени белковинските комплекси, обично белковината „мамка“ е означен со специфична белковина или пептид што може да биде користен за да биде извлечен комплексот од сложената мешавина. Прочистувањето обично е вршено со користење на антитело или соединение што се врзува за делот за фузија. Белковините потоа се варени во кратки пептидни фрагменти и е користена масена спектрометрија за да бидат идентификувани белковините врз основа на односот маса-полнење на тие фрагменти.

Длабоко мутациско скенирање[уреди | уреди извор]

Во длабокото мутациско скенирање најпрво е синтетизирана секоја можна промена на аминокиселините во дадена белковина. Активноста на секоја од овие варијанти на белковини е анализирана напоредно со користење на баркодови за секоја варијанта. Со споредување на активноста со белковината од дива врста, е идентификуван ефектот на секоја мутација. Иако е можно да биде проценета секоја можна единечна промена на аминокиселина поради комбинаторика, тешко е да бидат тестирани две или повеќе истовремени мутации. Опитите за длабоко мутационо скенирање исто така се користени за да биде заклучена структурата на меѓудејствијата белковина со белковина.

Мутагенеза и фенотипизација[уреди | уреди извор]

Важна функционална одлика на гените е фенотипот предизвикан од мутации. Мутантите може да се произведат со случајни мутации или со насочена мутагенеза, вклучително и насочена мутагенеза, бришење на целосни гени или други техники.

Соборувања (бришење гени)[уреди | уреди извор]

Функцијата на генот може да биде испитан со систематско „соборување“ на гените еден по еден. Ова е правено со бришење или со нарушување на функцијата (како што е вметната мутагенеза) и стекнатите организми се проверувани за фенотипови кои обезбедуваат индиции за функцијата на нарушениот ген. Направени се соборувања за цели геноми, односно со бришење на сите гени во геномот. За суштинските гени, тоа не е можно, па затоа се користат други техники, на пр. бришење на ген додека е изразуван генот од плазмид, со користење на индуциран промотор, така што нивото на генски производ може да биде променет по желба (а со тоа и „функционално“ бришење е постигнато).

Мутагенеза насочена кон место[уреди | уреди извор]

Мутагенезата насочена кон местото е користена за мутација на специфични бази (а со тоа и аминокиселини). Ова е критично за да биде испитана функцијата на специфичните аминокиселини во белковината, на пр. во активното место на ензимот.

Мешање во РНК[уреди | уреди извор]

Методите на мешање во РНК може да бидат користени за минливо замолчување или соборување на генското изразување со користење на ~20 базни парови со двоверижна РНК, обично испорачана со трансфекција на синтетички ~20-мерни кратко-интерферентни молекули на РНК или со вирусно кодирани краткофибна РНК. Прегледите на мешање во РНК, вообичаено изведени во анализи засновани на клеточна култура или опитни организми (како што е C. elegans) може да бидат користени за систематско нарушување на речиси секој ген во геномот или подмножества на гени (под-геном); можните функции на нарушените гени може да бидат доделени врз основа на набљудуваните фенотипови.

Прегледи со групирано редовните меѓупросторни кратки палиндромски повторувања[уреди | уреди извор]

Пример на губење на функцијата преку преглед со групирано редовните меѓупросторни кратки палиндромски повторувања.[10]

CRISPR-Cas9 (CRSIPR е кратенка за „групирано редовни меѓупросторни кратки палиндромски повторувања“) е користена за бришење гени на мултиплексиран начин во клеточните линии. Квантификувањето на количината на водич-РНК за секој ген пред и по опитот може да укаже на суштински гени. Ако водич-РНК го наруши суштинскиот ген, тоа ќе доведе до губење на таа клетка и оттука ќе има исцрпување на таа конкретна водилка-РНК по прегледот. Во неодамнешниот опит на CRISPR-cas9, во клеточни линии на цицачи, било откриено дека околу 2000 гени се суштински во повеќе клеточни линии.[11][12] Некои од овие гени биле суштински само во една клеточна линија. Повеќето гени се дел од повеќебелковински комплекси. Овој пристап може да биде користен за да биде идентификуван синтетичката смртност со користење на соодветна генетска позадина. CRISPRi и CRISPRa овозможуваат прегледи со губење на функција и зголемување на функцијата на сличен начин. CRISPRi идентификувал ~2100 суштински гени во клеточната линија K562.[13][14] Прегледите за бришење на групирано редовните меѓупросторни кратки палиндромски повторувања исто така се користени за да бидат идентификувани потенцијалните регулаторни елементи на генот. На пример, била објавена техника наречена ScanDel со која бил обиден овој пристап. Авторите избришале региони надвор од ген од интерес (HPRT1 вклучен во Менделово нарушување) во обид да ги идентификуваат регулаторните елементи на овој ген.[15] Гасперини и соработниците не идентификувале никакви дистални регулаторни елементи за HPRT1 користејќи го овој пристап, но таквите пристапи може да бидат проширени на други гени од интерес.

Функционални прибелешки за гени[уреди | уреди извор]

Геномска прибелешка[уреди | уреди извор]

Наводните гени може да бидат идентификувани со скенирање на геном за региони кои веројатно ќе кодираат белковини, врз основа на одлики како што се долги отворени рамки за читање, секвенци на започнување на транскрипција и полиаденилација. Секвенцата идентификувана како наводен ген мора да биде потврдена со дополнителни докази, како што е сличноста со секвенците на cDNA или EST од истиот организам, сличноста на предвидената белковинска секвенца со познатите белковини, поврзаноста со промоторните секвенци или доказ дека мутирањето на секвенцата произведува забележлив фенотип.

Пристап „Камен од розета“[уреди | уреди извор]

Пристапот „Камен од Розета“ е пресметковен метод за од почеток белковинска прогноза на функцијата. Се заснова на хипотезата дека некои белковини вклучени во дадена физиолошка постапка може да постојат како два посебни гени во еден организам и како единствен ген во друг. Геномите се скенирани за секвенци кои се независни во еден организам и во една отворена рамка за читање во друг. Ако два гени се споиле, се предвидува дека тие имаат слични биолошки функции што ја прават таквата корегулација поволна.

Биоинформатички методи за функционална геномика[уреди | уреди извор]

Поради големото количество податоци произведени од овие техники и желбата да бидат пронајдени биолошки значајни обрасци, биоинформатиката е од клучно значење за анализата на функционалните геномски податоци. Примери на техники во оваа класа се групирање податоци или анализа на главна компонента за машинско учење без надзор (откривање класа), како и вештачки невронски мрежи или векторски машини за поддршка за надгледувано машинско учење (предвидување класа, класификација). Функционална анализа на збогатување е користена за да биде одреден степенот на прекумерно или недоволно изразување (позитивни или негативни регулатори во случај на прегледи со мешање во РНК) на функционални категории во однос на множества на позадина. Анализата на збогатување заснована на генска онтологија е обезбедена од Базата на податоци за прибелешки, визуелизација и интегрирано откривање и анализата на збогатување на генски множества,[16] анализа базирана на патека од Ingenuity[17] и студио Pathway [18] и анализа заснована на белковински комплекси од страна на COMPLEAT.[19]

Преглед на работниот тек на фидмите.

Развиени се нови сметачки методи за разбирање на резултатите од опитите за длабоко мутациско скенирање. „Фидмите“ го споредуваат резултатот од опитот за длабоко мутациско скенирање со филогенетско дрво.[20] Ова му овозможува на корисникот да заклучи дали постапката на одбирање во природата применува слични ограничувања на белковината како што покажуваат резултатите од длабокото мутациско скенирање. Ова може да му овозможи на опитувачот да избира помеѓу различни опитни услови врз основа на тоа колку добро ја одразуваат природата. Длабокото мутациско скенирање исто така е користено за да бидат заклучени меѓудејствијата белковина со белковина.[21] Авторите користеле термодинамички модел за да ги предвидат ефектите на мутациите во различни делови на димерот. Длабоката мутациска структура, исто така, може да биде користена за да биде заклучена структурата на белковините. Силната позитивна епистаза помеѓу две мутации во длабоко мутациско скенирање може да биде показател за два дела од белковината кои се блиску еден до друг во тродимензионален простор. Оваа информација потоа може да биде користена за да биде заклучена структурата на белковините. Доказ за начелото на овој пристап бил прикажан од две групи кои ја користеле белковината GB1.[22][23]

Резултатите од опитите со масовно напоредните известувачки анализи барале пристапи за машинско учење за толкување на податоците. Употребен е процепувачки k-mer SVM модел за да бидат заклучени кмерите кои се збогатени во рамките на цис-регулаторните секвенци со висока активност во споредба со секвенците со помала активност.[24] Овие модели обезбедуваат висока моќ на предвидување. Пристапите за длабоко учење и случајни шумски пристапи исто така се користени за толкување на резултатите од овие високодимензионални опити.[25] Овие модели почнуваат да помагаат да биде развиено подобро разбирање на функцијата на некодирачката ДНК кон генската регулација.

Конзорциумски проекти насочени кон функционалната геномика[уреди | уреди извор]

Проект „ENCODE“[уреди | уреди извор]

Проектот ENCODE (Енциклопедија на ДНК елементи) е длабинска анализа на човечкиот геном чија цел е да бидат идентификувани сите функционални елементи на геномната ДНК, и во кодирачки и во некодирачки региони. Важните резултати вклучуваат докази од геномските плочки дека повеќето нуклеотиди се транскрибираат како кодирани транскрипти, некодирачки РНК или случајни транскрипти, откривање на дополнителни транскрипциски регулаторни места, дополнително разјаснување на механизмите за модифицирање на хроматин.

Проект „Изразување генотип со ткиво“[уреди | уреди извор]

Употребени примероци и eQTL откриени во GTEx v6.

Проектот „Изразување генотип со ткиво“ е проект за човечка генетика чија цел е да биде разбрана улогата на генетските варијации во обликувањето на варијациите во транскриптомите низ ткивата. Проектот има собрано различни примероци од ткиво (> 50 различни ткива) од повеќе од 700 дарители по смртта. Ова резултираки со собирање на >11.000 примероци. Проектот помогнал да биде разбрано споделувањето на ткивото и специфичноста на ткивото преку изразување со квантитативни особини на локуси.[26] Геномскиот ресурс бил развиен за „да го збогати нашето разбирање за тоа како разликите во нашата секвенца на ДНК придонесува за здравјето и болестите“.[27]

Поврзано[уреди | уреди извор]

 

Наводи[уреди | уреди извор]

  1. „On the immortality of television sets: "function" in the human genome according to the evolution-free gospel of ENCODE“. Genome Biology and Evolution. 5 (3): 578–90. 20 февруари 2013. doi:10.1093/gbe/evt028. PMC 3622293. PMID 23431001.
  2. Gibson G, Muse SV. A primer of genome science (3rd. изд.). Sunderland, MA: Sinauer Associates.
  3. Pevsner J (2009). Bioinformatics and functional genomics (2nd. изд.). Hoboken, NJ: Wiley-Blackwell. ISBN 9780470085851.
  4. „Calling Cards enable multiplexed identification of the genomic targets of DNA-binding proteins“. Genome Research. 21 (5): 748–55. мај 2011. doi:10.1101/gr.114850.110. PMC 3083092. PMID 21471402.
  5. „RNA-Seq methods for transcriptome analysis“. Wiley Interdisciplinary Reviews: RNA. 8 (1): e1364. јануари 2017. doi:10.1002/wrna.1364. PMC 5717752. PMID 27198714.
  6. „High-throughput functional testing of ENCODE segmentation predictions“. Genome Research. 24 (10): 1595–602. октомври 2014. doi:10.1101/gr.173518.114. PMC 4199366. PMID 25035418.
  7. „Massively parallel functional dissection of mammalian enhancers in vivo“. Nature Biotechnology. 30 (3): 265–70. February 2012. doi:10.1038/nbt.2136. PMC 3402344. PMID 22371081.CS1-одржување: display-автори (link)
  8. „Genome-wide quantitative enhancer activity maps identified by STARR-seq“. Science. 339 (6123): 1074–7. март 2013. Bibcode:2013Sci...339.1074A. doi:10.1126/science.1232542. PMID 23328393.
  9. „A novel genetic system to detect protein-protein interactions“. Nature. 340 (6230): 245–6. јули 1989. Bibcode:1989Natur.340..245F. doi:10.1038/340245a0. PMID 2547163.
  10. „Genome-wide CRISPR screens for Shiga toxins and ricin reveal Golgi proteins critical for glycosylation“. PLOS Biology. 16 (11). e2006951. 27 ноември 2018. doi:10.1371/journal.pbio.2006951. PMC 6258472. PMID 30481169.
  11. „High-Resolution CRISPR Screens Reveal Fitness Genes and Genotype-Specific Cancer Liabilities“. Cell. 163 (6): 1515–26. декември 2015. doi:10.1016/j.cell.2015.11.015. PMID 26627737.CS1-одржување: display-автори (link)
  12. „Genome-scale CRISPR-Cas9 knockout screening in human cells“. Science. 343 (6166): 84–87. јануари 2014. Bibcode:2014Sci...343...84S. doi:10.1126/science.1247005. PMC 4089965. PMID 24336571.CS1-одржување: display-автори (link)
  13. „Genome-Scale CRISPR-Mediated Control of Gene Repression and Activation“. Cell. 159 (3): 647–61. октомври 2014. doi:10.1016/j.cell.2014.09.029. PMC 4253859. PMID 25307932.CS1-одржување: display-автори (link)
  14. „Compact and highly active next-generation libraries for CRISPR-mediated gene repression and activation“. eLife. 5. септември 2016. doi:10.7554/eLife.19760. PMC 5094855. PMID 27661255.CS1-одржување: display-автори (link)
  15. Gasperini, Molly; Findlay, Gregory M.; McKenna, Aaron; Milbank, Jennifer H.; Lee, Choli; Zhang, Melissa D.; Cusanovich, Darren A.; Shendure, Jay (август 2017). „CRISPR/Cas9-Mediated Scanning for Regulatory Elements Required for HPRT1 Expression via Thousands of Large, Programmed Genomic Deletions“. The American Journal of Human Genetics. 101 (2): 192–205. doi:10.1016/j.ajhg.2017.06.010. PMC 5544381. PMID 28712454.
  16. „Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles“. Proceedings of the National Academy of Sciences of the United States of America. 102 (43): 15545–50. октомври 2005. Bibcode:2005PNAS..10215545S. doi:10.1073/pnas.0506580102. PMC 1239896. PMID 16199517.CS1-одржување: display-автори (link)
  17. „Ingenuity Systems“. Архивирано од изворникот на 1999-01-25. Посетено на 2007-12-31.
  18. „Ariadne Genomics: Pathway Studio“. Архивирано од изворникот на 2007-12-30. Посетено на 2007-12-31.
  19. „Protein complex-based analysis framework for high-throughput data sets“. Science Signaling. 6 (264): rs5. февруари 2013. doi:10.1126/scisignal.2003629. PMC 3756668. PMID 23443684.
  20. „phydms: software for phylogenetic analyses informed by deep mutational scanning“. PeerJ. 5: e3657. 2017. doi:10.7717/peerj.3657. PMC 5541924. PMID 28785526.
  21. „The genetic landscape of a physical interaction“. eLife. 7. април 2018. doi:10.7554/eLife.32472. PMC 5896888. PMID 29638215.
  22. Schmiedel, Jörn M.; Lehner, Ben (17 јуни 2019). „Determining protein structures using deep mutagenesis“. Nature Genetics. 51 (7): 1177–1186. doi:10.1038/s41588-019-0431-x. PMC 7610650 Проверете ја вредноста |pmc= (help). PMID 31209395.
  23. Rollins, Nathan J.; Brock, Kelly P.; Poelwijk, Frank J.; Stiffler, Michael A.; Gauthier, Nicholas P.; Sander, Chris; Marks, Debora S. (17 јуни 2019). „Inferring protein 3D structure from deep mutation scans“. Nature Genetics. 51 (7): 1170–1176. doi:10.1038/s41588-019-0432-9. PMC 7295002. PMID 31209393.
  24. „Enhanced regulatory sequence prediction using gapped k-mer features“. PLOS Computational Biology. 10 (7): e1003711. јули 2014. Bibcode:2014PLSCB..10E3711G. doi:10.1371/journal.pcbi.1003711. PMC 4102394. PMID 25033408.
  25. „Genome-wide prediction of cis-regulatory regions using supervised deep learning methods“. BMC Bioinformatics. 19 (1): 202. мај 2018. doi:10.1186/s12859-018-2187-1. PMC 5984344. PMID 29855387.
  26. GTEx Consortium; Laboratory, Data Analysis &Coordinating Center (Ldacc)—Analysis Working Group.; Statistical Methods groups—Analysis Working Group; Enhancing GTEx (eGTEx) groups; NIH Common Fund; NIH/NCI; NIH/NHGRI; NIH/NIMH; NIH/NIDA (12 октомври 2017). „Genetic effects on gene expression across human tissues“ (PDF). Nature. 550 (7675): 204–213. Bibcode:2017Natur.550..204A. doi:10.1038/nature24277. PMC 5776756. PMID 29022597.
  27. „GTEx Creates a Reference Data Set to Study Genetic Changes and Gene Expression“. National Institutes of Health : Office of Strategic Coordination - The Common Fund. 8 февруари 2018. Посетено на 2022-01-13.

Надворешни врски[уреди | уреди извор]