Биоинформатика

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето
Мапа на човековиот X хромозом (од Националниот центар за биотехнолошки информации - National Center for Biotechnology Information).

Биоинформатиката е интердисциплинарна научна област која се занимава со развивање на методи и софтверски алатки за обработка на биолошките податоци. Како интердисциплинарна научна област, таа ги обединува биологијата, информатиката, информатичкиот инженеринг, математиката и статистиката за анализа и толкување на биолошките податоци. Биоинформатиката се користи за in silico анализи на биолошки проблеми со употреба на математички и статистички техники.

Биоинформатиката е сеопфатен термин за сите биолошки истражувања кои користат компјутерско програмирање како дел од нивната методологија, а, исто така, претставува и синоним за одредени анализи кои постојано се користат, особено во областа на геномиката. Типични примери за примена на биоинформатиката се идентификацијата на гени и еднонуклеотидни полиморфизми (анг. single nucleotide polymorphisms, SNPs). Често, оваа идентификација се користи со цел подобро да се разбере генетската основа на одредена болест, уникатни адаптации, посакувани особини (посебно кај земјоделските видови) или разлики меѓу популациите. На помалку формален начин, биоинформатиката, исто така, се обидува да ги разбере организациските принципи во секвенците на нуклеинските киселини и белковините (протеините).[1]

Вовед[уреди | уреди извор]

Биоинформатиката стана важен дел во многу области од биологијата. Во експерименталната молекуларна биологија, биоинформатичките техники, како што се процесирањето на слики и сигнали, овозможуваат екстракција на корисни резултати од големи количества на необработени податоци. Во областа на генетиката и геномиката, таа помага во секвенционирањето и анотацијата на геномите и нивните мутации. Таа игра улога во аналитиката на текстот на биолошката литература и развојот на биолошки и генетски онтологии за организација и пребарување на биолошки податоци. Таа, исто така, игра улога во анализата на генската експресија и регулација. Биоинформатичките алатки помагаат во споредбата на генетските и геномските податоци и во разбирањето на еволутивните аспекти на молекуларната биологија. На поинтегративно ниво, таа помага во анализата и категоризацијата на биолошки патишта и мрежи кои се важен дел од системската биологија. Во структурната биологија, таа помага во симулацијата и моделирањето на ДНК,[2] РНК,[2][3] протеините,[4] како и на биомолекуларните интеракции.[5][6][7][8]

Историја[уреди | уреди извор]

Историски гледано, терминот биоинформатика не го имал истото значење кое го има денес. Полина Хогевег и Бен Хеспер го измислиле овој термин во 1970 година за да го именуваат проучувањето на информациските процеси во биолошките системи.[9][10][11] Оваа дефиниција ја сместила биоинформатиката како научно поле паралелно со биохемијата (проучувањето на хемиските процеси во биолошките системи).[9]

Секвенци[уреди | уреди извор]

Секвенците на генетскиот материјал често се користат во биоинформатиката и полесно се обработуваат компјутерски отколку мануелно.

По одредувањето на аминокиселинската секвенца на инсулинот во раните 1950-ти години, од страна на Фредерик Сангер, употребата на компјутерите во молекуларната биологија станала од суштинско значење. Мануелното споредување на повеќе секвенци се покажало многу непрактично. Пионер во областа на биоинформатиката била американскиот физички хемичар Маргарет Оукли Дејхоф.[12] Таа ја изградила една од првите бази на податоци за протеински секвенци, првично објавена во форма на книги.[13] Маргарет Оукли Дејхоф ги вовела и методите за порамнување на секвенците, кои се од клучно значење во молекуларната еволуција.[14] Друг кој дал голем придонес во полето на биоинформатиката бил Елвин А. Кебат, кој во 1970 година бил пионер во анализата на биолошките секвенци.[15]

Цели[уреди | уреди извор]

Полето на биоинформатиката еволуирало како резултат на потребата од анализа и интерпретација на растечкиот број на биолошки податоци. Биолошките податоци ги вклучуваат нуклеотидните и аминокиселинските секвенци, белковинските домени, белковинските структури и структурите на нуклеинските киселини.[16] Самиот процес на анализа и интерпретација на податоците се нарекува сметачка биологија. Важни поддисциплини во рамките на биоинформатиката и сметачката биологија се:

  • Развојот и имплементацијата на компјутерски програми кои овозможуваат ефикасен пристап до, употреба и управување со различни типови на информации
  • Развој на нови алгоритми (математички формули) и статистички методи кои ги проценуваат односите помеѓу членовите на големи групи од податоци. На пример, постојат методи за лоцирање на ген во рамките на одредена секвенца, методи за одредување на протеинска структура и/или функција и методи за класификација на протеинските секвенци во сродни фамилии.

Примарната цел на биоинформатиката е зголемување на нашето разбирање за биолошките процеси. Она што ја одделува од другите биолошки дисциплини е фокусот кон развивањето и примената на компјутерските техники за постигнување на оваа цел. Примери вклучуваат: препознавање на обрасци, податочно рударење, алгоритми за машинско учење и визуелизација. Главни истражувачки напори во биоинформатиката се: порамнување на секвенци, предвидување на гени, асемблирање на секвенци, дизајнирање на лекови, откривање на лекови, порамнување на белковински структури,предвидување на структурата на белковините, предвидување на генската експресија, протеин-протеин интеракции, проучување на геномските асоцијации, моделирање на еволуцијата и клеточната делба.

Биоинформатиката го вклучува создавањето и усовршувањето на базите на податоци, алгоритмите, сметачките и статистичките техники за решавање на формалните и практичните проблеми кои произлегуваат од управувањето и анализата на биолошките податоци.

Во текот на изминатите неколку децении, брзиот развој во полето на геномиката и другите молекуларни технологии и паралелниот развој на информатичките технологии доведе до експлозија на нови податоци од полето на молекуларната биологија. Биоинформатиката всушност ги опфаќа сите математички и компјутерски пристапи кои служат за систематизација, анализа и интерпретација на сите овие нови биолошки податоци.

Чести активности во биоинформатиката се мапирањето и анализата на нуклеинските и белковинските секвенци, порамнувањето на ДНК и белковинските секвенци да се изврши споредба, како и создавањето и прикажувањето на тродимензионални модели на белковински структури.

Однос со другите научни полиња[уреди | уреди извор]

Биоинформатиката е научна област која е слична, но одделна од биолошкото сметање, додека често се смета синонимна со сметачката биологија. Биолошкото сметање користи биоинженеринг и биологија за изградба на биолошки компјутери, додека биоинформатиката користи пресметки за подобро разбирање на биолошките процеси. Биоинформатиката и сметачката биологија вклучуваат анализа на биолошки податоци, посебно на ДНК, РНК и протеински секвенци. Областа на биоинформатиката доживеала експлозивен раст од средината на 1990-тите години, во голема мера поради Проектот за човечкиот геном и поради брзиот напредок во технологијата за ДНК секвенционирање.

Анализата на биолошките податоци за добивање на разбирливи информации вклучува пишување и работа со софтверски програми кои користат алгоритми од теоријата на графови, вештачка интелигенција, софт компјутинг, податочно рударење, процесирање на слики и компјутерска симулација. Овие алгоритми зависат од теоретски основи како што се дискретна математика, теорија на контрола, теорија на систем, теорија на информации и статистика.

Анализа на секвенци[уреди | уреди извор]

Секвенците на различни гени или протеини можат да бидат порамнети за да се испита нивната сличност.

По секвенционирањето на геномот на бактериофагот Phi X 174 во 1977 година,[17] биле секвенционирани геномите на илјадници други организми. Информацијата добиена од секвенците се анализира за да се откријат гените кои кодираат за протеини, РНК гени, регулаторни секвенци, структурни мотиви и репетитивни секвенци. Споредбата на гените во рамките на еден вид или помеѓу различни видови може да укаже на сличности помеѓу функциите на протеините, или сродствените односи помеѓу видовите (употреба на молекуларна систематика за изградба на филогенетски дрва). Со зголемувањето на количеството на новодобиените податоци, стана се повеќе непрактично мануелно да се анализираат ДНК секвенците. Во денешно време, сметачките програми, како BLAST, секојдневно се користат за да се пребаруваат секвенците на повеќе од 260 000 организми, кои содржат над 190 милијарди нуклеотиди.[18] Овие програми можат да компензираат за мутации (сменети, избришани или вметнати бази) во ДНК секвенцата, а можат и да идентификуваат сродни секвенци. Една варијанта на порамнувањето на секвенците се користи и во самиот процес на секвенционирање.

Секвенционирање на ДНК[уреди | уреди извор]

Пред да може секвенците да се анализираат, тие треба да се добијат. Секвенционирањето на ДНК сѐ уште не е тривијален проблем бидејќи необработените податоци може да бидат бучни или да даваат слаби сигнали. Развиени се алгоритми за „повикување на бази“ за различните експериментални пристапи кон секвенционирањето на ДНК.

Асемблирање на секвенци[уреди | уреди извор]

Повеќето техники за секвенционирање на ДНК продуцираат кратки фрагменти од секвенцата кои треба да бидат асемблирани (собрани) за да се добие комплетен ген или геном. Таканаречената техника на шотган секвенционирање (анг. Shotgun sequencing) генерира секвенци на илјадници мали ДНК фрагменти (чија должина се движи од 35 до 900 нуклеотиди, зависно од технологијата за секвенционирање). Краевите на овие фрагменти се преклопуваат и, кога се правилно подредени од страна на програма за асемблирање на геноми, можат да се користат за реконструкција на целиот геном. Шотган секвенционирањето е релативно брзо, но за големите геноми асемблирањето на фрагментите може да биде доста комплицирано. За големи геноми, како човечкиот, потребни се мултипроцесорни компјутери, а процесот може да потрае и денови на CPU време на голема меморија, а резултат сепак содржи бројни празнини кои потоа мора да бидат пополнети. Денес, шотган секвенционирањето е методот од избор за речиси сите геноми, а алгоритмите за асемблирање на геномот се критична област на истражување во биоинформатиката.

Анотација на геноми[уреди | уреди извор]

Во геномиката, анотацијата е процес на одбележување на гените и другите биолошки карактеристики во ДНК секвенцата. Овој процес треба да биде автоматизиран, бидејќи повеќето геноми се премногу големи за да бидат рачно анотирани. Анотацијата е возможна бидејќи гените имаат препознатливи старт и стоп региони, иако точната секвенца на овие региони може да варира помеѓу гените.

Првиот опис на систем за анотација на геноми бил објавен во 1995 година[19] од страна на тим при Институтот за истражување на геноми во САД, кои први извршиле комплетно секвенционирање и анализа на геномот на бактеријата Haemophilus influenzae.[19] Овен Вајт дизајнирал и изградил софтверски систем за идентификација на гените кои кодираат протеини, транспортни РНК молекули, рибозомни РНК молекули и за првични функционални назначувања. Повеќето денешни системи за анотација на геноми функционираат на сличен начин, но програмите за анализа на геномската ДНК постојано се менуваат и подобруваат.

Сметачка еволутивна биологија[уреди | уреди извор]

Еволутивна биологија е наука за потеклото на видовите, како и нивната промена со текот на времето. Информатиката се покажала како корисно средство за биолозите кои ја изучуваат еволуцијата, бидејќи им овозможила да:

  • ја следат еволуцијата на голем број на организми со мерење на промени во нивната ДНК,
  • споредуваат цели геноми, што го овозможува проучувањето на покомплексни еволутивни настани, како што се генска дупликација, хоризонтален пренос на гени и предвидувањето на факторите кои се важни во бактериската видообразба,
  • изградат комплексни компјутерски модели на популациона генетика за да се предвиди исходот на системот со текот на времето,[20]
  • следат и споделуваат информации за голем број на видови на организми.

Компаративна геномика[уреди | уреди извор]

Сржта на компаративна анализа на геноми е воспоставување на врска помеѓу гени (анализа на ортологија) или други геномски карактеристики кај различни организми. Токму овие интергеномски мапи овозможуваат да се откријат еволутивните процеси одговорни за дивергенција на два генома. Комплексноста на еволуцијата на геномот претставува голем предизвик за развивачите на математички модели и алгоритми, кои имаат на располагање цел спектар на алгоритамски, статистички и математички техники, кои варираат од егзактни, хевристични, алгоритми со фиксни параметри и апроксимациони алгоритми за проблеми кои се базираат на модели на парсимонија, до MCMC (анг. Markov chain Monte Carlo) алгоритми за Бајесова анализа на проблеми базирани на пробабилистички модели.

Многу од овие студии се базирани на детекцијата на секвенциска хомологност за класификација на секвенците во белковински фамилии.[21]

Пан геномика[уреди | уреди извор]

Пан геномика е концепт кој бил воведен во 2005 година од страна на Тетелин и Медини и оттогаш се изучува во биоинформатиката. Пан геном е целосниот генски репертоар на одредена таксономска група: иако првично се применувал за блиску сродни видови, може да се примени и за родови, колена итн. Поделен е на - јадрен геном: збир на гени кои се заеднички за сите проучувани геноми (најчесто гени од витално значење за опстанокот) и флексибилен геном: збир на гени кои не се присутни во сите проучувани геноми. Биоинформатичката алатка BPGA може да се користи за да се карактеризира пан геномот на бактериски видови.[22]

Експресија на гени и белковини[уреди | уреди извор]

Анализа на генска експресија[уреди | уреди извор]

Експресијата на многу гени може да се утврди со мерења на нивоата на иРНК со повеќе техники, вклучувајќи ДНК микрочипови, EST (од анг. expressed sequence tag) секвенционирање, SAGE (од анг. Serial analysis of gene expression) секвенционирање, MPSS (од анг. Massively parallel signature sequencing), RNA-Seq, позната и како WTSS (од анг. whole transcriptome shotgun sequencing), или со различни апликации на in situ хибридизација. Сите овие техники се многу склони на бучава и/или подлежат на пристрасност во биолошкото мерење, па затоа голема истражувачка област во сметачката биологија вклучува развој на статистички алатки за одделување на сигналите од бучавата во студиите за експресија на гени.[23]

Анализа на белковинска експресија[уреди | уреди извор]

Белковинските микрочипови и HT (анг. high throughput) масената спектрометрија (MS) може да дадат информации за белковините присутни во даден биолошки примерок. Во биоинформатиката се проучуваат податоците кои се добиваат со овие методи. Локализацијата на белковини во ткиво може да се изведе со помош на афинитетна протеомика прикажана како просторни податоци врз основа на имунохистохемија и ткивни микрочипови.[24]

Анализа на регулација[уреди | уреди извор]

Регулацијата е комплексна оркестрација на настани со кои даден сигнал, обично екстрацелуларен хормон, на крајот води кон зголемување или намалување на активноста на еден или повеќе протеини. За изучување на различни чекори од овој процес се користат голем број на биоинформатички методи.

Анализа на клеточна организација[уреди | уреди извор]

Неколку пристапи се развиени за да се анализира локацијата на органелите, гените, протеините и други компоненти на клетките. Ова е битно бидејќи локацијата на овие компоненти влијае на процесите во клетката и на тој начин помага во предвидувањето на однесувањето на биолошките системи.

Структурна биоинформатика[уреди | уреди извор]

Тродимензионалните белковински структури, како оваа, се чест предмет на биоинформатички анализи.

Многу значајна област во биоинформатиката е предвидувањето на структурата на белковините. Аминокиселинската секвенца на даден протеин, т.н. примарна структура, лесно може да се утврди од секвенцата на генот кој го кодира тој протеин. Во поголемиот број на случаи, примарната структура на протеинот ја одредува неговата нативна тродимензионална структура. Познавањето на оваа структура е од суштинско значење за разбирањето на функцијата на протеинот. Структурните информации за еден протеин обично се класифицираат како информации за неговата секундарна, терциерна и квартерна структура.

Една од клучните идеи во биоинформатиката е идејата за хомологија. Во геномската гранка на биоинформатиката, хомологијата се користи за да се предвиди функцијата на даден ген: ако секвенцата на генот А, чија функција е позната, е хомологна на секвенцата на генот Б, чија функција е непозната, може да се заклучи дека Б има иста функција со А. Во структурната гранка на биоинформатиката, хомологијата се користи за да се утврди кои делови од протеинот се важни за формирање на структурата и интеракцијата со други протеини. Во техниката која се нарекува хомологно моделирање, овие информации се користат за да се предвиди структурата на одреден протеин доколку е позната структурата на негов хомологен протеин. Во моментов оваа техника останува единствениот начин за точно предвидување на протеинските структури.

Други техники за предвидување на структурата на протеините вклучуваат protein threading и de novo (од нула) физичко моделирање.

Мрежна и системска биологија[уреди | уреди извор]

Интеракциите помеѓу протеините често се визуелизираат и анализираат со употреба на мрежи.

Мрежната анализа се обидува да ги разбере односите во рамките на биолошките мрежи. Иако биолошките мрежи може да се конструираат од еден молекул или ентитет (како што се гени), мрежната биологија честопати се обидува да интегрира многу различни типови на податоци, како што се протеини, мали молекули, податоци за експресија на гени, итн., кои се поврзани физички, функционално, или и двете.

Системската биологија подразбира употреба на компјутерски симулации на клеточните подсистеми (како што се мрежите на метаболити и ензими кои го чинат метаболизмот, патеки за пренос на сигнали и генетски регулаторни мрежи) за да ги анализираат и визуелизираат сложените врски на овие клеточни процеси.

Други полиња на истражување[уреди | уреди извор]

Други полиња на истражување на биоинформатиката вклучуваат: анализа на литература, анализа на слики, анализа на податоци за поединечни клетки, информатика на биодиверзитет и интеграција на онтологии и податоци.

Бази на податоци[уреди | уреди извор]

Базите на податоци се од суштинско значење за истражувањата и апликациите на биоинформатиката. Постојат повеќе бази на податоци, кои покриваат различни типови на информации: на пример, ДНК и протеински секвенци, молекуларни структури, фенотипови и биодиверзитет. Базите на податоци можат да содржат емпириски податоци (добиени директно од експерименти), предвидени податоци (добиени од анализи) или, најчесто, и двете. Тие можат да бидат специфични за одреден организам, метаболички пат или молекула од интерес. Алтернативно, тие можат да инкорпорираат податоци собрани од повеќе други бази на податоци. Овие бази на податоци се разликуваат во нивниот формат, механизмот за пристап и дали се јавни или не.

Некои од најчесто користените бази на податоци се наведени подолу.

  • За употреба во анализа на биолошки секвенци: Genbank, UniProt
  • За употреба во структурна анализа: Protein Data Bank (PDB)
  • За употреба во пронаоѓање на белковински фамилии и мотиви: InterPro, Pfam
  • За употреба во следната генерација на секвенционирање: Sequence Read Archive
  • За употреба во мрежна анализа: Metabolic Pathway Databases (KEGG, BioCyc), Interaction Analysis Databases, Functional Networks
  • За употреба во дизајнот на синтетички генетски кола: GenoCAD

Софтвер и алатки[уреди | уреди извор]

Софтверските алатки за биоинформатиката се движат од едноставни алатки на командната линија, до посложени графички програми и самостојни веб-услуги достапни од различни биоинформатички компании или јавни институции.

Софтвер за биоинформатика со отворен код[уреди | уреди извор]

Многу бесплатни и со отворен код софтверски алатки за биоинформатика постоеле уште од 1980-тите години и нивниот број постојано расте.[25] Комбинацијата на континуирана потреба за нови алгоритми за анализа на новите видови биолошки отчитувања, потенцијалот за иновативни in silico експерименти и слободно достапните бази со отворен код помогнаа да се создадат можности за сите истражувачки групи да придонесат и за биоинформатиката и за опсегот на достапен софтвер со отворен код, без оглед на начинот на финансирање. Алатките со отворен код честопати делуваат како инкубатори на идеи, или приклучоци (plug-in) поддржувани од заедницата во комерцијални апликации. Тие, исто така, можат да обезбедат de facto стандарди и заеднички предметни модели за да помогнат во предизвикот на интеграцијата на биоинформациите.

Софтверски пакети со отворен код вклучуваат наслови како што се: Bioconductor, BioPerl, Biopython, BioJava, BioJS, BioRuby, Bioclipse, EMBOSS, .NET Bio, Orange (софтвер) со биоинформатичките add-on, Apache Taverna, UGENE и GenoCAD. За одржување на оваа традиција и да се создадат понатамошни можности, непрофитната Open Bioinformatics Foundation[25] ги имаат поддржано годишните BOSC (Bioinformatics Open Source Conference) од 2000 година.[26]

Поврзано[уреди | уреди извор]

Наводи[уреди | уреди извор]

  1. Lesk, A. M. (26 July 2013). "Bioinformatics". Encyclopaedia Britannica. конс. 17 April 2017. 
  2. 2,0 2,1 Sim, A. Y. L.; Minary, P.; Levitt, M.. Modeling nucleic acids. „Current Opinion in Structural Biology“ том  22 (3): 273–278. doi:10.1016/j.sbi.2012.03.012. PMID 22538125. 
  3. Dawson, W. K.; Maciejczyk, M.; Jankowska, E. J.; Bujnicki, J. M.. Coarse-grained modeling of RNA 3D structure. „Methods“ том  103: 138–156. doi:10.1016/j.ymeth.2016.04.026. PMID 27125734. http://www.sciencedirect.com/science/article/pii/S1046202316301050/pdfft?md5=b2566cbf5ce642bc348186e0b732f15e&pid=1-s2.0-S1046202316301050-main.pdf. 
  4. Kmiecik, S.; Gront, D.; Kolinski, M.; Wieteska, L.; Dawid, A. E.; Kolinski, A.. Coarse-Grained Protein Models and Their Applications. „Chemical Reviews“ том  116 (14): 7898–936. doi:10.1021/acs.chemrev.6b00163. PMID 27333362. 
  5. Wong, K. C. (2016). Computational Biology and Bioinformatics: Gene Regulation. CRC Press/Taylor & Francis Group. ISBN 9781498724975. 
  6. Joyce, A. P.; Zhang, C.; Bradley, P.; Havranek, J. J.. Structure-based modeling of protein: DNA specificity. „Briefings in Functional Genomics“ том  14 (1): 39–49. doi:10.1093/bfgp/elu044. PMID 25414269. 
  7. Spiga, E.; Degiacomi, M. T.; Dal Peraro, M. (2014). „New Strategies for Integrative Dynamic Modeling of Macromolecular Assembly“. Karabencheva-Christova, T.. Biomolecular Modelling and Simulations. Advances in Protein Chemistry and Structural Biology. 96. Academic Press. стр. 77–111. doi:10.1016/bs.apcsb.2014.06.008. ISBN 9780128000137. 
  8. Ciemny, Maciej; Kurcinski, Mateusz; Kamel, Karol; Kolinski, Andrzej; Alam, Nawsad; Schueler-Furman, Ora; Kmiecik, Sebastian (4 мај 2018 г). Protein–peptide docking: opportunities and challenges (на en). „Drug Discovery Today“ том  23 (8): 1530–1537. doi:10.1016/j.drudis.2018.05.006. ISSN 1359-6446. PMID 29733895. https://www.sciencedirect.com/science/article/pii/S1359644617305937. 
  9. 9,0 9,1 Hogeweg P. Searls, David B.. уред. The Roots of Bioinformatics in Theoretical Biology. „PLoS Computational Biology“ том  7 (3): e1002021. doi:10.1371/journal.pcbi.1002021. PMID 21483479. Bibcode2011PLSCB...7E2021H. 
  10. Bioinformatica: een werkconcept. 1. Kameleon. ст. 28–29. 
  11. Hogeweg P. Simulating the growth of cellular forms. „Simulation“ том  31 (3): 90–96. doi:10.1177/003754977803100305. 
  12. Moody, Glyn (2004). Digital Code of Life: How Bioinformatics is Revolutionizing Science, Medicine, and Business. ISBN 978-0-471-32788-2. 
  13. Dayhoff, М. К. (1966) Атлас на протеини редослед и структура. Националната Биомедицински Истражувања Фондацијата, 215 pp.
  14. Evolution of the structure of ferredoxin based on living relics of primitive amino Acid sequences. „Science“ том  152 (3720): 363–6. doi:10.1126/science.152.3720.363. PMID 17775169. Bibcode1966Sci...152..363E. 
  15. Kabat Database and its applications: 30 years after the first variability plot. „Nucleic Acids Res“ том  28 (1): 214–218. јануари 2000 г. doi:10.1093/nar/28.1.214. PMID 10592229. 
  16. "Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective". Bioinformatics – Trends and Methodologies. InTech. 2011. конс. 8 Jan 2012. 
  17. Nucleotide sequence of bacteriophage phi X174 DNA. „Nature“ том  265 (5596): 687–95. февруари 1977 г. doi:10.1038/265687a0. PMID 870828. Bibcode1977Natur.265..687S. 
  18. GenBank. „Nucleic Acids Res.“ том  36 (Database issue): D25–30. јануари 2008 г. doi:10.1093/nar/gkm929. PMID 18073190. 
  19. 19,0 19,1 Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. „Science“ том  269 (5223): 496–512. јули 1995 г. doi:10.1126/science.7542800. PMID 7542800. Bibcode1995Sci...269..496F. 
  20. Carvajal-Rodríguez A. Simulation of Genes and Genomes Forward in Time. „Current Genomics“ том  11 (1): 58–61. doi:10.2174/138920210790218007. PMID 20808525. 
  21. Carter, N. P.; Fiegler, H.; Piper, J. (2002 г). Comparative analysis of comparative genomic hybridization microarray technologies: Report of a workshop sponsored by the Wellcome trust. „Cytometry, Part A“ том  49 (2): 43–8. doi:10.1002/cyto.10153. PMID 12357458. 
  22. Chaudhari Narendrakumar M., Kumar Gupta Vinod, Dutta Chitra. BPGA-an ultra-fast pan-genome analysis pipeline. „Scientific Reports“ том  6: 24373. doi:10.1038/srep24373. PMID 27071527. Bibcode2016NatSR...624373C. 
  23. Grau, J.; Ben-Gal, I.; Posch, S.; Grosse, I. (1 јули 2006 г). VOMBAT: prediction of transcription factor binding sites using variable order Bayesian trees. „Nucleic Acids Research“ том  34 (Web Server): W529–W533. doi:10.1093/nar/gkl212. PMID 16845064. PMC: 1538886. http://www.eng.tau.ac.il/~bengal/VOMBAT.pdf. 
  24. "The Human Protein Atlas". www.proteinatlas.org. конс. 2017-10-02. 
  25. 25,0 25,1 "Open Bioinformatics Foundation: About us". Official website. Open Bioinformatics Foundation. конс. 10 May 2011. 
  26. "Open Bioinformatics Foundation: BOSC". Official website. Open Bioinformatics Foundation. конс. 10 May 2011. 

Литература[уреди | уреди извор]

Надворешни врски[уреди | уреди извор]