Фреквентен алелен спектар

Од Википедија — слободната енциклопедија

Во популационата генетика, фреквентниот алелен спектар, понекогаш наречен и спектар на фреквенција на локацијата, е дистрибуција на алелните фреквенции на даден сет на локуси (често SNP) во популација или примерок.[1][2][3][4] Бидејќи фреквентниот алелен спектар често е резиме на или споредуван со секвенционирани примероци од целата популација, тој е хистограм со големина во зависност од бројот на секвенционираните поединечни хромозоми. Секој запис во фреквенцискиот спектар го запишува вкупниот број на локуси со соодветната изведена алелска фреквенција. Се претпоставува дека местата кои придонесуваат за фреквенцискиот спектар независно се менуваат во фреквенцијата. Понатаму, се претпоставува дека локусите се биалелни (односно, со точно присутни два алели), иако постојат екстензии за мултиалелични фреквенциски спектри.[5]

Голем број збирни статистички податоци за набљудуваните генетски варијации се самите резимеа на спектарот на фреквенција на алелите, вклучувајќи ги и проценките на како што е Вотерсон и на Таџима , D на Таџима, H на Феј и Ву и индексот на фиксација.[6]

Пример[уреди | уреди извор]

Спектарот на фреквенцијата на алелот од примерок од хромозомите се пресметува со броење на бројот на места со изведени алелски фреквенции . На пример, разгледајте го примерокот од индивидуи со осум набљудувани променливи локации. Во оваа табела, 1 покажува дека изведениот алел е забележан на тоа место, а 0 покажува дека алелот на предците бил забележан.

СНП 1 СНП 2 СНП 3 СНП 4 СНП 5 СНП 6 СНП 7 СНП 8
Примерок 1 0 1 0 0 0 0 1 0
Примерок 2 1 0 1 0 0 0 1 0
Примерок 3 0 1 1 0 0 1 0 0
Примерок 4 0 0 0 0 1 0 1 1
Примерок 5 0 0 1 0 0 0 1 0
Примерок 6 0 0 0 1 0 1 1 0
Вкупно 1 2 3 1 1 2 5 1

Фреквентниот алелен спектар може да се запише како вектор , каде е бројот на набљудуваниот места со изведена алелска фреквенција . Во овој пример, набљудуваниот фреквентен алелен спектар е , поради четирите примери на еден набљудуван изведен алел на одредени локуси на SNP, двата примери на два изведени алели итн.

Пресметка[уреди | уреди извор]

Очекуваниот фреквентен алелен спектар може да се пресмета преку коалесцентен или дифузен пристап.[7][8] Демографската историја на популацијата и природната селекција влијаат на динамиката на алелната фреквенција и овие ефекти се рефлектираат во обликот на спектарот на фреквенцијата на алелите. При едноставен случај на сегрегирање на селективни неутрални алели во популација која има достигнато демографска рамнотежа (односно, без неодамнешни промени во големината на популацијата или проток на гени), очекуваниот фреквентен алелен спектар за примерок од големина е дадена од

каде е стапката на мутација на населението. Отстапувања од демографска рамнотежа или неутралност го променуваат обликот на очекуваниот фреквентен спектар.

Пресметувањето на фреквентниот спектар од податоците за набљудуваната секвенца бара да може да се разликуваат предците и изведените (мутантни) алели, често преку споредување со низа од надвор од групата. На пример, во генетските студии на човечката популација, хомологната референтна секвенца на шимпанзото обично се користи за да се процени алелот на предците. Сепак, понекогаш алелот на предците не може да се одреди, при таков случај, наместо тоа, може да се пресмета фреквентниот спектар на преклопениот алел. Преклопениот фреквентен спектар ги складира набљудуваните броеви на малите (најретките) алелски фреквенции. Преклопениот спектар може да се пресмета со поврзување на тиот и тите записи од расклопениот спектар, каде е бројот на земени поединци.

Мулти-популационен фреквентен алелен спектар[уреди | уреди извор]

Фреквентниот спектар на заеднички алел (JAFS) е заедничка дистрибуција на алелските фреквенции низ две или повеќе сродни популации. JAFS за популации, со земени примероци од хромозоми во тата популација, е -димензионален хистограм, каде секој запис го складира вкупниот број на сегрегирани места во кои изведениот алел е набљудуван со соодветната фреквенција кај секоја популација. Секоја оска на хистограмот одговара на популација, а индексите се движат од за та популација.[9][10]

Пример[уреди | уреди извор]

Да претпоставиме дека секвенционираме диплоидни поединци од две популации, 4 единки од популацијата 1 и 2 единки од популацијата 2. JAFS би бил матрица, индексирана од нула. Влезот го евидентира бројот на набљудуваните полиморфни локуси со изведена алелска фреквенција 3 во популацијата 1 и фреквенција 2 во популацијата 2. На влезот се запишани оние локуси со набљудувана фреквенција 1 кај популацијата 1 и фреквенција 0 кај популацијата 2. На влезот се запишани тие локуси со изведениот алел фиксиран во популацијата 1 (видена во сите хромозоми) и со фреквенција 3 во популацијата 2.

Апликации[уреди | уреди извор]

Обликот на фреквентниот алелен спектар е чувствителен на демографијата, како што се промените во големината на популацијата, миграцијата и подструктурата, како и природната селекција. Со споредување на набљудуваните податоци сумирани во фреквентниот спектар со очекуваниот фреквентен спектар пресметан според даден демографски и селекторски модел, може да се процени колку добро се вклопува тој модел со податоците и да се користи теоријата на веројатност за да се проценат најдобро одговараат параметрите на модел.

На пример, да претпоставиме дека населението доживеало неодамнешен период на експоненцијален раст со што се добил број на примероци од популацијата на крајот на растот и набљудуваниот (податок) алел фреквентен спектар бил пресметан со користење на наводна неутрална варијација. Демографскиот модел би имал параметри за експоненцијалната стапка на раст , времето за кои настана растот и референтна големина на населението , со претпоставка дека населението било во рамнотежа кога започнал растот. Очекуваниот фреквентен спектар за дадено множество параметри може да се добие со користење или на теоријата на дифузија или коалесцентната теорија, и може да се спореди со фреквентниот спектар на податоци. Параметрите што најдобро се вклопуваат може да се најдат со користење на максимална веројатност.

Овој пристап се користи за да се заклучат демографски модели и модели на селекција за многу видови, вклучувајќи ги и луѓето. На пример, Март и сор. (2004) ги користеле фреквентните спектри на алел на поединечна популација за група Африканци, Европејци и Азијци за да покажат дека тесните грла на населението се случиле во азиската и европската демографска историја, но не и кај Африканците.[11] Во поново време, Гутенкунст и сор. (2009) го користеле заедничкиот алелски спектар на фреквенција за истите три популации за да ги заклучат времето во кое популациите се разминувале и количината на последователна тековна миграција меѓу нив (види хипотеза надвор од Африка).[10] Дополнително, овие методи може да се користат за да се проценат моделите на селекција од податоците за алелната фреквенција. На пример, Бојко и сор. (2008) ја заклучиле дистрибуцијата на фитнес ефекти за новонастанатите мутации користејќи податоци за човечки полиморфизам кои ги контролирале ефектите од нерамнотежна демографија.[12]

Наводи[уреди | уреди извор]

  1. Fisher, Ronald A. (1930). „The distribution of gene ratios for rare mutations“. Proceedings of the Royal Society of Edinburgh. 50: 205–220.
  2. Wright, Sewall (1938). „The distribution of gene frequencies under irreversible mutation“. Proc. Natl. Acad. Sci. USA. 24 (7): 253–259. Bibcode:1938PNAS...24..253W. doi:10.1073/pnas.24.7.253. PMC 1077089. PMID 16577841.
  3. Kimura, Motoo (1964). „Diffusion models in population genetics“. J. Appl. Probab. 1 (2): 177–232. doi:10.2307/3211856. JSTOR 3211856.
  4. Evans, Steven N.; Shvets, Yelena; Slatkin, Montgomery (2007). „Non-equilibrium theory of the allele frequency spectrum“. Theoretical Population Biology. 71 (1): 109–119. arXiv:q-bio/0604010. doi:10.1016/j.tpb.2006.06.005. PMID 16887160.
  5. Jenkins, Paul A.; Mueller, Jonas W.; Song, Yun S. (2014). „General triallelic frequency spectrum under demographic models with variable population size“. Genetics. 196 (1): 295–311. arXiv:1310.3444. doi:10.1534/genetics.113.158584. PMC 3872192. PMID 24214345.
  6. Durrett, Rick (2008). Probability Models for DNA Sequence Evolution (PDF) (2. изд.).
  7. Wakeley, John (22 April 2016). Coalescent Theory: An Introduction. Roberts & Company Publishers. ISBN 978-0974707754.
  8. Crow, James F.; Kimura, Motoo (1970). An introduction to population genetics theory ([Reprint]. изд.). New Jersey: Blackburn Press. ISBN 9781932846126.
  9. Chen, H.; Green, R. E.; Paabo, S.; Slatkin, M. (29 July 2007). „The Joint Allele-Frequency Spectrum in Closely Related Species“. Genetics. 177 (1): 387–398. doi:10.1534/genetics.107.070730. PMC 2013700. PMID 17603120.
  10. 10,0 10,1 Gutenkunst, Ryan N.; Hernandez, Ryan D.; Williamson, Scott H.; Bustamante, Carlos D. (23 October 2009). „Inferring the Joint Demographic History of Multiple Populations from Multidimensional SNP Frequency Data“. PLOS Genetics. 5 (10): e1000695. arXiv:0909.0925. doi:10.1371/journal.pgen.1000695. PMC 2760211. PMID 19851460.
  11. Marth, Gabor T.; Czabarka, Eva; Murvai, Janos; Sherry, Stephen T. (1 January 2004). „The Allele Frequency Spectrum in Genome-Wide Human Variation Data Reveals Signals of Differential Demographic History in Three Large World Populations“. Genetics. 166 (1): 351–372. doi:10.1534/genetics.166.1.351. PMC 1470693. PMID 15020430.
  12. Boyko, Adam R.; Williamson, Scott H.; Indap, Amit R.; Degenhardt, Jeremiah D.; Hernandez, Ryan D.; Lohmueller, Kirk E.; Adams, Mark D.; Schmidt, Steffen; Sninsky, John J. (30 May 2008). „Assessing the Evolutionary Impact of Amino Acid Mutations in the Human Genome“. PLOS Genetics. 4 (5): e1000083. doi:10.1371/journal.pgen.1000083. PMC 2377339. PMID 18516229.