群體遺傳學是研究群體的遺傳結構及其變化規(guī)律的學科,試圖了解等位基因和基因型的頻率如何以及為什么會隨著時間的推移在群體內和群體之間發(fā)生變化。其研究對象是生物群體,這里的群體是指孟德爾氏群體。它是由同一物種組成的較大的有性繁殖群體。群體內的個體間是隨機交配的,遵循孟德爾遺傳規(guī)律。醫(yī)學研究群體遺傳是要探討遺傳病的發(fā)病頻率、遺傳方式及其基因頻率和變化的規(guī)律,從而了解遺傳病在群體中的發(fā)生和散布的規(guī)律,為預防、監(jiān)測和治療遺傳病提供重要的信息和措施。它是生物學的一個分支,對進化變化是如何發(fā)生的提供了深刻和清晰的理解。如今,在不斷尋求了解復雜疾病易感性的遺傳變異基礎的過程中,群體遺傳學顯得尤為重要。許多影響連鎖基因的等位基因頻率和等位基因之間關聯的因素首次在果蠅和其他模式生物中得到了表征,但同樣的原理幾乎適用于所有的生物。高通量測序技術已使獲取幾乎所有生物的大規(guī)模遺傳數據集成為可能,從而需要用于處理這些數據的計算工具和功能集。雖然通常會很好地描述用于將原始數據處理為SNP的生物信息學工作流程,但分析和解釋所得SNP數據集的路徑可能不太清楚。理解這門學科需要具備一定的數學和統(tǒng)計學知識。R語言及其庫實現了多種統(tǒng)計和圖形技術,包括線性和非線性建模,經典統(tǒng)計測試,時間序列分析、分類、聚類等。R功能很容易擴展,并且R社區(qū)以其在軟件包方面的積極貢獻而著稱。在書中,讀者將學習可測試進化中性理論的經典種群遺傳統(tǒng)計學,然后通過動手實踐,編寫自己的R代碼,以對真實的樣本SNP數據集進行分析。只要有可能,在書中我們針對統(tǒng)計學知識和R語言的實現就盡可能地詳細解釋,或者至少說明反映不同概念的方程式的依據。重點放在編程基礎和算法設計上:這些技能超出了在課堂上學習的特定計算范圍。在書中,建議每個讀者都要完成一個獨立的項目。