【基于R语言群体遗传学】-15-溯祖理论coalescence

在群体遗传学中,一个非常重要的概念是关注谱系的汇聚(遗传线索的汇合),当我们回溯过去几代人口时。在之前的博客中,我们几乎只处理了随时间推移基因变化的“正向”模拟。

群体遗传学_tRNA做科研的博客-CSDN博客


然而,通过时间逆向建模等位基因频率变化不仅是一个有趣的视角,当你知道当前种群内等位基因分布并想知道它是如何达到这一点时;在计算上,它也可以比编码随机向前变化快得多。为了澄清这个观点,让我们更多地思考一下遗传在一个种群中的工作方式。下图所示的模拟显示了在一个小种群中,等位基因是如何从前几代的父母那里随机继承的。在第一代,所有等位基因都被单独指定(这可能对应也可能不对应实际的等位基因差异)。因为在这个简单模型中我们没有突变,一旦一个等位基因由于没有被偶然采样而丢失,它就不能再被获得。同祖遗传(IBD,源自单一祖先拷贝的等位基因)在每一代中积累。 重要的是,我们不需要追踪个体。这里重要的是追踪等位基因拷贝。当我们按IBD对等位基因进行排序时,遗传漂移的过程更容易可视化。

正如预测的那样,遗传多样性(杂合性值,图右侧)或多或少地下降,直到它达到零,所有个体都含有来自单一初始拷贝的等位基因。请注意,等位基因拷贝在种群中固定下来,尽管它减少到单个拷贝,并且在第4、10和11代几乎丢失。 最后一代的所有等位基因都是第11代单个拷贝的后代大多数等位基因不是后代的祖先,尽管大多数等位基因确实在紧接着的几代中留下了后代拷贝。这是遗传线索在一个种群的位点上的工作方式的一个令人惊讶和普遍的特性。当模拟遗传漂移时,最后一个见解——大多数等位基因没有最终重要的后代(在群体遗传学的意义上)——意味着我们不需要追踪整个种群。我们所需要做的就是追踪那些汇聚到一个共同祖先的祖先线索(这种谱系的汇聚被称为coalescence)。事实上,我们不需要追踪一个谱系中的所有个体步骤,我们只需要知道世代之间的距离。 在这个共祖谱系中,几个共同的特性是显而易见的。节点(共祖事件)之间的长度越深入过去就越大。相反,在最后几代中有许多共祖事件。大多数共祖事件是随时间向前发展的二分叉——一个单一的谱系分裂成两个谱系。然而,在最后一代中有两个三分叉(分裂成三个)甚至一个四分叉,这在非常小的种群中经常被预测到,比如这个。

让我们来可视化两个谱系的汇聚过程。汇聚过程可以在连续时间内用指数分布近似,其速率参数为1/(2N)(每代汇聚的概率)。我们可以写出两个谱系在时间t汇聚的概率的近似值:

指数分布的平均值是速率参数的倒数——以世代为单位的时间按种群大小进行缩放,由于谱系可供选择的副本数量,这会影响每一代的联合速率。我们通过R进行模拟:

# 生成一个包含1000个指数分布随机数的向量,其中参数rate为1/2
exps <- rexp(1000, 1/2)# 绘制exps的直方图
hist(exps)# 在直方图上添加一条垂直线,表示exps的平均值,颜色设为蓝色,线型设为虚线
abline(v = mean(exps), col = "blue", lty = 2)# 创建一个从0到exps最大值的序列,长度为1000
q <- seq(0, max(exps), length = 1000)# 根据指数分布的概率密度函数计算序列q上的概率密度值,参数rate同样为1/2
z <- dexp(q, 1/2)# 在当前图形设备上开启一个新的绘图区域,不覆盖原有图形
par(new = TRUE)# 在新的绘图区域绘制q与z的关系图,线宽设为1,不显示坐标轴、注释,线条颜色设为红色
plot(q, z, lwd = 1, axes = F, ann = F, col = "red")# 在右侧添加一个颜色为红色的y轴,标签方向设置为水平
axis(4, las = 1, col = "red")

指数分布具有较大的方差:速率参数倒数的平方,在这种情况下为(2N)²。我们可以对分布进行积分,以找到95%的联合事件可能发生的点。

换句话说,由于两个谱系的遗传漂变,预计95%的溯祖事件将发生在6N代内(在种群大小恒定等情况下)。那么超过两个谱系呢?如果我们增加第三个谱系,第一次联合发生的机会就更多了,因为在基因谱系中,随着时间的推移,种群中有更多的谱系可以相互碰撞。事实上,有三种联合方式:A与B、B与C或A与C。因此,第一次事件的速率是原来的三倍。

这种事件发生之前的平均时间是速率的倒数,即(2/3)N代。然后,剩下的两个谱系平均需要再经过2N代才能联合

你可以猜到接下来会发生什么。对于四个谱系,我们有六种方式进行首次联合,所以速率是6,平均时间是2N/6代,这时我们剩下三个谱系:

在这里,事情开始以另一种方式变得复杂。根据哪两个谱系首先联合以及它们与第二次联合的谱系的关系,存在两种不同的拓扑结构。比较上面的图形(拓扑概率为2/3)和下面的图形(概率为1/3)。

每次额外的时间步长之间联合事件的预期时间遵循以下模式:

  • 对于两个谱系,预期时间为2N代。
  • 对于三个谱系,第一个联合事件的预期时间为(2/3)N代,之后剩下两个谱系,再经过2N代才可能发生下一次联合。
  • 对于四个谱系,第一个联合事件的预期时间为(2/6)N代,之后剩下三个谱系,再经过(2/3)N代才可能发生下一次联合。

其中n是在任何给定时间可以联合的谱系数量。n(n − 1)/2是成对比较的数量,也称为三角数。

 当种群规模较大时,我们做一个简化的假设,即只发生二分叉,并且在每个时间段只发生一次溯组事件。从这些例子中,你可以开始看到,增加样本量往往会在树的末端添加短分支,而不是深入到基因谱系中的长分支。在所有谱系联合及其对遗传变异的影响方面,时间上存在很大的方差。

想象一下,随着时间的推移,种群大小的变化,比如10倍的扩张或收缩。这可能会如何影响基因组中回溯事件的分布?当我们讨论中性测试时,我们将回到这个问题。 回溯的概念可以用来推导群体遗传学中的一些基本预期。认识到向后的联合等同于向前的遗传漂变是有帮助的。考虑漂变-突变平衡;一个种群的预期杂合度是多少?如果每个突变在一个位点上产生一个新的等位基因(无限等位基因模型),每代谱系对的突变率是2𝜇。每代谱系对的联合率是1/(2N)。在平衡状态下,平均杂合度预期为两种速率的总和之外的突变率:

而𝜃 = 4Nμ

如果我们考虑到,平均而言,两个DNA序列副本在2N代前溯祖到一个共同祖先,因为每一代溯祖的概率是1/(2N),那么这两个副本之间的总距离是4N代(从一步后退到祖先,然后再后退2N代到另一个副本)。当我们应用每代突变率并假设每个突变发生在DNA序列的一个新的碱基对位置(无限位点模型)时,这两个副本之间平均有4N𝜇次突变。我们得到:

Fst可以通过考虑每代谱系对的联合率作为谱系迁移到种群的总速率的一部分来推导,每次两对,以及漂变:

其中m是每代迁移比例(如果你绘制这个图,你可以看到,在每一代中,只有少量的迁移个体Nm,可以快速使种群同质化)。最后,溯祖可以用来推导一个共同的祖先,然后是一个FST的隔离模型:

其中g代表自隔离以来的世代数。

有趣的是,如果这两个FST模型(具有非常不同的假设)被设置为相等并简化,我们得到m = 1/g。联合强调了非平衡共享祖先与隔离和漂变相对于持续迁移-漂变平衡对预期FST的反作用,仅凭FST无法区分它们。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3225293.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

【漏洞复现】时空智友ERP——uploadStudioFile——任意文件上传

声明&#xff1a;本文档或演示材料仅供教育和教学目的使用&#xff0c;任何个人或组织使用本文档中的信息进行非法活动&#xff0c;均与本文档的作者或发布者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 时空智友ERP是专为医药等行业设计的综合性企业资源规划系统&…

【漏洞复现】锐捷校园网自助服务系统 任意文件读取

声明&#xff1a;本文档或演示材料仅用于教育和教学目的。如果任何个人或组织利用本文档中的信息进行非法活动&#xff0c;将与本文档的作者或发布者无关。 一、漏洞描述 锐捷校园网自助服务系统是用于学校网络管理的一个平台&#xff0c;login_judge.jsf接口存在任意文件读取…

现在国内的ddos攻击趋势怎么样?想了解现在ddos的情况该去哪看?

目前&#xff0c;国内的DDoS攻击趋势显示出以下几个特征&#xff1a; 攻击频次显著增加&#xff1a;根据《快快网络2024年DDoS攻击趋势白皮书》&#xff0c;2023年DDoS攻击活动有显著攀升&#xff0c;总攻击次数达到1246.61万次&#xff0c;比前一年增长了18.1%。 攻击强度和规…

Collection接口及遍历集合的方式Iterator接口、增强for循环的介绍和使用

Collection接口 概述&#xff1a;单列集合的顶级接口格式&#xff1a;其中泛型决定了集合中能存储什么类型的数据&#xff0c;可以统一元素类型&#xff0c;泛型中只能写引用数据类型&#xff0c;如果不写&#xff0c;默认Object类型。等号前面的泛型必须写&#xff0c;等号后…

增强现实(AR)与虚拟现实(VR)的区别?

随着科技的飞速发展&#xff0c;增强现实&#xff08;AR&#xff09;与虚拟现实&#xff08;VR&#xff09;技术在各个领域展现出巨大的潜力和应用前景。这两种技术虽然在体验和实现方式上有所不同&#xff0c;但都为用户提供了全新的感知体验。本文将详细解析AR和VR的概念、区…

MySQL 面试相关问题

1. MySQL 基础问题1.1 为什么用MySQL&#xff1f;1.2 表属性类型 varchar 和 char 的区别&#xff1f;1.2 什么时候用 varchar 和 char&#xff1f;1.3 Datetime 和 Timestamp 的区别&#xff1f;1.4 一个SQL语句的执行过程&#xff0c;表述下&#xff1f; 2. MySQL 存储引擎相…

凝思安全操作系统安装部署

原文链接&#xff1a;凝思安全操作系统安装部署 Hello&#xff0c;大家好啊&#xff01;今天给大家带来一篇关于凝思安全操作系统安装部署的文章。凝思安全操作系统是一款注重安全和隐私保护的操作系统&#xff0c;适用于各种高安全性需求的场景。本文将详细介绍如何安装和部署…

万字学习——DCU编程实战

参考资料 2.1 DCU软件栈&#xff08;DCU ToolKit, DTK&#xff09; DCU 开发与使用文档 (hpccube.com) DCU软件栈 DCU的软件栈—DCU Toolkit&#xff08;DTK&#xff09; HIP&#xff08;Heterogeneous-Compute Interface for Portability&#xff09;是AMD公司在2016年提出…

【C++题解】1405 - 小丽找潜在的素数?

问题&#xff1a;1405 - 小丽找潜在的素数&#xff1f; 类型&#xff1a;进制转换 题目描述&#xff1a; 小丽同学在编程中学到了二进制数的概念&#xff0c;她发现&#xff0c;有些二进制数&#xff0c;如果转为 10 进制&#xff0c;就是素数&#xff0c;小丽把这些数称为潜…

机器视觉/自然语言/生成式人工智能综合应用实验平台-实训平台-教学平台

AIGC是人工智能1.0时代进入2.0时代的重要标志&#xff0c;MIT 科技评论也将Al合成数据列为2022年十大突破性技术之一&#xff0c;甚至将生成性Al(Generative Al) 称为是AI领域过去十年最具前景的进展。同时&#xff0c;AIGC领域岗位需求数量暴涨。高校方面在人工智能专业与机器…

【RHCE】转发服务器实验

1.在本地主机上操作 2.在客户端操作设置主机的IP地址为dns 3.测试,客户机是否能ping通

【C++高阶】高效数据存储:理解并模拟实现红黑树Map与Set

&#x1f4dd;个人主页&#x1f339;&#xff1a;Eternity._ ⏩收录专栏⏪&#xff1a;C “ 登神长阶 ” &#x1f921;往期回顾&#x1f921;&#xff1a;了解 红黑树 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; ❀模拟实现Map与Set &#x1f4d2;1.…

【Android】kotlin jdk版本冲突与Kotlin依赖管理插件

1、androidx.activity&#xff1a;activity&#xff1a;1.8.0 依赖版本错误问题 *依赖项“androidx.activity&#xff1a;activity&#xff1a;1.8.0”要求依赖它的库和应用针对版本 34 或更高版本 Android API 进行编译。&#xff1a;app 目前是针对 android-33 编译的。此外…

收银系统源代码-收银端UI风格

智慧新零售收银系统是一套线下线上一体化收银系统&#xff0c;给商户提供含线下收银称重、线上商城、精细化会员管理、ERP进销存、丰富营销活动、移动店务助手等一体化的解决方案。 如Windows版收银&#xff08;exe安装包&#xff09;、安卓版收银&#xff08;apk安装包&#…

LabVIEW平台从离散光子到连续光子的光子计数技术

光子计数技术用于将输入光子数转换为离散脉冲。常见的光子计数器假设光子是离散到达的&#xff0c;记录到来的每一个光子。但是&#xff0c;当两个或多个光子同时到达时&#xff0c;计数器会将其记录为单个脉冲&#xff0c;从而只计数一次。当连续光子到达时&#xff0c;离散光…

Monorepo仓库管理策略之 Lerna

这里写目录标题 前言&#xff1a;一、简介二、新建项目使用安装生成结构 三、复用现有项目执行命令查看包 四、配置package相互引用导入现有的包 五、发布包确定项目版本发布项目添加项目到到git发布包到NPM包发布出错解决方案 五、实例代码 前言&#xff1a; 将大型代码仓库分…

【漏洞复现】通达OA v2017 video_file.php 任意文件下载漏洞

免责声明&#xff1a; 本文内容旨在提供有关特定漏洞或安全漏洞的信息&#xff0c;以帮助用户更好地了解可能存在的风险。公布此类信息的目的在于促进网络安全意识和技术进步&#xff0c;并非出于任何恶意目的。阅读者应该明白&#xff0c;在利用本文提到的漏洞信息或进行相关测…

【鸿蒙学习笔记】Stage模型

官方文档&#xff1a;Stage模型开发概述 目录标题 Stage模型好处Stage模型概念图ContextAbilityStageUIAbility组件和ExtensionAbility组件WindowStage Stage模型-组件模型Stage模型-进程模型Stage模型-ArkTS线程模型和任务模型关于任务模型&#xff0c;我们先来了解一下什么是…

数学建模及国赛

认识数学建模及国赛 认识数学建模 环境类&#xff1a;预测一下明天的气温 实证类&#xff1a; 评价一下政策的优缺点 农业类&#xff1a; 预测一下小麦的产量 财经类&#xff1a; 分析一下理财产品的最优组合 规划类&#xff1a; 土地利用情况进行 合理的划分 力学类&#xf…

RedHat Linux8 修改root管理员账户密码命令

RedHat Linux8 修改root管理员账户密码命令&#xff1a; sudo passwd root RedHat重置root管理员密码&#xff1a; 1. 查看Linux系统版本信息 cat /etc/redhat-release2. 重置密码 2.1 进入内核编辑界面 重启Linux系统并出现引导界面&#xff0c;按下键盘上的e键进入内…