AgentBind--Deepneuralnetworksidentifysequencecontextfeaturespredictiveoftranscriptionfactorbinding

推荐度:⭐⭐⭐⭐⭐
亮点
设计了一种机器学习构架AgentBind,可以识别和解释对于转录因子(TF)结合最重要的序列特征。与以往大多数研究结合基序的系统或程序不同,AgentBind着眼于基序附近的序列背景,并可以研究其在TF结合中的作用。


近日由加利福尼亚大学圣地亚哥分校郑安与Melissa Gymrek等的研究团队在《Nature Machine Intelligence》杂志上发表了一篇名为Deep neural networks identify sequence context features predictive of transcription factor binding的研究文章。转录因子(TF)通过识别特定的序列基序来结合DNA,。一个基序可以在人类基因组中发生数千次,但实际上只有这些位点的一部分被结合。这篇文章作者构建了一种名为“AgentBind”机器学习构架,可用于识别对于TF结合最重要的序列特征。研究人员使用这一构架预测在淋巴母细胞细胞系中38个转录因子的基序结合,评估了特定碱基对于序列的重要性,并表征最能预测结合的序列特征。这项研究为人们预测转录因子结合的特征提供新颖的见解,并有可能为将来的深度学习应用提供信息,以解释非编码遗传变异。


转录因子(TFs)的结合是主要的转录调控机制之一,TFs识别并结合特定的DNA序列以控制转录,这一过程形成了指导基因表达的复杂系统。 TF结合的破坏是包括癌症、自身免疫性疾病、心血管疾病等多种疾病发病的根本原因之一。因此,了解控制TF结合的机制可以深入了解疾病过程,为开发新的治疗手段提供思路。研究表明,大多数TF具有独特的结合偏好,只能识别包含特定模式(即核心基序)的DNA序列。但是基序匹配序列和实验确定的结合位点之间通常只有部分重叠。特定基序是否能够与TF结合取决于许多其他因素,包括染色质可及性,核小体定位,与其他TF的协同和竞争结合等等。这些因素中有许多与TF基序周围的序列背景有关。为了研究序列上下文在TF结合中的作用,我们开发了一个名为AgentBind的构架,用于预测是否会结合基序实例,以及寻找对结合状态影响最大的特定核苷酸。

以下是本文第一作者郑安对于该技术的解读:

该模型架构包含三个步骤:预演,微调,解释(pre-training, fine-tuning, interpretation),并应用DanQ作为模型体系结构。首先利用pre-train DanQ模型从多个细胞获取外遗传性注释类型。随后将为每个TF建立一个二进制数据集:提取以基序实例为中心的1kb基因组序列,并根据与ChIP测序确定的结合位点重叠将每个序列标记为结合(阳性)与未结合(阴性)。每个二进制数据集用于微调一个单独的预演模型,使其学习TF绑定的重要功能。最后将使用一种名为Grad-CAM的模型解释方法对每个核苷酸对结合预测的贡献进行评分(图1)。


随后研究人员用这一架构重点研究了淋巴母细胞样细胞系GM12878,其中有
活跃的38个TF,具有可从ENCODE项目获得的ChIP-seq数据集,以及可从JASPAR获得的结合位点基序。通过AgentBind,研究人员确定了预测转录因子结合的核苷酸碱基。图2显示了包含某个区域的Grad-CAM分数的示例,y轴显示了每个核苷酸的Grad-CAM分数,结果显示中央SP1基序的序列和对应于NFY基序的两个高分区域。


对于阴性样本,研究人员可以选择将它们限制在DNase I超敏感位点之内或之外,从而产生两个不同的模型:DNase-I受控模型和基线模型。图3显示了这两个模型确定的关键上下游序列特征。虽然基线模型可产生更好的分类结果,但DNase-I控制的模型识别出基线模型中忽略的一些不同模式。


为了研究这一框架捕获细胞类型特异性调控功能的能力,我们选择了一种名为STAT3的TF,并使用来自三种细胞类型(GM12878,CD4 + Th17和HeLa细胞)的ChIP测序数据训练了单独的模型来预测STAT3结合。结果表明,一些富集的5聚体在多种细胞类型之间共享,而另一些则具有高度的细胞类型特异性(图4)。


总而言之,这项研究提供了一种有价值的机器学习框架,可帮助解码TF结合其靶位点并可识别对结合作用最强的特定非编码核苷酸。这项技术未来的应用包括:新发现的TF和细胞类型,学习其他TF的细胞类型特定规则,研究TF结合区的选择信号,以及将核苷酸水平得分整合到GWASfine-mapping框架中等。

教授介绍


Melissa Gymrek,主要研究人类的遗传变异,特别是在基因的短串联重复序列中的遗传变异。她已获得一项专利的算法,该算法可从高通量测序数据中分析短串联重复序列,以进行遗传应用。她发明这项技术使此类研究得以扩展到整个人口规模,这有助于科学家了解这些小的基因片段如何导致不同人类特征的变化。

参考文献
1、An Zheng, Michael Lamkin, Hanqing Zhao et al. Deep neural networksidentify sequence context features predictive of transcription factor binding (2021). https://www.nature.com/articles/s42256-020-00282-y

发布于 02-01

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1381510.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

VGG16论文解读

VGGNET VGG16相比AlexNet的一个改进是采用连续的几个3x3的卷积核代替AlexNet中的较大卷积核(11x11,7x7,5x5)。对于给定的感受野(与输出有关的输入图片的局部大小),采用堆积的小卷积核是优于采用…

机器学习 加利福尼亚房价预测

学习目标: 提示:导入包 例如: import pandas as pd import numpy as npfrom sklearn.datasets import fetch_california_housing from sklearn.model_selection import KFold, train_test_split from sklearn.metrics import mean_squared…

目前加尼福尼亚自动驾驶公司测试公司————20150529

获准在加州测试自动驾驶汽车的公司 科技公司和汽车制造商正在竞相开发能够自主驾驶,不需要人类干预的汽车。市场对于这类汽车的兴趣已经协助刺激了人工智能和汽车专业人士的需求。无人车开发是一个耗费资金的项目,这可能会让部分风险投资家望而却步。 Z…

Python学习-KNN预测加尼福尼亚房价

加尼福尼亚房价数据集与KNN 需要的几个Python库 import matplotlib.pyplot as plt from sklearn import datasets from sklearn.neighbors import KNeighborsRegressor from sklearn.cross_validation import train_test_split from sklearn.metrics import mean_squared_e…

梅尔加尼服务器状态,梅尔加尼服务器第二界闪光平原暴力竞走大赛

梅尔加尼服务器第二界闪光平原暴力竞走大赛 (2006-12-12 10:27:42) 主办方:艾泽拉斯皇家记者协会 协办方:帕兰萨斯(LM)/同心盟(BL) 公会 奖品提供:第九城市 服务器:二区梅尔加尼 时间:2006年12月17日 下午2点进场地 2.30预赛开始 比赛规则:http://blog.sina.com.cn/u/47d86f7f0…

车载Tbox-CAN终端数据采集实现方案

因工作关系有机会与一家做汽车数据采集公司的Tbox终端产品做数据对接。 这个产品通过can口与汽车总线交换数据,再将采集的数据打包通过4G以tcp报文发送到云端。云端通过解析、格式转换后保存到数据库。 本文介绍用nodejs实现tcp报文的解析,报文描述如下…

如何做好 PHP 项目文档管理?PHPer 开发的必备利器!

对于常年写 PHP 的老司机来说,PHPDoc 一定不会陌生,不过从1.3.0开始,更名为 phpDocumentor。它作为一个用 PHP 写的工具,主要作用是从你的源代码的注释中生成文档,因此在给你的程序做注释的过程,也就是你编…

PHP读取word文档 导入word文档

PHP读取word文档 导入word文档 PHP读取word文档 导入word文档libreoffice把word转html用phpquery读取html的内容 PHP读取word文档 导入word文档 前一段时间在工作中遇见了一个棘手的需求,客户要求把word里的数据导入,对数据进行统计。 刚开始觉得挺简单…

开发文档(PHP代码规范)

为什么80%的码农都做不了架构师?>>> 1 框架目录及结构简介 1.1 目录结构 1.2框架简介和主要目录结构简介 1.2.1 框架版本采用:Lumen (5.5.2) (Laravel Components 5.5.*)版本 参考链接:https://lumen.laravel-china.org/docs/5.2…

PHP编码规范文档

为了提高工作效率,保证开发的有效性和合理性,并最大程度提高程序代码的可读性和可重复利用性,提高沟通效率,需要一份代码编写规范。让大家养成良好的代码编写习惯,同时减少代码中的bug。 CleverCode整理了一些规…

PHP文档工具-phpDocumentor

PHP 文档工具 —— phpDocumentor 写文档是一项乏味却不得不做的工作,而编写 API 级的文档更是意味着大量的重复劳动和难以保持的一致性。这里我们要推荐给大家的,是支持 PHP5 语法分析的文档工具—— phpDocumentor 。 使用 phpDocumentor…

unity新输入系统的简单使用(New InputSystem)

1、在包管理器 unity注册表中下载安装InputSystem 2、给玩家添加组件PlayerInput,点击CreatAction,创建一个InputAct InputAct,这是玩家的输入文件,在里面可以设置玩家输入 3、使用 例如玩家控制角色移动 在InputAct中,默认已经设置好了移…

PHP有关文件

目录 1.文件环境变量 2.文件相关知识 3.有关文件函数 2.写文件 3.关闭文件&#xff1a; 4.其他函数 1.文件环境变量 <?php echo $_SERVER[DOCUMENT_ROOT] .PHP_EOL; //根目录的路径 echo $_SERVER[PHP_SELF] .PHP_EOL;//从根目录到文件的路径 echo $_SERVER[SCRIPT_F…

如何使用phpdoc生成PHP文档

1. 下载phpdoc 官网地址&#xff08;已经N久没更新了&#xff0c;不知道是不是不想干了&#xff09;&#xff1a;http://www.phpdoc.org/&#xff1b;下载地址&#xff1a;http://sourceforge.net/projects/phpdocu/files/ 2. phpdoc -h 文件下载后解压&#xff0c;然后进入…

超好用的PHP注解生成Api接口文档工具,支持TP、Lavael、Hyperf、Webman等框架

✨特性 开箱即用&#xff1a;无繁杂的配置、安装后按文档编写注释即可自动生成API文档。轻松编写&#xff1a;支持通用注释引用、业务逻辑层、数据表字段的引用&#xff0c;几句注释即可完成。在线调试&#xff1a;在线文档可直接调试&#xff0c;并支持全局请求/Mock参数/事件…

PHP文档工具

PHP文档工具 ——phpDocumentor Easyphpe / 文 写文档是一项乏味却不得不做的工作&#xff0c;而编写API级的文档更是意味着大量的重复劳动和难以保持的一致性。这里我们要推荐给大家的&#xff0c;是支持PHP5语法分析的文档工具——phpDocumentor。 使用phpDocumentor不仅可以…

PHP写文件简介

PHP中有各种内置函数用于对文件执行各种操作。他们可能对文件进行创建、打开、读取、写入等操作。 PHP写入文件的功能 以下是 PHP 中默认可用的主要功能&#xff1a; 1. fopen() 首先&#xff0c;为了写入文件&#xff0c;我们必须知道如何创建该文件。这是在 open() 函数的…

前端笔试题1

HTML/CSS 题1&#xff1a; 1&#xff0e;使用CSS 让该节点不可见&#xff0c;方法越多越好。 <div class"hidden">Hi</div> 使用CSS 让节点不可见的方法有以下几种&#xff1a; 把 visibility 属性设置为 hidden&#xff0c;这样元素框不会被绘制&…

inkscape制作向日葵

inkscape制作向日葵logo 双击打开inkscape 软件 2.创建一个五角星&#xff0c;填充相应的颜色 3.创建一个圆填充相应的颜色 把五角星增加圆角和辐条&#xff0c; 5.绘制向日葵的眉毛、眼睛、鼻子、嘴巴 6.把圆和五角星重叠在一起&#xff0c;选中五角星——选择图层——层置…

Android_Butterfly_动画

Android_Butterfly_动画 运行效果 所需文件 MainActivity package com.example.a517_butter; import android.animation.AnimatorSet; import android.animation.ObjectAnimator; import android.graphics.drawable.AnimationDrawable; import android.os.Bundle; //imp…