TCN-时间卷积网络

目录

一、引言

二、时序卷积神经网络

2.1 因果卷积(Causal Convolution)

2.2 膨胀卷积(Dilated Convolution)

2.3 残差链接(Residual Connections)

三、讨论和总结

1. TCN的优点

2. TCN的缺点


参考论文:An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling

Github:https://github.com/LOCUSLAB/tcn

参考链接:

       序列建模之时间卷积网络TCN - 杨镒铭的文章 - 知乎

      TCN时间卷积网络 - 剪水作花飞的文章 - 知乎

       时间卷积网络(TCN)在 NLP 多领域发光,RNN 或将没落

一、引言

       时序问题的建模大家一般习惯性的采用循环神经网络(RNN)来建模,这是因为RNN天生的循环自回归的结构是对时间序列的很好的表示。传统的卷积神经网络一般认为不太适合时序问题的建模,这主要由于其卷积核大小的限制,不能很好的抓取长时的依赖信息。 但是最近也有很多的工作显示,特定的卷积神经网络结构也可以达到很好的效果,比如Goolgle提出的用来做语音合成的wavenet,Facebook提出的用来做翻译的卷积神经网络。这就带来一个问题,用卷积来做神经网络到底是只适用于特定的领域还是一种普适的模型? 本文就带着这个问题,将一种特殊的卷积神经网络——时序卷积网络(Temporal convolutional network, TCN)与多种RNN结构相对比,发现在多种任务上TCN都能达到甚至超过RNN模型。

二、时序卷积神经网络

2.1 因果卷积(Causal Convolution)

                    preview

        因果卷积可以用上图直观表示。 即对于上一层t时刻的值,只依赖于下一层t时刻及其之前的值。和传统的卷积神经网络的不同之处在于,因果卷积不能看到未来的数据,它是单向的结构,不是双向的。也就是说只有有了前面的因才有后面的果,是一种严格的时间约束模型,因此被成为因果卷积。

2.2 膨胀卷积(Dilated Convolution)

       单纯的因果卷积还是存在传统卷积神经网络的问题,即对时间的建模长度受限于卷积核大小的,如果要想抓去更长的依赖关系,就需要线性的堆叠很多的层。为了解决这个问题,研究人员提出了膨胀卷积。如下图所示。

                                preview

        和传统卷积不同的是,膨胀卷积允许卷积时的输入存在间隔采样,采样率受图中的d控制。 最下面一层的d=1,表示输入时每个点都采样,中间层d=2,表示输入时每2个点采样一个作为输入。一般来讲,越高的层级使用的d的大小越大。所以,膨胀卷积使得有效窗口的大小随着层数呈指数型增长。这样卷积网络用比较少的层,就可以获得很大的感受野。

2.3 残差链接(Residual Connections)

                preview

        残差链接被证明是训练深层网络的有效方法,它使得网络可以以跨层的方式传递信息。本文构建了一个残差块来代替一层的卷积。如上图所示,一个残差块包含两层的卷积和非线性映射,在每层中还加入了WeightNorm和Dropout来正则化网络。

三、讨论和总结

       总体来讲,TCN模型上的创新并不是很大,因果卷积和扩展卷积也并不是本论文提出来,本文主要是将TCN的结构梳理了一下,相比于wavenet中的结构,去掉了门机制,加入了残差结构,并在很多的序列问题上进行了实验。实验效果如下:

              

在多个任务上,都比标准的LSTM、GRU等效果好。

1. TCN的优点

    (1)并行性。当给定一个句子时,TCN可以将句子并行的处理,而不需要像RNN那样顺序的处理。

    (2)灵活的感受野。TCN的感受野的大小受层数、卷积核大小、扩张系数等决定。可以根据不同的任务不同的特性灵活定制。

    (3)稳定的梯度。RNN经常存在梯度消失和梯度爆炸的问题,这主要是由不同时间段上共用参数导致的,和传统卷积神经网络一样,TCN不太存在梯度消失和爆炸问题。

    (4)内存更低。RNN在使用时需要将每步的信息都保存下来,这会占据大量的内存,TCN在一层里面卷积核是共享的,内存使用更低。

2. TCN的缺点

    (1)TCN 在迁移学习方面可能没有那么强的适应能力。这是因为在不同的领域,模型预测所需要的历史信息量可能是不同的。因此,在将一个模型从一个对记忆信息需求量少的问题迁移到一个需要更长记忆的问题上时,TCN 可能会表现得很差,因为其感受野不够大。

    (2)论文中描述的TCN还是一种单向的结构,在语音识别和语音合成等任务上,纯单向的结构还是相当有用的。但是在文本中大多使用双向的结构,当然将TCN也很容易扩展成双向的结构,不使用因果卷积,使用传统的卷积结构即可。

    (3)TCN毕竟是卷积神经网络的变种,虽然使用扩展卷积可以扩大感受野,但是仍然受到限制,相比于Transformer那种可以任意长度的相关信息都可以抓取到的特性还是差了点。TCN在文本中的应用还有待检验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1621471.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

DBeaver的安装和使用:windows版

DBeaver官网下载地址:https://dbeaver.io/download/ 下载完成后, 进入傻瓜式安装: 这里会进入重复界面,一样点击下一步即可 选择安装目录,尽量不要选C盘, 我的电脑只有c盘, 没办法 等待安装完成…

这款远程桌面软件开源了

相信在七八年前,大部分读者都使用 QQ 远程控制电脑。到后面,才接触到一些好用的远程控制产品,比如 Teamviewer、向日葵等。 最近,自己装的远程控制产品试用期到了,便想到去 GitHub 找找有没有可以替代的开源项目&#…

Modbus转Profinet网关在大型自动化仓储项目应用案例

在自动化仓储项目中,Modbus是一种常见的通信协议,用于连接各种设备,例如传感器、PLC和人机界面。然而,Modbus协议只支持串行通信,并且数据传输速度较慢。为了提高通信效率和整体系统性能,许多大型仓储项目选…

LeetCode-455-分发饼干-贪心算法

题目描述: 假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。 对每个孩子 i,都有一个胃口值 g[i],这是能让孩子们满足胃口的饼干的最小尺寸;并且每块饼干 j&#xff…

手机怎么解决同ip多账号_游戏工作室如何实现手游多开多窗口多IP

经常能看到的一个画面就是游戏工作室,一台电脑许多个手机游戏窗口同时进行,需求量1台程序运行好几个微端。或是相同应用程序开启好几个窗口。那样做能够节约成本,不用多个设备。 但他们全是公用相同网络ip地扯得,那麼如何来防止由…

【产品文档】团队介绍PPT模板

今天和大家免费分享团队介绍的PPT模板。团队介绍是向他人展示团队的实力、专业性和能力的重要方式。通过一个有力的团队介绍,您可以突出团队的成员、经验、技能和取得的成就,从而增加信任、吸引合作伙伴、客户或投资者的兴趣 【模板预览】 动态演示效果…

【交换机 挑选】什么交换机适合游戏工作室

【交换机 挑选】如何选择合适的交换机?什么交换机适合游戏工作室?交换机作为局域网数据转发的核心设备,其性能及功能决定着局域网的可管理性和数据转发性能,选择交换机时ONV/光网视小编建议可以从以下几方面去考虑:1.端…

“钩子”、体验和思考人生,一家瑞典游戏工作室如何站稳脚跟,又不被自己的野心呛到

“瑞典夏天短,冬夜漫漫,我想大家就窝在家里做游戏了。” Minecraft、《战地》、《城市:天际线》、Candy Crush……你曾玩过或当前在玩的很多游戏都是瑞典出产。为什么瑞典人这么擅长做游戏?Anton Albiin 给出了一个有点冷的回答。…

c++游戏工作室,不容错过

zzz工作室,链接zzz07.ysepan.com 在这里,你可以聊天留言,可以贴上自己的小游戏或自己的文章,可以下载教程和其他小游戏,也可以做题哟(^U^)ノ~YO。并且在目前…

SaaS | 金山软件西山居游戏工作室

SaaS | 金山软件西山居游戏工作室 原创: 鲁迅本人 鲁迅都说好 3天前 想了想金山软件还是得放到SaaS,以后比较好归类。 主要三个关注点吧 剑侠IP带来的流量是否能长此以往经久不衰端游转手游是趋势,转换是否成功腾讯入股代理,渠…

游戏工作室

各位玩家大家中午好,工作室对游戏内的影响是非常巨大的,我们会一直严厉打击工作室及其相关账号。如果某部分账号是工作室的获利账号我们查出来以后也会进行封停处理。当然,账号被封停的原因不仅仅是工作室,还有因为使用外挂等第三…

手游游戏工作室内部OA管理系统免费安装教程

1. 安装配置,下载OA源码 ①:安装宝塔(https://www.bt.cn/)系统,配置环境 ②:下载溪谷工作室OA免费版 溪谷软件工作室OA管理系统免费下载地址-游戏公会管理-游戏公会运营推广资讯-游戏工作室OA &#xff08…

专业游戏后端引擎“坚果矩阵” 解初创游戏工作室的燃眉之急

2020年新冠疫情肆虐全球对各行各业都造成了不同程度的冲击,在这种经济形势下游戏行业反倒获得了逆势增长,玩家在线时长大幅上升,中国游戏市场实际销售收入增长超20%。仅2020年上半年中国新增注册游戏企业超4.42万家,平均每天新增注…

手机游戏辅助和游戏工作室的相关性

说起游戏辅助,特别是手游辅助,最大的需求群体算是游戏工作室了。游戏工作室是中国游戏产业链上重要的一环,他们需要使用游戏辅助工具,配合手机群控软件,批量进行手机游戏,如自动刷金币,自动跑图,自动刷极,自动挂机等操作, 多则上百台手机同时操作,效率极高。 Total Control集手…

K8S最新版本集群部署(v1.28) + 容器引擎Docker部署(上)

温故知新 📚第一章 前言📗背景📗目的📗总体方向 📚第二章 基本环境信息📗机器信息📗软件信息📗部署用户kubernetes 📚第三章 Kubernetes各组件部署📗安装kube…

Vue:插槽,与自定义事件

1.插槽slot <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title> </head> <body> <div id"app"><!-- <p>列表书籍</p>--> <!-- …

我的世界java版游戏狗,我的世界Minecraft Java版17w46a公布

我的世界Minecraft Java版17w46a公布。每周快照是Minecraft的测试机制&#xff0c;主要用于下一个正式版的特性预览。然而&#xff0c;每周快照主要用于新特性展示&#xff0c;通常存在大量漏洞。因此对于普通玩家建议仅做测试尝鲜用。使用测试版打开存档前请务必备份。适用于正…

游戏思考04总结:针对帧、状态、物理同步的总结(之前写的太长,现在简略下)

文章目录 一、什么是帧同步&#xff08;1&#xff09;帧同步定义&#xff08;lockstep&#xff09;&#xff08;2&#xff09;帧同步实现方法&#xff08;1&#xff09;确定性锁步同步Deterministic Lockstep&#xff08;2&#xff09;乐观帧锁定Bucket Synchronization&#x…

c++系列之指针

今天不是做题系列&#xff0c;是知识系列啦。 说到指针&#xff0c;我们初学这一定会气的牙痒痒把&#xff0c;笔者也是&#xff0c;这么我好久而不得呀&#xff0c;今天来让我们聊聊指针。 其一 首先&#xff0c;我们明确的知道&#xff0c;假如我们开一个变量&#xff0c;…

快速封禁大法--东方日报JS解密过程

破解难点&#xff1a; 1.所有接口参数都有时间限制&#xff0c;且与当前加载页面绑定&#xff0c;参数无法在短期内复用 2. token参数破解&#xff1a;点击翻页时第一个加载的接口&#xff0c;会返回一个token&#xff08;详见&#xff1a;get_token() 函数内容&#xff09; 3.…