2.1 对称量量化和非对称量化

前言

int8的数据范围可以表示为-128到127之间的整数
uint8的数据范围可以表示为0到255之间的整数
注释:int8就是用8个比特位来保存整数,第一位用来表示符号。uint8表示无符号整数,没有符号位,8个比特位全部用来表示整数。

1.问题

1.1 引出问题

截断的数值最后反量化与原数值相差较大(1.62与1.1062843),如何解决该问题?
方法一:偏移–非对称量化
方法第二:最大绝对值对称法–对称量化

1.2 非对称量化

原理分析

动态范围量化(Dynamic Range Quantization)中的校准过程(Calibration)。它属于非对称量化的一种形式。由于量化参数(比如量化因子Scale)是通过数据集的统计量来估计的,因此称之为动态范围量化。它能够减少量化误差的原因是,引入了一个偏移量Z,使得量化后的数值在更小的范围内,进而减小量化误差。同时,偏移量Z的计算使得量化后的最大值Rmax落在了Qmax上,保证了最大值的精度。

动态范围量化

通过引入偏移量Z可以解决。具体公式如下:
在这里插入图片描述
其中,为什么偏移量Z的公式是这样定义呢?
可以看TensorRT量化第二课:对称量化与非对称量化的2.3.2 偏移量Z

代码

import numpy as npdef saturete(x, int_max, int_min):return np.clip(x, int_min, int_max)def scale_z_cal(x, int_max, int_min):scale = (x.max() - x.min()) / (int_max - int_min)z = int_max - np.round((x.max() / scale))return scale, zdef quant_float_data(x, scale, z, int_max, int_min):xq = saturete(np.round(x/scale + z), int_max, int_min)return xqdef dequant_data(xq, scale, z):x = ((xq - z)*scale).astype('float32')return xif __name__ == "__main__":np.random.seed(1)data_float32 = np.random.randn(3).astype('float32')int_max = 127int_min = -128print(f"input = {data_float32}")scale, z = scale_z_cal(data_float32, int_max, int_min)print(f"scale = {scale}")print(f"z = {z}")data_int8 = quant_float_data(data_float32, scale, z, int_max, int_min)print(f"quant_result = {data_int8}")data_dequant_float = dequant_data(data_int8, scale, z)print(f"dequant_result = {data_dequant_float}")print(f"diff = {data_dequant_float - data_float32}")

输出如下:

input = [ 1.6243454 -0.6117564 -0.5281718]
scale = 0.008769026924582089
z = -58.0
quant_result = [ 127. -128. -118.]
dequant_result = [ 1.62227    -0.6138319  -0.52614164]
diff = [-0.00207543 -0.00207549  0.00203013]

首先输入数组不变为[ 1.6243454 -0.6117564 -0.5281718],还是需要将其量化到int8范围即[-128 127],scale还是0.008769,z根据公式计算为-58,量化后的结果为[127 -128 -118],反量化后的结果为[ 1.62227 -0.6138319 -0.52614164],偏差为[-0.00207543 -0.00207549 0.00203013],可以看到加入了Z偏移量后的误差明显减小了。

通过引入偏移量Z,我们可以将量化后的数值范围向中心偏移,从而在整个量化数值范围内分布得更加均匀,减小了误差得积累。虽然最终仍然会有截断操作,但是这种偏移可以在整个数值分布上起到更好得平衡作用,从而减小了误差的影响。

1.3 对称量化

相关知识

对称量化是一种量化方法,其中量化步长在正负之间对称,即使得所有值域范围内的数据点都在对称轴的两侧,这样可以避免出现由于量化导致的误差。

在之前的非对称量化中我们通过引入偏移量Z的方式解决量化过程中值域截断的问题,那么还有没有其它的方式呢?
还是考虑原始数组[1.6243454 -0.6117564 -0.5281718],需要将其量化到int8范围即[-128,127],考虑对称量化,我们在原始数组中虚拟添加一个值,该值的大小为原始数组R中绝对值最大值的那个数的相反数,为了实现对称嘛,例如上述数组中添加的值就是-1.6243454,那么现在的输入数组就变成了[-1.6243454 -0.6117564 -0.5281718 1.6243454],同时考虑对称,我们将其量化到[-127,127]范围内(实际工程量化用的时候不会考虑-128),对称量化的计算公式如下:
在这里插入图片描述

代码

import numpy as npdef saturete(x):return np.clip(x, -127, 127)def scale_cal(x):max_val = np.max(np.abs(x))return max_val / 127def quant_float_data(x, scale):xq = saturete(np.round(x/scale))return xqdef dequant_data(xq, scale):x = (xq * scale).astype('float32')return xif __name__ == "__main__":np.random.seed(1)data_float32 = np.random.randn(3).astype('float32')print(f"input = {data_float32}")scale = scale_cal(data_float32)print(f"scale = {scale}")data_int8 = quant_float_data(data_float32, scale)print(f"quant_result = {data_int8}")data_dequant_float = dequant_data(data_int8, scale)print(f"dequant_result = {data_dequant_float}")print(f"diff = {data_dequant_float - data_float32}")

输出如下:

input = [ 1.6243454 -0.6117564 -0.5281718]
scale = 0.012790121431425801
quant_result = [127. -48. -41.]
dequant_result = [ 1.6243454 -0.6139258 -0.524395 ]   
diff = [ 0.         -0.00216943  0.00377679]

对称量化方法不用计算偏移量Z,计算量小,是一种非饱和量化。在对称量化中还存在一个问题,比如目前原始数组中有1000个点分布在[-1,1]之间,突然有个离散点分布在100处,此时做对称量化时Scale会被调整得很大,使得上下限超出[-127,127]的范围,从而导致量化误差增大,对精度的影响也会相应增大。

因此,在对称量化中,需要谨慎处理数据中的极端值,以免对量化精度造成不利影响。因此,需要动态选择范围来去除离散点,让max的选取更加的合理。

1.4 对称量化 vs 非对称量化

对称量化的优点:

  • 没有偏移量,可以降低计算量
  • 分布在正负半轴的权值数值均可被充分利用,具有更高的利用率;
  • 对于深度学习模型,可以使用int8类型的乘法指令进行计算,加快运算速度;
  • 能够有效的缓解权值分布在不同范围内的问题。

对称量化的缺点:

  • 对于数据分布在0点附近的情况,量化的位数可能不够;
  • 数据分布的范围过于分散,如果缺乏优秀的统计方法和规律,会导致量化效果不佳。

非对称量化的优点:

  • 通过偏移量可以保证量化数据分布在非负数范围内,可以使得分辨率更高;
  • 适合数据分布范围比较集中的情况。

非对称量化的缺点:

  • 对于偏移量的计算需要额外的存储空间,增加了内存占用;
  • 偏移量计算需要加减运算,会增加运算的复杂度;
  • 对于深度学习模型,要使用int8类型的乘法指令进行计算,需要进行额外的偏置操作,增加了运算量。

在tensorRT中的INT8量化使用的方法就是对称量化。

参考链接:
TensorRT量化第二课:对称量化与非对称量化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/354166.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Zinx框架学习 - 连接管理

Zinx - V0.9 连接管理 每个服务器的能够处理的最大IO数量是有限的,根据当前服务器能开辟的IO数量决定,最终决定权是内存大小现在我们要为Zinx框架增加链接个数的限定,如果超过⼀定量的客户端个数,Zinx为了保证后端的及时响应&…

澳网:公茂鑫/张择创历史 中国男网夺大满贯首胜

资料图:张择在比赛中。 中新网1月16日电 16日,2019年澳大利亚网球公开赛男双第一轮展开争夺,中国组合张择/公茂鑫苦战3盘战胜马特沃斯基/克里赞,收获中国男网在大满贯正赛的首场胜利,创造历史。 首盘比赛&#xff0c…

吴易昺,创造历史

中国网坛历史性一刻图片 当地时间2月12日 在ATP250达拉斯男单决赛中 中国球员吴易昺(bǐng)延续出色状态 顶住对手44记ACE的猛烈冲击,化解四个赛点后,以6-7(4)、7-6(3)、7-6(12)击败伊斯内尔,夺得个人以及中国大陆男网…

百合网“免费”革命 一场饮鸩止渴的大戏

在线婚恋市场一直以来都是有风乍起,吹乱一池春水的同时,也往往会带来自身的迷茫。 刚宣布融了15亿资的百合网计划下一步登陆A股, 于是推出了免费沟通的杀手锏,更是号称要彻底颠覆婚恋行业——果然是腰包鼓了,说话都财大…

澳网见证三巨头书写伟大时代 中国军团多点开花

中新网客户端北京1月28日电(记者 岳川) 随着排名世界第一的德约科维奇在男单决赛中直落三盘击败老对手纳达尔,2019年度澳大利亚网球公开赛大幕落下。这是一届注定会在未来被时常提起的赛事,罗德-拉沃尔球场见证了女单新霸主的诞生,见证了德约…

全球最大同性交友平台骚操作

文章目录 搜索快捷键高亮显示插件 github作为全球最大代码库,日常学习or工作都离不开她,这里介绍一些平时使用方面的技巧。 搜索 比如我们需要搜索spring boot相关的项目,如果直接搜索spring boot,结果如下: 可以看到…

RSA加密算法解析

目录 RSA加密 数学原理 证明: 欧拉函数 欧拉定理 模反元素 模运算 指数运算 同余 欧几里德算法GCD 填充(padding) 对称加密的应用工作流程 非对称加密的应用工作流程 1)加密过程 2)解密过程 代码实现 密码学知识扩展 加密体制 如何破解…

探究Vue源码:mustache模板引擎(1) 什么是模板引擎

之前在讲虚拟dom和diff算法时说过后续会讲模板引擎 啊 那这边 说到做到哈 对这个问题 有个比较官方的回答 模板引擎是将数据变为视图的最优雅的解决方案 比如 将左侧数据变为右侧视图 大家应该最先想到的就是 v-for 其实 v-for 就是一种模板引擎语法 从图中看出 模板引擎处理…

氟化物选择吸附树脂Tulsimer ®CH-87 ,锂电行业废水行业矿井水除氟专用树脂

氟化物选择吸附树脂 Tulsimer CH-87 是一款去除水溶液中氟离子的专用的凝胶型选择性离子交换树脂。它是具有氟化物选择性官能团的交联聚苯乙烯共聚物架构的树脂。 去除氟离子的能力可以达到 1ppm 以下的水平。中性至碱性的PH范围内有较好的工作效率,并且很容易再生…

学习HTTP2

这是有关HTTP最后一部分内容的学习啦~今天一起来学习HTTP/2! HTTP2 HTTP/2(超文本传输协议第2版,最初命名为HTTP 2.0),简称为h2(基于TLS/1.2或以上版本的加密连接)或h2c(非加密连接…

补番推荐

目录 first弹丸论破 second 学园默示录 third罪恶王冠 FIRST 弹丸论破 http://v.pptv.com/show/Dym1MpoAcK4Rj1M.html 本作在背景设定方面,游戏中当玩家们找出犯人的时候,犯人将会因此而被处置杀害。不过如果玩家们不能找出真正的犯人&#xff0c…

职业生涯规划-转[Mark.Chan]

转载自:https://www.cnblogs.com/mark-chan/p/5380135.html 担任公司高管的几年间,我面试过数以百计的各个层面的员工,其中最让我感到遗憾的一个现象就是很多人有着非常好的素质,甚至有的还是名校的毕业生,因为不懂得去规划自己的…

qq修改群名服务器失败,qq建群失败什么原因 q群一直创建失败 - 云骑士一键重装系统...

Q群聊创建一直失败是什么原因,一起来了解一下吧 QQ群创建失败会有以下几种情况,请您参考: 提示“敏感字眼/输入不符合规范”: 由于群名称或群简介内容中含敏感受限词汇导致,建议您检查后删除再尝试。 提示“系统繁忙&a…

python数据可视化-matplotlib学习总结

目录 (一)常见的图形 1、趋势图(直线图):plot() 2、散点图:scatter(): (二)统计图形 1、柱状图:bar( 2、条形图:barh() 3、直方图&#xff…

搭建ubuntu容器内C/C++开发调试环境

一、创建容器 为了让容器内的调试器(gdb、lldb)能够正常调试,在创建容器时需要添加参数: podman添加参数:--cap-addSYS_PTRACE,docker添加参数--cap-addSYS_PTRACE --security-opt seccompunconfined 否…

不知道图片变漫画怎么弄?来跟我学这几个简单的方法

我想问经常换头像的朋友一个问题,你们有用过自己的漫画脸当头像吗?如果我们把自己的头像做成漫画脸不仅不容易和别人撞头像而且更加能贴合我们自身的形象。那你们知道漫画脸怎么拍吗?今天我来给大家分享几个漫画脸制作都的方法。有兴趣的朋友…

适合剪辑新手的几个网站

现在越来越多的人喜欢剪辑视频了,现在我就推荐几个不错的适合剪辑新手的网站。 1.Videvo 这是一个提供高清或 4K 音频和视频的网站。它的视频分类详细,主要的分类有镜头和图文。 我更喜欢它的镜头类型下的视频,每一帧都很好看! …

古画会唱歌/图片说话对口型视频教程+工具素材

正文: 一张人物古画对口型,配上一段搞笑的配音,轻轻松松就能获得十几万的点赞,这个适合小白去操作,不仅好玩有趣涨粉还特别快。 视频演示放到压缩包了,有兴趣的自己去看吧。 教程工具素材 全部打包: wwreh.lanzoui…

短视频剪辑的小技巧分享,助你剪出令人印象深刻的片段,吸粉引流

短视频剪辑的小技巧分享,助你剪出令人印象深刻的片段,吸粉引流 短视频剪辑说难也难,但是说简单其实也简单,毕竟只要认真学习,大概几天就可以基本掌握短视频剪辑的流程,只是如果想要剪辑出来可以吸粉引流的…

全网最简单的网络图画法,小白福音包学包会

全网最简单的网络图画法,小白福音包学包会 徐锐(助理研究员),广东省生态环境技术研究所,土壤微生物与宏基因组方向 版本1.0.1,更新日期:2020年6月23日 本项目永久地址:https://githu…