细看AI芯片的“小趋势”

https://www.toutiao.com/a6686360647858389517/

 

 2019-05-02 17:34:13

来源:techweb

芯片战争未曾停歇。飞速发展的自动驾驶为芯片厂商带来了新的机会,IC设计商尝试推出更适用于AI场景的芯片,晶圆与封测厂商图加速换代生产线,以便赶上下一波AI时代的“潮流”。为了更直观的理解AI芯片,我们需要“拆解”两部iPhone。

揭开iPhone 4后盖,卸下主板PCB,可以看到一块拇指大小黑色塑料片。这是苹果第一代自家产的SoC(片上系统),名为A4处理器,它被焊接在iPhone 4主板背部,曾与乔帮主一同站在2010发布会舞台上。如今苹果自产SoC升级到了A12X,除了运算能力的增长,其内核架构也随着工业界芯片制造工艺进化而日趋精湛。

8年前的A4处理器撑起了iPhone的市场地位,这块搭载ARM核心、内部脉冲震荡可以飙升至1GHZ的芯片,仅一半的计算能力就可把上个世纪登月的阿波罗飞船甩在几条街后,而大部分用户只需用它打电话、收发邮件、偶尔玩一玩《愤怒的小鸟》。A系芯片演进到今天,苹果推出搭载最新处理器A12x的iPad Pro,库克试图说服人们一款不足6毫米厚度的电子设备就可胜任生活工作的全部需求,从而不在需要携带厚重的笔记本,确实有他的道理。

A12X代表着消费电子处理器已到达前所未有的高度。这款A12X内置模拟人脑神经元的集成电路,可以在人眼不可察觉的瞬间完成神经引擎、图像处理、数据处理的工作(FaceID),这在几年前还是科幻电影的元素。

细看AI芯片的“小趋势”

 

 

我们没有办法展示A12X的照片,但可以参照A11,视觉化苹果移动端SoC集成度变化。

今天再来对比两款芯片:两张单薄晶体板下方隐藏着一道巨大的技术鸿沟,从硅晶打磨、光刻、再到封装技术,背后是多年来理论学者与芯片工程师的尝试,以及全球芯片巨头间的角逐结果。如果不是制造工艺的进步、整个芯片的社会生产力不断提升,谁也不会想到会有类似科幻元素的产品触达我们的生活,影响到我们的感官体验。

国内华为也有自己的SoC系统:麒麟980。为证明最新麒麟980的实力,华为号召了几位大学生,设计出一套可以预装在荣耀Magic2上便可操纵车辆的驾驶程序,佐证了麒麟980计算能力。

这是一次创新式的尝试,但手机能够处理的道路信息还是非常有限,为了提供安全可靠的自动驾驶体验,我们需要更快、更灵活、更低功耗的的AI芯片。

在未来,无人驾驶汽车将集成诸多算法。想象一下,用户可以在手机App上“召唤”一辆附近空闲的无人车。无人车启动“大脑”,开始获得实时路况信息,这几乎占用了目前无人车“大脑”的运算带宽。每一秒钟,摄像头采集车附近360度视野图像,实时地运行卷积神经网络来区分行人与车辆。

与此同时,毫米波雷达收集到距离信息为车载决策层准确的判断依据:是继续直线行驶,还是转向避让?决策层需要在不到50毫秒的时间内反应,控制车辆动力及转向控制器,下位机继而将指令转化成PWM脉冲信号,指挥毫无思考能力的方向电机和动力电机。

几分钟后,无人车战胜了复杂的路况、穿过嘈杂街道,停靠在到精准的目标位置,等待乘客上车。随后,通过车载语音交互模块,无人车可获知用户的目的地。根据最新的高精度地图信息,再结合车身上的全方位传感器感知周遭情况,最终安全的抵达目的地。这一套流程,重复而单一,会使人类司机感到疲惫。

所以不难看出,AI芯片有三大要求:大吞吐,低延时,低能耗。对于厂商来讲,只要能占据更大的无人驾驶市场,钱不是问题。

为实现这一目标,Nvidia在2016年推出K字头运算GPU加速器,黄仁勋试图讨好马斯克以便挤掉以色列公司Mobileye,但显然后者不吃这一套,选择表面合作暗地却从AMD挖高管,打算自己搞AI芯片。只不过事实证明,最新的Model 3依然使用Nvidia的处理器,自研芯片之路还很长。

目前在业界中,有一种说法是AI芯片将沿「CPU-GPU-FPGA-ASIC」的路线演进。CPU曾在PC、服务器端时代统领江山,却不及GPU的大吞吐特性而沦为辅助,Nvidia曾在Drive Xavier架构上投入30亿美元,2018年CES上展示出了一款能够以500瓦的能耗代价实现每秒320万亿次运算。500瓦的能耗水平非常低,满载的车内空调大约在5千瓦时左右,占用传统燃油车2匹马力。

细看AI芯片的“小趋势”

 

 

然而未来国内能源属性趋势来看,无人驾驶模块将限制车辆的续航里程,500瓦的功耗还是太高。

中国一家名为深鉴科技创业公司在去年被国际FPGA巨头赛灵思(xilinx)收购,深鉴科技的一篇论文曾在FPGA 2017大会上评为最佳,在论文中他们设计的模型可以在XCKU060(一款FPGA芯片)上运行更高精度的语音识别效果,而且拥有更低的功耗。矛盾在于FPGA属于半定制化的工业产品,成本相对较高,XCKU060单片价格在4000美元左右。在相同计算力下,FPGA价格不占优势。谷歌旗下的Waymo目前使用的KU115(一款来自赛灵思的FPGA芯片),单片价格在5400美元左右,虽然换掉了早年使用的英特尔Xeon系列服务器芯片,运算性能不断提升,但整车价格也一路高歌猛进。

待算法、传感器成熟,ASIC才有施展拳脚的机会。我们之前提到的Mobileye,其产品便是基于的ASIC架构加速器,和Nvidia走截然不同的系统级处理器路线,ASIC全称为“专用集成电路”,其内置的异构模块可以针对信号、图像等处理算法进行特殊优化,但在设计流程上用到更长时间。

FPGA这个词想必就更加陌生了。简单来说,ASIC芯片是一个“KFC的汉堡包”,而FPGA更像“赛百味的三明治”,后者有更大的“重新设计”空间,可以根据用户需求添加内容、功能和优化。不过,针对FPGA进行编程,也可以设计出ASIC,但单片成本更高,而且需要大量专业脑力工作,是项“硬核”工艺,而想靠自家设计的FPGA落得应用,更是件困难的事情。

近年,国内涌现一批AI芯片的IC设计商,寒武纪、阿里、华为、百度、地平线、比特大陆等。在设计技术和制造技术之间,国内初创IC设计商处在很尴尬的境地,其设计成果若不能找到合适产品并量产,将意味着所有设计毫无商业意义。

细看AI芯片的“小趋势”

 

 

于是,我们将目光放到晶圆与封装厂商上来。

中芯国际是一家成熟的本土圆晶加工商,2017年市场占有率5.4%,YoY(增长率)达到6.35%,2018年28nm以上制程的芯片月产44万片,这些芯片会被安装到低功耗计算机、通讯设备、汽车等其他消费电子产品上。但是AI芯片领域,至少在云端训练计算方向上,14nm以下制程才算刚刚入门,截至2019年2月21日,中芯国际尚未交付任何14nm或以下制程的产品,但在媒体报道中称:“14纳米技术研发已进入客户导入阶段”。

这么来看,中芯国际确实已经有14纳米技术:FinFET工艺。FinFET是什么概念?简单来说,中芯将刻芯片的工艺水平从2维(CMOS)升级到3维(FinFET),是集成芯片工艺中值得“秀”的资本。 此前中芯的28nm多晶硅(Poly/SiON)工艺是相对台积电比较落后的技术,后来才有了HKMG制程工艺,虽然仍是28nm制程,但产品优化效果好,良品率也有所提升。对于大厂而言,前几年在20nm的工艺突破是一个分水岭,因为越低制程将越接近材料极限,例如:量子隧穿效应。FinFET工艺是目前应对量子隧穿效应最有效的方法,中芯国际的FinFET尚处在“有技术没产品”的阶段,正在2019年希翼实现突破。

细看AI芯片的“小趋势”

 

 

晶圆(图片来自维基百科)

在世界前三的封测企业中,有两家是本土品牌,一家是台湾日月光,另一家是江苏长电。2017年的数据统计显示,台湾日月光的市场占有率最高、营收最大。寒武纪的第一款SoC就是在日月光协作下完成的。

长电科技2018年第一季营收达54.90亿元,相较去年同期50.25亿元增长9.27%;实现净利润9600万元,而去年同期亏损1亿元。归属上市公司净利润为525万元,较去年同期3830万下降86.29%。而我们单独看江苏长电的产能,在较为复杂处理器封装工艺还是研发阶段,暂时没有量产可能。同样的,与长电科技各分秋色的华天科技、通富微电,均无较大功耗的AI芯片封装工艺,而小型SoC也难以胜任。苏州晶方是一家小型化晶圆的半导体厂商,主要靠TSV工艺吃饭,在AI芯片领域暂无涉足,不过相类似厂商可能会在智能设备普及、愈发依赖生物传感的情况下大有可为。

国内封测企业兴起的具有国际因素,例如松下等日韩封测厂在马来西亚因工人债务问题,于2016起陆陆续续撤离当地,将新厂设立在中国大陆。

五.在IC设计领域,2016年创立的寒武纪需要依托上游知识产权保护,下游需要借助圆晶制造厂、封测(日月光等)厂商实现量产,其产品出口有二:SoC厂商和系统厂商。

2017年,寒武纪参与完成了一款华为的AI芯片设计,也就是读者常听到的麒麟970。这颗芯片本身不是寒武纪生产,而只负责设计了其中部分模块。麒麟970本身属于SoC概念:将符合需求的功能ARM加上自己的IC晶片封装到一起。其优点在于集成度高、体积小巧,适合移动端设备。而要设计一颗SoC需要相当多的技术配合,例如上游的IP(intellectual property)授权、遵循晶圆制造标准。能从IC一路走到最后的测试阶段的SoC都是了不起的工程项目。

寒武纪和华为合作的麒麟970具有一定战略意义:去年(2018)全球手机市场整体下滑,唯独华为手机出货量上涨趋势(+43.9%),市场份额达到了世界第三的水平,但此前却没有自己的芯片,消耗了大量的IP授权费。与此同时,寒武纪正愁没机会进入移动端市场,干柴与烈火的相遇,进一步推动搭载麒麟970的Mate10出货量达到4000万台,如果保守估计,麒麟970为寒武纪带来不小于2亿美元收入。寒武纪本身是中科院计算所孵化的国家级AI及芯片团队。在过去3年里已经进行3轮融资,B轮融资后,估值跃升到25亿美元,在国内AI芯片处于领先地位。

国内AI芯片产业逐渐入轨,越来越多的互联网系和科研孵化系企业希望加入未来的芯片格局。一片拇指大小的硅晶体,此时仿佛一把通往新世界的入场券,吸引着IC厂商与下游制造商竭力一搏。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1621872.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

体验首款Linux消费级平板,原来芯片和系统全是国产

晓查 梦晨 发自 凹非寺量子位 报道 | 公众号 QbitAI 国产OS,国产芯片,号称可以写代码,以生产力平板热议于海外的JingPad…… 真的有那么神吗? 不久前,我们介绍了由中国创业团队打造的移动操作系统JingOS,以…

分库分表之 Sharding-JDBC 中间件,看这篇真的够了!

本文大纲如下 Sharding-JDBC 的基本用法和基本原理前言1. 我的出生和我的家族2. 我统治的世界和我的职责3. 召唤我的方式4. 我的特性和我的工作方法4.3.1. SQL 解析4.3.2. SQL 路由4.3.3. SQL 改写4.3.4. SQL 执行4.3.5. 结果归并4.2.1. 逻辑表和物理表4.2.2. 分片键4.2.3. 路由…

粒子群算法的基本原理和Matlab实现

1.案例背景 1.1 PSO算法介绍 粒子群优化算法(Particle Swarm Optimization,PSO)是计算智能领域,除了蚁群算法,鱼群算法之外的一种群体智能的优化算法,该算法最早是由Kennedy和 Eberhart 在1995年提出的。PSO算法源于对鸟类捕食行为的研究,鸟类捕食时,每只鸟找到食物最简单有效…

【集合学习ConcurrentHashMap】ConcurrentHashMap集合学习

ConcurrentHashMap集合学习 一、JDK1.7 和 1.8 版本ConcurrenHashMap对比分析 JDK 1.7版本 在JDK 1.7版本ConcurrentHashMap使用了分段锁的方式(对Segment进行加锁),其实际结构为:Segment数组 HashEntry数组 链表。由很多个 …

I^2C总线简介

总共有五种工作状态: A:总线非忙状态 该状态时数据线(SDA)和时钟线(SCL)都保持高电平。 B:启动状态 当时钟线(SCL)为高电平状态时,数据线(SDA&…

Docker镜像列表中的none:none是什么

在构建过Docker镜像的电脑上查看本地镜像列表&#xff0c;有可能看到下图红框中的镜像&#xff0c;在列表中展示为<none>:<none>&#xff1a; 这种镜像在Docker官方文档中被称作dangling images&#xff0c;指的是没有标签并且没有被容器使用的镜像。 官方解释 …

三、JVM监控及诊断工具-GUI篇

目录 一、工具概述二、jconsole&#xff08;了解即可&#xff09;1、基本概述2、启动3、三种连接方式4、作用 三、Visual VM 一、工具概述 二、jconsole&#xff08;了解即可&#xff09; 1、基本概述 从Java5开始&#xff0c;在JDK中自带的Java监控和管理控制台用于对JVM中内…

系统架构设计高级技能 · Web架构

现在的一切都是为将来的梦想编织翅膀&#xff0c;让梦想在现实中展翅高飞。 Now everything is for the future of dream weaving wings, let the dream fly in reality. 点击进入系列文章目录 系统架构设计高级技能 Web架构 一、Web架构介绍1.1 Web架构涉及技术1.2 单台服务…

计算机组成原理 | 第一章 计算机系统概述

目录 计算机发展历程 计算机系统层次结构 计算机的性能指标 计算机发展历程 电子计算机的发展已经历了4代&#xff0c;这4代计算机的主要元件分别是电子管、晶体管、中小规模集成电路、大规模集成电路。微型计算机的发展以微处理器技术为标志。可以在计算机中直接执行的语…

快到家了【经济学人】

Refugees Almost home China has successfully absorbed many refugees from Vietnam. But it is ill-prepared for another influx Oct 10th 2015 | QIAOGANG, GUANGXI PROVINCE | From the print edition 来源&#xff1a;Economist 翻译&#xff1a;Z.K. IN A restaurant…

军事物联网如何改变未来战争模式?

军事物联网如何改变未来战争模式&#xff1f; 2017-05-08 17:45:17.0 你是否听说&#xff0c;在物联网的世界里&#xff0c;每一粒沙子都将拥有自己的IP地址。 互联网为我们创造了虚拟世界&#xff0c;与其一字之差的物联网&#xff0c;却为我们开辟了一个从虚拟转向现实的窗口…

去越南旅游,2万人民币能承担几天的花销?

2万人民币可以兑换6600多万越南盾,三年前我有一个同学带着一万块人民币,当时在越南生活了差不多三个月的时间。他之所以会去越南,主要是当时听人家说在越南农村好找老婆,并且彩礼会非常的少,所以就带着一万块钱先去看一看。虽然人回来的时候瘦了点黑了点,但是三个多月只花…

基于springboot学生社团管理系统/基于Java的高校社团管理系统的设计与实现

摘 要 随着信息技术和网络技术的飞速发展&#xff0c;人类已进入全新信息化时代&#xff0c;传统管理技术已无法高效&#xff0c;便捷地管理信息。为了迎合时代需求&#xff0c;优化管理效率&#xff0c;各种各样的管理系统应运而生&#xff0c;各行各业相继进入信息管理时代&…

QChart——折线

Qchart的图形显示依附于QChartView&#xff0c;创建一个QChartView继承类&#xff0c;通过窗口部件的提升进行图表的显示 一、简单认识QLineSeries QLineSeries属于折线类&#xff0c;它继承于QXYSeries类&#xff0c;可以使用QXYSeries类所有方法&#xff0c;对折线进行属性设…

前端需要理解的性能优化知识

优化的目的是展示更快、交互响应快、页面无卡顿情况。 1 性能指标 2 分析方法 使用 ChromeDevTool 作为性能分析工具来观察页面性能情况。其中Network观察网络资源加载耗时及顺序&#xff0c;Performace观察页面渲染表现及JS执行情况&#xff0c;Lighthouse对网站进行整体评分…

基于android的学生公寓后勤系统/学生公寓管理系统APP

摘 要 随着网络科技的发展&#xff0c;移动智能终端逐渐走进人们的视线&#xff0c;相关应用越来越广泛&#xff0c;并在人们的日常生活中扮演着越来越重要的角色。因此&#xff0c;关键应用程序的开发成为影响移动智能终端普及的重要因素&#xff0c;设计并开发实用、方便的应…

PCB设计常见问题

Fill Mode中存在3个选项 Solid&#xff08;Copper Regions&#xff09; Hatched&#xff08;Tracks/arcs&#xff09; None&#xff08;outlines&#xff09; 区别Solid&#xff08;Copper Regions&#xff09;过大电流的能力更强&#xff0c;且对于电路板存在的分布电容的干扰…

第三张鼠标键盘的高效使用

引言: 对于键盘的熟练使用更是一个网络时的基本技能所有要成为一个好的网络工程师我们应该熟练键盘操作已经能熟练的使用一些常用软件。––键盘和鼠标。速速度的唯一途径就是多演戏打字速快对今后的学习是有好处的。 一 鼠标和键盘 键盘和鼠标是两种常用的输入设备。 (一…

鼠标跟随的实现

鼠标跟随主要根据X,Y轴来计算 主要代码函数是 span[0].style.left event.clientX “px”; 计算X轴 span[0].style.top event.clientY “px”; 计算Y轴 <!DOCTYPE html> <html><head><meta charset"UTF-8"><title></title>&…

虚拟机Ubuntu内鼠标闪烁终极解决方案

话说这个问题很早就遇到了&#xff0c;最近才解决&#xff0c;不免唏嘘。 由于造成鼠标闪烁的原因有很多&#xff0c;鼠标闪烁的特点也有很多&#xff0c;因此网上也充斥着很多解决方案&#xff0c;这里一并做一下梳理&#xff0c;以节约各位看众时间。 1.通用解决方法 这个方…