通用图形处理器设计GPGPU基础与架构(一)

GPGPU背景        

        GPGPU(General Purpose Graphics Processing Unit,通用图形处理器)脱胎于GPU  (Graphics Processing Unit,图形处理器)。GPGPU由于其强大的运算能力和高度灵活的可编程性,已经成为深度学习训练和推理任务最重要的计算平台。这主要得益于GPGPU的体系结构很好地适应了当今并行计算的需求。

  • 并行计算机是一些理单元的集合,它们通过通信协作快速解决一个大的问题。
  1. 处理单元可以是一个算术逻辑功能单元,也可以是一个处理器核心或整个计算节点。
  2. “通信”是指处理单元彼此之间的数据交互。通信的机制则明确了两类重要的并行体系结构,即共享存储结构消息传递结构
  3. “协作”是指并行任务在执行过程中相对于其他任务的同步关系,约束了并行计算机进行多任务处理的顺序,保障其正确性。

        指令流是由单个程序计数器产生的指令序列数据流是指令所需数据及其访问地址的序列。根据指令流数据流可以将并行计算机定义为以下四类:

        (1)单指令流单数据流Single Instruction Stream &.Single Data Stream,SISDSISD并不是并行体系结构。传统的单核CPU就是SISD的代表,它在程序计数器的控制下完成指令的顺序执行,处理一个数据。

        (2)单指令流多数据流(Single Instruction Stream &.Multiple Data Stream,SIMDSIMD 是一种典型的并行体系结构,采用一条指令对多个数据进行操作,向量处理器就是SIMD的典型代表。

        (3)多指令流单数据流(Multiple Instruction Stream &.Single Data Stream,MISDMISD是指采用多条指令(处理单元)来处理单条数据流,数据可以从一个处理单元传递到其他处理单元实现并行处理。通常认为脉动阵列(Systolic Array)结构是MISD的一种实例。

        (4)多指令流多数据流Multiple Instruction Stream &.Multiple Data Stream,MIMDMIMD是最为通用的并行体系结构模型。它对指令流和数据流之间的关系没有限制,通常包含多个控制单元多个处理单元各个处理单元既可以执行同一程序,也可以执行不同的程序目前大多数多核处理器就属于MIMD的范畴。

        指令级并行和数据级并行更适合在核内实现,因为它所需要的寄存器传输级(Register Transfer Level,RTL)通信和协作可以在核内以极低的延迟完成。因此,现代微处理器中每个核心都会综合运用流水化、超标量、超长指令字、分支预测、乱序执行等技术来充分挖掘指令级并行。相对来讲,MIMD的并行层次更高,会更多地利用多个处理单元、多个处理核心和多个处理器或更多的节点来实现。

        和4核、8核CPU相比,GPU则由数以千计的更小、更高效的核心组成。这些核心专为同时处理多任务而设计,因此GPU也属于通常所说的众核处理器。

        如图所示,CPU中大部分晶体管用于构建控制电路和存储单元,只有少部分的晶体管用来完成实际的运算工作,这使得CPU在大规模并行计算能力上极受限制,但更擅长逻辑控制,能够适应复杂的运算环境。GPU的控制则相对简单,对高速缓存的需求相对较小,所以大部分晶体管可以组成各类专用电路、多条流水线,提升了GPU的计算能力。同时,图形渲染的高度并行性也使得GPU可以通过简单增加并行处理单元和存储器控制单元的方式来提高处理能力和存储器带宽。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3226129.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

大模型应用中什么是SFT(监督微调)?

大模型应用中什么是SFT(监督微调)? 一、SFT的基本概念 监督微调(Supervised Fine-Tuning, SFT)是对已经预训练的模型进行特定任务的训练,以提高其在该任务上的表现。预训练模型通常在大量通用数据上进行训…

模型和应用,哪个更重要?

前言 2024 年 7 月 4 日,世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举行。百度创始人李彦宏在产业发展主论坛上发言,呼吁不要卷模型,要卷应用。 目录 四个要点 积极的观点 不合理性 总结 四个要点 李彦宏的呼吁…

【经典链表OJ】环形链表

一、题目要求 给你一个链表的头节点 head ,判断链表中是否有环。如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环,评测系统内部使用整数 pos 来表示链表尾连接到链表中的位置&…

2024年上海市安全员C3证证考试题库及上海市安全员C3证试题解析

题库来源:安全生产模拟考试一点通公众号小程序 2024年上海市安全员C3证证考试题库及上海市安全员C3证试题解析是安全生产模拟考试一点通结合(安监局)特种作业人员操作证考试大纲和(质检局)特种设备作业人员上岗证考试…

ATA-M4功率放大器在充粘液管道损伤检测中的应用

实验名称:充粘液管道损伤检测 实验原理:在管道上的传感器激发一束超声能量脉冲,此脉冲沿着管道长度方向向远处传播,并充斥整个圆周方向,在导波传播过程中遇到缺陷时,入射波会在缺陷处发生反射、透射&#x…

视频怎么压缩变小?最佳视频压缩器

即使在云存储和廉价硬盘空间时代,大视频文件使用起来仍然不方便。无论是存储、发送到电子邮件帐户还是刻录到 DVD,拥有最好的免费压缩软件可以确保您快速缩小文件大小,而不必担心视频质量下降。继续阅读以探索一些顶级最佳 免费视频压缩器选项…

不同深度的埋点事件如何微妙地改变广告系列的成本

/ 作者简介 / 本篇文章来自现金贷领域市场投放大佬 亮哥 的投稿,主要分享了在广告投放过程中,不同深度的埋点事件如何微妙地改变广告系列的成本的相关经验,相信会对大家有所帮助!同时也感谢作者贡献的精彩文章。 / 前言 …

多模态大模型时代下的文档图像智能分析与处理_多模态ocr

0. 前言1. 人工智能发展历程 1.1 传统机器学习1.2 深度学习1.3 多模态大模型时代 2. CCIG 文档图像智能分析与处理论坛 2.1 文档图像智能分析与处理的重要性和挑战2.2 文档图像智能分析与处理高峰论坛2.3 走进合合信息 3. 文档图像智能分析与处理 3.1 文档图像分析与预处理3.2 …

AI副业 | AI绘画+对话,轻松涨粉变现!(附教程)

最近有一个超有趣、超简单的创作形式火了起来,那就是“AI绘画搭配对话”。不需要复杂的技巧,只需要一个形象,加上一段生动的对话,就能轻松吸引无数眼球! 首先,挑选一个可爱的形象,它可能是你心仪…

MySQL体系架构解析

1.MySQL体系架构 1.1.MySQL的分支与变种 MySQL变种有好几个,主要有三个久经考验的主流变种:Percona Server,MariaDB和 Drizzle。它们都有活跃的用户社区和一些商业支持,均由独立的服务供应商支持。同时还有几个优秀的开源关系数据库,值得我们了解一下。 1.1.1.Drizzle …

暑期旅游季必备,用这款客服神器应对爆棚的客流咨询

解决暑期旅游客流高峰问题 暑期是旅游高峰季节,客流量剧增,客户咨询纷至沓来。在这个时候,如何高效处理客户的咨询成为每家旅游机构和景点不可忽视的挑战。 聊天宝快捷回复助手是一款强大的工具,可帮助企业在客流高峰期快速回复客…

手撕算法拿捏八大神经网络!叫我机器学习大师

八大神经网络通常指的是在深度学习领域具有里程碑意义的八种神经网络模型或架构。这些模型在特定任务上取得了显著的性能,或者在深度学习的发展中起到了关键作用。 以下是这八大神经网络的一个简要概述及其学习建议: 多层感知器 (MLP):最基本…

苹果手机短信功能停用怎么恢复?一分钟快速解决!

在使用苹果手机的过程中,可能会遇到短信功能突然停用的情况,这可能导致你无法发送或接收短信,影响日常通讯。这个问题可能由多种原因引起,如网络设置、软件冲突或运营商问题。 短信功能停用怎么恢复?不必担心&#xf…

提供跨平台的视觉安防解决方案,满足不同场景的需求的智慧交通开源了。

智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上…

凌凯科技前五大客户依赖症加剧:研发费用率骤降,应收账款大增

《港湾商业观察》黄懿 6月13日,上海凌凯科技股份有限公司(下称“凌凯科技”)在港交所提交上市申请,拟于主板上市,华泰国际为其独家保荐人。 凌凯科技致力于提供小分子化合物技术和产品解决方案,专注于制药…

Windows环境+C#实现显示接口测试

代码如下: using Models; using Newtonsoft.Json; using System; using System.Collections.Generic; using System.ComponentModel; using System.ComponentModel.Design; using System.Data; using System.Diagnostics; using System.Drawing; using System.IO; …

WPF引入多个控件库使用

目的 设计开发时有的控件库的一部分符合我们想要的UI样式,另一部分来自另一个控件库,想把两种库的样式做一个整合在同一个控件资源上。单纯通过引用的方式会导致原有样式被覆盖。这里通过设置全局样式的方式来实现。 1.安装控件库nuget包:H…

重生奇迹mu自带四重箭加穿透的弓

1.烈风射手 烈风射手是自带四重箭加穿透的弓之一。该职业的技能树中有一个叫做“四箭连发”的技能,可以让玩家在一次攻击中发射四支箭矢,每支箭矢都带有穿透效果。 2.影魅猎人 影魅猎人也是自带四重箭加穿透的弓之一。该职业的技能树中有一个叫做“穿…

开源项目有哪些机遇与挑战

目录 1.概述 2.开源项目的发展趋势 2.1. 开源项目的发展现状 2.2. 开源社区的活跃度 2.3. 开源项目在技术创新中的作用 3.参与开源的经验分享 3.1. 选择开源项目 3.2. 理解项目结构和文档 3.3. 贡献代码 3.4. 与开源社区的合作 3.5. 学习和成长 4.开源项目的挑战 …

跑GCN收敛实验时遇到的Python环境问题

错误1: 报错提示:No module named sklearn.utils.linear_assignment_ 原因:linear_assignment 函数从0.21开始被弃用了,并且将在0.23版本中移除。 解决方法:降低scikit-learn版本(本人通过该方法解决&#…