Sora将创造多少算力需求?

1.1 Sora 训练与推理算力需求初步测算

Sora发布表现亮眼,Transformer+Diffusion架构或成为文生视频大模型新范式。据Sora技术报告,类似于LLM将不同文本数据统一为token,Sora可将不同类型的视频和图像等视觉数据统一为patches,具体而言,Sora首先将视频压缩为低维潜在空间,然后再将其分解为patch;同时,OpenAI将Transformer架构用于视频生成,随着训练计算量的提高,生成视频质量也明显提高。

Sora的作者之一Peebles曾发布论文《Scalable Diffusion Models with Transformers》构造成熟的Transformer+Diffusion架构模型用于图像生成;后续中国人民大学等机构发布《VDT: GENERAL-PURPOSE VIDEO DIFFUSION TRANSFORMERS VIA MASK MODELING》进一步实现该架构用于视频生成,我们借助上述论文中的模型参数,对Sora的算力需求进行测算:

1、训练端,由于模型架构较新,本文对《Scalable Diffusion Models with Transformers》论文中DiT-XL/4模型进行逆向工程,使得输入对应参数量后能够得到29.05Gflops,得到训练一张1024x768分辨率图片需要算力324Gflops,根据《Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning(Pablo 等著,2022 年)》 披露数据,Youtube上每分钟上传约500小时视频,假设视频都为60帧每秒;假设全采用英伟达A100(FP16 算力312Tflops)且芯片利用率为80%;得到一个月内训练完Youtube全部新增视频约需要231片A100,考虑到文中模型都是经过多次训练得到,算力需求仍有较大程度提高的可能性。

2、推理端,推理端算力约等于交互Patches数量*2*参数量,假设抖音8亿日活,平均每人每天使用时长2h,对应每天16个小时视频播放时长。假设每个Patch尺寸为60*80,一帧1920*1280分辨率的画面有512个Patch,一秒钟30帧,对应一分钟生成的视频有92.16万个Patches,假设Sora模型参数为30亿,则对应1846万个A100需求。

1.2合成数据:从数据增强走向训练主体

合成数据指的是基于生成式人工智能技术的计算算法和模拟创建而成的数据。据天翼智库,合成数据依赖少部分的高质量真实数据用于初始创建,将大幅减少算法训练所需的真实数据量,提供了一种更快捷高效的方式来获取所需数据;目前主要通过以下四种技术路径来获取合成数据:基于深度学习生成、基于模拟生成、基于语义规则生成以及基于蒙特卡罗方法生成。

合成数据主要分为结构化数据和非结构化数据两类,数据广泛覆盖金融、医疗、零售甚至运营商领域。据天翼智库,合成数据的产业布局可分为结构化数据(表格数据)、非结构化数据(视频、图像等)、测试数据等,合成数据的应用领域十分广泛,早期主要应用于计算机视觉领域,现在正向金融、医疗、零售甚至运营商领域拓展。

以多模态为代表的非结构化数据真正快速发展,英伟达、游戏引擎厂商纷纷入局。据《MatrixCity:面向城市规模的神经渲染数据集》,论文已经实现利用虚幻引擎5城市样本项目,作者开发了一个作业流程,以方便地收集空中和街道城市视图,伴随着地面真实的相机姿势和一系列额外的数据模式;论文的方法还提供对光线、天气、人类和汽车人群等环境因素的灵活控制,以支持涵盖城市规模的神经渲染等各种任务的需求。英伟达旗下Omniverse持续推动合成数据业务发展,并支持使用本地部署和 NVIDIA Omniverse™ Cloud解决方案使用合成数据来创建应用。

合成数据训练效果不断提升,到2030年AI训练中合成数据用量有望超过真实数据。据谷歌《Learning Vision from Models Rivals Learning Vision from Data》论文,尽管没有直接采用任何真实数据训练,SynCLR在 ImageNet数据集上训练的线性传递性能仍可与传统训练方法相媲美。由于合成数据也能填补真实数据集中可能存在的数据缺失、数据不足、数据不均衡等问题,提高机器学习算法的鲁棒性和泛化能力,据Gartner预测,到 2030 年合成数据将完全盖过 AI 模型中的真实数据,成为AI模型训练使用数据的主要来源。

风险提示

1)行业竞争加剧:目前国产软硬件尚未呈现出清晰的格局,芯片、数据库、操作系统等行业仍处于高度竞争状态,若后续行业竞争加剧,可能会影响公司的毛利率水平,进而影响相关公司的盈利能力。

2)公司技术发展不及预期:目前国内AI产业还在起步阶段,相关公司的技术路径、商业化能力仍有不确定性,若后续公司技术发展不及预期,或影响公司业绩增长前景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2808787.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

IDA使用-2023CICSN华中赛区pwn题逆向为例

文章目录 相关字节标识导入函数和导出函数找程序入口函数选项设置重命名CISCN2023华中赛区分区赛AWDIDA源码main 构造结构体sub_141B() 打开局部变量类型的视图增加变量类型重新定义变量类型再次设置变量类型并重新定义再次设置变量类型并重新定义再次设置变量类型并重新定义 设…

【数据结构与算法】(20)高级数据结构与算法设计之 Greedy Algorithm 贪心算法 代码示例与详细讲解

目录 4.2 Greedy Algorithm1) 贪心例子DijkstraPrimKruskal 2) 零钱兑换问题有几个解(零钱兑换 II)Leetcode 518最优解(零钱兑换)- 穷举法 Leetcode 322最优解(零钱兑换)- 贪心法 Leetcode 322 3) Huffman …

线程池的常用实现及执行流程

线程池 线程池线程池接口线程池参数线程池分类动态数目线程池固定数目线程池单例线程池任务调度线程池 线程池的执行流程 线程池 线程池接口 线程池参数 1、corePoolSize:核心线程数,线程池中最少线程,核心线程不会被回收。 2、maximumPoo…

6-pytorch-神经网络搭建

b站小土堆pytorch教程学习笔记 1.神经网络骨架搭建:Containers 官方文档代码: import torch.nn as nn import torch.nn.functional as Fclass Model(nn.Module):def __init__(self):super().__init__()self.conv1 nn.Conv2d(1, 20, 5)self.conv2 nn.…

nccl2安装指南

https://developer.nvidia.com/nccl/nccl-download 旧版本安装: https://developer.nvidia.com/nccl/nccl-legacy-downloads 找到你对应的CUDA版本 我这里选择 deb 文件安装了 sudo dpkg -i nccl-local-repo-ubuntu2004-2.16.5-cuda11.8_1.0-1_amd64.debsudo cp /var/nccl-lo…

深度解析:Integer.parseInt() 源码解读

深度解析:Integer.parseInt() 源码解读 关键要点 解析字符:用于将字符转换为对应的数字值 Character.digit(s.charAt(i),radix) 确定limit:根据正负号分别设定 int limit -Integer.MAX_VALUE;【正】 limit Integer.MIN_VALUE;【负】 负数…

车载测试面试:题库+项目

车载测试如何面试(面试技巧)https://blog.csdn.net/2301_79031315/article/details/136229809 入职车载测试常见面试题(附答案)https://blog.csdn.net/2301_79031315/article/details/136229946 各大车企面试题汇总(含答案&am…

mac下使用jadx反编译工具

直接执行步骤: 1.创建 jadx目录 mkdir jadx2.将存储库克隆到目录 git clone https://github.com/skylot/jadx.git 3. 进入 jadx目录 cd jadx 4.执行编译 等待片刻 ./gradlew dist出现这个就代表安装好了。 5.最后找到 jadx-gui 可执行文件,双击两下…

为什么TestNg会成为Java测试框架的首选?还犹豫什么,看它!

上一篇自动化测试我们大概了解了测试的目标、测试的技术选型以及搭建平台的目标及需求,也确定了自动化测试方案以testNg作为整个测试流程贯穿的基础支持框架,那么testNg究竟有什么特点?本篇开始我们来详细的学习testNg这个测试框架。 为什么要…

基于Android的校园请假App的研究与实现

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

java面试题之mysql篇

1、数据库索引 ​​​​​​​ 索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。如果想按特定职员的姓来查找他或她,则与在表中搜索所有的行相比,索引有助于更快地获取信息。 索引的一个主要…

protobuf简单使用(二)

介绍 上一节中,我们介绍了protobuf,简单来说,它是一种消息数据格式,其作用类似于json,但是比json的使用效率要高。 除此以外,我们介绍了protobuf的简单使用,也就是如何可以像使用json一样&…

Springboot+vue的社区医疗综合服务平台(有报告)。Javaee项目,springboot vue前后端分离项目

演示视频: Springbootvue的社区医疗综合服务平台(有报告)。Javaee项目,springboot vue前后端分离项目 项目介绍: 本文设计了一个基于Springbootvue的前后端分离的社区医疗综合服务平台,采用M(m…

五、数组——Java基础篇

六、数组 1、数组元素的遍历 1.1数组的遍历:将数组内的元素展现出来 1、普通for遍历:根据下表获取数组内的元素 2、增强for遍历: for(数据元素类型 变量名:数组名){ 变量名:数组内的每一个值…

面试经典150题【21-30】

文章目录 面试经典150题【21-30】6.Z字形变换28.找出字符串中第一个匹配项的下标68.文本左右对齐392.判断子序列167.两数之和11.盛最多水的容器15.三数之和209.长度最小的子数组3.无重复字符的最长子串30.串联所有单词的子串 面试经典150题【21-30】 6.Z字形变换 对于“LEETC…

【Java多线程】对线程池的理解并模拟实现线程池

目录 1、池 1.1、线程池 2、ThreadPoolExecutor 线程池类 3、Executors 工厂类 4、模拟实现线程池 1、池 “池”这个概念见到非常多,例如常量池、数据库连接池、线程池、进程池、内存池。 所谓“池”的概念就是:(提高效率) 1…

计网day5

六 传输层 6.1 传输层概述 6.2 UDP协议 6.3 TCP协议 TCP连接管理: TCP可靠传输: TCP拥塞控制:

[ROS 系列学习教程] rosbag 命令行介绍

ROS 系列学习教程(总目录) 本文目录 rosbag 命令行1.1 rosbag check1.2 rosbag compress1.3 rosbag decompress1.4 rosbag filter1.5 rosbag fix1.6 rosbag info1.7 rosbag play1.8 rosbag record1.9 rosbag reindex 有时我们需要将 topic 中的数据保存下来以便后面分析&#x…

istio实战:springboot项目在istio中服务调用

目录 一、前言二、准备工作三、问题排查四、总结参考资料 一、前言 在经过前面几天k8s和Istio的安装之后,开始进入最核心的阶段。微服务在抛弃传统的服务注册和服务发现之后,是怎么在istio怎么做服务间的调用的呢?本次实战花费了我2-3天的时…

【监控】grafana图表使用快速上手

目录 1.前言 2.连接 3.图表 4.job和path 5.总结 1.前言 上一篇文章中,我们使用spring actuatorPrometheusgrafana实现了对一个spring boot应用的可视化监控。 【监控】Spring BootPrometheusGrafana实现可视化监控-CSDN博客 其中对grafana只是打开了一下&am…