生成式AI竞赛:开源还是闭源,谁将主宰未来?

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

对于一些行业观察家来说,这场战斗似乎还没开始就已结束。当ChatGPT成为有史以来增长最快的应用程序,在仅仅存在两个月内就达到了1亿用户时,它提出了一个严肃的可能性——OpenAI和GPT-4可能会在大多数世界意识到比赛已经开始之前就占据市场。

并不是说1亿用户是一个不可逾越的用户基础。毕竟,谷歌搜索每个月有超过十五亿独立用户。这也不是ChatGPT品牌力量的问题(尽管作为流行文化中唯一广为人知的AI应用程序肯定有所帮助)。真正的优势在于数据。

“数据”包括用户和AI之间数亿次互动期间发生的一切。它包括使用模式、提示文本和新出现的问题。有了足够的数据,你可以构建一个不断完善和改进AI模型的良性反馈循环。数据是Bing无法挑战谷歌搜索的原因,尽管投入了数十亿美元和一半多十年的努力。拥有谷歌十分之一用户流量的Bing,永远限制在一个更小的洞察窗口,并且拥有更少的信息来微调其搜索算法。

所以,这是对未来生成式AI竞赛的最佳初步猜测。谁获得最多的数据,并将其投入到持续改进的循环中,谁就是赢家。

但事实并非如此。

先发优势正在消退


今天,我们看到一系列公司几乎每周都在发布惊人的新AI创新。最近的是Antrophic的Claude 3,一个在关键基准测试中击败GPT-4的LLM,比如生成代码的人类评估质量。(它今天可以在亚马逊Bedrock上获得。)上周是谷歌的Gemini,具有巨大的上下文窗口、可适应的代码生成和视频识别能力。在那之前的几周,我们看到了OpenAI的Sora的演示,它将文本转换成视频中的富有想象力的世界。Meta的Llama 3只有几个月的时间,提供几乎我们现在拥有的一切,而且是免费的。甚至苹果也在暗示其自己的秘密多年AI努力,它用来创建一个具有2000亿参数的内部GPT。

简而言之,世界上最富有和最先进的科技公司正在将它们庞大的资源投入到生成式AI中。我们开始看到一个模式,一个产品中的突破性功能被另一个产品复制然后超越。当前的共识已经转变,许多专家现在预计,随着模型的成长和领域的前进,最好的大型LLM将越来越相似。

如果几家公司有能力构建可以与行业最佳竞争的系统,谁会赢得生成式AI竞赛?如果OpenAI首先到达那里,而谷歌可以迅速跟进一个可比产品,这有关系吗?哪个科技巨头或灵活的AI初创公司拥有未来?

开源的吸引力


商业中有一个理论叫做创新者的困境,它解释了为什么领先公司会输给新兴挑战者。占主导地位的公司看到地平线上接近的竞争对手,但他们低估了风险,因为他们知道他们的产品质量更优。但问题在于。通常并不是纯粹的技术质量赢得了竞赛。如果竞争对手能够为市场上90%的人提供一个“足够好”的产品,而成本只有十分之一,它可以改变游戏规则。老牌公司可能会围绕剩下的(仍然有利可图的)10%的市场关闭行列,这部分市场仍然要求最好的最好。但他们的观众会年复一年地缩小,他们的死亡螺旋就开始了。

如果我们在AI中达到这样的转折点,情绪可能会迅速改变。闭源LLM的吸引力可能会在一夜之间几乎消失。我们已经看到AI生态系统中的重大转变。不久前,我们还在争论是否有人会用可比的开放模型挑战像GPT-4这样的大型LLM。人们对保护专有研究的担忧很严重,并且担心潜在的误用。但秘密很快就泄露出来了,像Llama 2这样的有能力的模型随之而来。现在第一个问题不是“OpenAI或谷歌或Anthropic的闭源产品有多好?”而是“Llama对我的用例来说足够好了吗?”和“尝试一下有什么坏处?”

“当免费、不受限制的替代品在质量上可比时,人们不会为受限模型付费。”

开源AI的局限


如果这是整个情况,结论将是显而易见的。最终和不可避免地,开源AI模型将超越它们的闭源表亲。然而,还有一些其他的问题需要考虑。首先,开源AI并不完全是开源的——至少不是以传统意义上的。

当我们谈论开源软件时,我们知道这意味着什么:每一位代码都是可供你检查甚至改变的。但当我们谈论开源AI模型时,承诺并不那么清楚。我们知道我们可以下载模型。我们可能可以访问其他细节,比如训练权重。然而,训练数据通常是保密的,这意味着开源模型是无法复制的。开源访问使得研究和理解AI模型变得更容易——并且可以在其上进行创新;例如,使用新的微调技术(如LoRA)。但只到某种程度。考虑Llama 2。它是不透明的。复制它的成本是禁止性的。而且它由一个巨大的公司控制,这个公司只会因为更多的开发者进入其生态系统而受益。

而且Llama 2没有使用规范的开源许可证,如Apache。Meta特别禁止某些类型的使用,比如使用Llama训练另一个模型。像这样的限制导致AI研究人员声称,像Llama这样的模型几乎没有为民主化访问做出贡献,反而更多地将权力集中在模型创建者手中。有些人称Meta的做法为开放洗白——换句话说,是使用开源的说法来洗掉底层闭源做法的污点。

有一些由基金会和非营利组织创建的较小模型,比Llama更开放,尽管能力较弱。但即便这些模型也遇到了一个重大障碍。分享一个AI模型很容易,但分享支持它们的AI基础设施要困难得多。这是生成式AI的最后挑战:计算能力的战斗。

赢家是拥有计算能力的人吗?

开源AI拥有是免费的,但运行并非免费。当然,所有软件都是如此,但在大型模型和AI驱动的应用程序的情况下,计算和内存需求可能是惊人的。在内部运行AI系统存在重大障碍。如果你 anyway需要一个云提供商来托管你的AI基础设施,那么支付AI计算基础设施和支付使用AI模型的区别可能看起来并不特别重要。

如果你正在考虑训练自己的模型,差距更大。即使你知道你需要重新构建一个开源模型的一切,你可能也缺乏预算和数据科学专业知识。理论上是开放的。

今天,世界上只有少数公司拥有专业硬件和资源来训练世界级的LLM。

这就是我们今天的位置。但LLM还不是成熟的产品,变化的速度还没有放缓到接近普通生活的程度。实际上,LLM正在同时朝两个方向发展——一方面变得更强大,另一方面变得更精简。不久我们将有选择使用nano LLM,我们可以在当前手机硬件上舒适地运行它。现在还为时过早,无法说未来的发展将围绕哪里工作的LLM还是坐落在价值万亿美元的科技公司中心、作为服务出租的庞大模型。

今天,我的赌注是不断扩展的开源AI社区中的进步将占上风。但这只代表一个可能的未来。胜者仍可能由单个闭源模型的突然能力跃进决定,或许是另一种类型的生成式AI(如文本到视频)。或者也许一个在开源生态系统中出现的激进新工具将解决看似难以解决的问题,使先进的AI系统变得更加容易获取和部署,比今天更是如此。我们只需要再等一点时间就能发现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2871488.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

C语言基础-内联函数在头文件中的定义

文章目录 前言inline关键字优点缺点使用注意 头文件中定义函数内联函数在头文件中的定义总结 前言 在软件开发过程中,大家可能很少会遇到inline关键字,也可能很少见到头文件中定义函数体。没有用过不代表不能了解,菜就多练!哈哈哈…

从零开始搭建游戏服务器 第三节 Protobuf的引入并使用

目录 上一节问题答案公布本节内容Protobuf介绍正文在build.gradle引入protobuf编写proto并生成使用生成的proto来进行数据传输 总结 上一节问题答案公布 上一节我们创建了ConnectActor,并且使用ConnectActorManager和connectId将其管理起来。 并且我们在收到客户端…

【Twinmotion】Twinmotion导入UE5

步骤 1. 在虚幻商城中安装“Datasmith Twinmotion导入器插件” 安装“面向虚幻引擎的Twinmotion内容” 2. 打开虚幻引擎,在插件中搜索“twinmotion”,勾选如下两个插件,然后重启虚幻引擎 3. 打开Twinmotion,随便添加一个物体 导出…

腾讯云2核2G免费服务器申请流程,2024免费服务器入口

腾讯云免费服务器申请入口 https://curl.qcloud.com/FJhqoVDP 免费服务器可选轻量应用服务器和云服务器CVM,轻量配置可选2核2G3M、2核8G7M和4核8G12M,CVM云服务器可选2核2G3M和2核4G3M配置,腾讯云服务器网txyfwq.com分享2024年最新腾讯云免费…

4.1_5 文件存储空间管理

文章目录 4.1_5 文件存储空间管理(一)存储空间的划分与初始化(二)存储空间管理——空闲表法(三)存储空间管理——空闲链表法(1)空闲盘块链(2)空闲盘区链 &…

VScode----debug调试python代码添加上额外命令(args)

这里写目录标题 问题描述问题解决 更多内容可以点击这里查看个人博客:个人博客 问题描述 在服务器上运行python代码时,总会添加上额外的参数一般是用jyputer或者终端直接加上命令,现在我在vscode调试远程代码的时候想要加上这些命令. 问…

DFL《384底丹 430万》 wf/df-udt/448/96/96/32预训练模型

384底丹430万迭代:点击下载 训练素材19万张来自于以下数据集: 【更新】DST全角度训练图集V3.1 WF512【2.6W张 6GB 】【人脸混合_WF】FFHQ女性人脸数据,预训练炼丹专用【金鱼基础模型库】用于补全SRC极限角度香港中文大学CelebA预训练集-WF5…

HarmonyOS NEXT应用开发—状态栏显隐变化

介绍 本示例介绍使用Scroll组件的滚动事件 onScroll 实现状态栏显隐变化。该场景多用于各种软件的首页、我的等页面中。 效果预览图 使用说明 加载完成后显示状态栏显隐变化页面,上下拖动屏幕,顶端状态栏出现显隐变化。 实现思路 在置顶位置使用sta…

Vue-router3.0版本跳转报错

1.路由创建之后发现控制台push路由跳转报错了 2.解决方法: //在router文件中添加 const originalPush VueRouter.prototype.push VueRouter.prototype.push function push(location) {return originalPush.call(this, location).catch(err > err) }3.解决了

webpack5零基础入门-10babel的使用

Babel JavaScript 编译器。 主要用于将 ES6 语法编写的代码转换为向后兼容的 JavaScript 语法,以便能够运行在当前和旧版本的浏览器或其他环境中 1.安装相关包 npm install -D babel-loader babel/core babel/preset-env 2.进行相关配置 2.1第一种写法是在webp…

Day67:WEB攻防-Java安全JNDIRMILDAP五大不安全组件RCE执行不出网

知识点: 1、Java安全-RCE执行-5大类函数调用 2、Java安全-JNDI注入-RMI&LDAP&高版本 3、Java安全-不安全组件-Shiro&FastJson&JackJson&XStream&Log4j Java安全-RCE执行-5大类函数调用 Java中代码执行的类: GroovyRuntimeExecPr…

git如何回退版本reset和revert命令的区别

文章目录 git回退版本的方法使用reset回退使用revert回退 总结 git回退版本的方法 Git回退到某个版本有两种方法&#xff1a;reset和revert。 使用reset回退 git reset --hard <版本号>该命令将HEAD指针移动到指定的版本&#xff0c;并重置工作目录和暂存区的内容。这…

微信小程序Skyline模式自定义tab组件胶囊与原生胶囊平齐,安卓和ios均自适应

进入下面小程序可以体验效果&#xff1a; 至于原理的话&#xff0c;解释起来毕竟麻烦&#xff0c;各位可以看源码自己分析。其实很简单&#xff0c;就算计算布局。很多网上公布的布局&#xff0c;都不能正常自适应。在下这个是完美可以的 1、WXML <view class"weui…

【遍历方法】浅析Java中字符串、数组、集合的遍历

目录 前言 字符串篇 1.1 使用 for 循环和 charAt 方法 1.2 使用增强 for 循环&#xff08;forEach 循环&#xff09; 1.3 使用 Java 8 的 Stream API 最终效果 数组篇 2.1 使用普通 for 循环 2.2 使用增强型 for 循环( forEach 循环) 2.3 使用 Arrays.asList 和 forE…

Python之Web开发中级教程----配置数据库

Python之Web开发中级教程----配置数据库 在settings.py中保存了数据库的连接配置信息&#xff0c;Django默认初始配置使用sqlite数据库。 DATABASES { default: { ENGINE: django.db.backends.sqlite3, NAME: os.path.join(BASE_DIR, db.sqlite3), } } 如果需要用MySQL数据…

LeetCode 0310.最小高度树:拓扑排序秒了

【LetMeFly】310.最小高度树&#xff1a;拓扑排序秒了 力扣题目链接&#xff1a;https://leetcode.cn/problems/minimum-height-trees/ 树是一个无向图&#xff0c;其中任何两个顶点只通过一条路径连接。 换句话说&#xff0c;一个任何没有简单环路的连通图都是一棵树。 给你…

nginx做静态代理方式

改配置文件 server {listen 8899;server_name localhost;location / {root html;index index.html index.htm;} } 生成页面代码 例子 GetMapping("createIndex")public Result createIndex() {//获取后台存储数据Result result productFeignClient.getB…

python之万花尺

1、使用模块 import sys, random, argparse import numpy as np import math import turtle import random from PIL import Image from datetime import datetime from math import gcd 依次使用pip下载即可 2、代码 import sys, random, argparse import numpy as np imp…

Linux环境开发工具之yum

前言 前面我们已经对基本的指令和权限进行了介绍&#xff0c;本期开始我们将介绍常用的开发工具。例如&#xff1a;软件包管理器yum。 本期内容介绍 Linux上安装软件的方式 什么是yum yum的相关操作 yum的本地配置和yum源 一、Linux上安装软件的方式 在介绍Linux上如何安装一…

Docker 安装 Skywalking以及UI界面

关于Skywalking 在现代分布式系统架构中&#xff0c;应用性能监控&#xff08;Application Performance Monitoring, APM&#xff09;扮演着至关重要的角色。本文将聚焦于一款备受瞩目的开源APM工具——Apache Skywalking&#xff0c;通过对其功能特性和工作原理的详细介绍&am…