Google炸场!最强轻量级、开放模型Gemma发布,个人PC就能用,内部员工:强是强,但名字取得让我混乱

想参与根多多学术讨论,请加qq群

链接直达:00后编程交流qq群

如果想要聊天交友,可以加qq群

链接直达:00后聊天交友处cp  欢迎大家加入

不同于OpenAI的闭源大模型,科技巨头如Google和Meta正积极投入开放模型的开发,以期实现技术上的领先。

2月21日,Google推出了其新一代开放AI模型——Gemma(https://ai.google.dev/gemma)。这款轻量级模型在技术上可与Meta的Llama 2模型相媲美。

从名称上看,新推出的Gemma与Google之前的Gemini模型容易混淆。对此,Google在官方公告中解释道,Gemma的设计灵感来源于Gemini,而拉丁语中的“Gemma”意为“宝石”。两者之间的主要区别如下:

首先,Gemma可以被视为Gemini的更小、更轻量级的版本。

其次,Gemma的设计初衷是为了让开发人员和研究人员更容易访问和使用,而Gemini的设计则更侧重于处理更复杂的任务。

尽管两种模型均可免费使用,但Gemma的免费套餐功能相对有限。

更为重要的是,Gemma模型可以在台式机或笔记本电脑上本地运行。

这款最新的模型提供了两种尺寸选择:Gemma 2B(拥有20亿参数)和Gemma 7B(拥有70亿参数)。每种尺寸都分别有预训练版本和指令调整版本可供使用。

模型权重将以许可商业授权的方式发布,同时 Google 也会发布一个新的负责任的生成式人工智能工具包,指导开发者、研究人员负责任地使用 Gemma 模型。

在 AI 中,参数是神经网络中确定 AI 模型行为的值,权重是存储在文件中的这些参数的子集。

Gemma 的发布,也是 Google 自 2022 年 OpenAI 推出 ChatGPT 以来发布的首个开放式 LLM,但这并不是 Google 对开放式 AI 研究的第一个贡献。在官方博客中,Google AI 团队表示, 其在过去带来了 Transformers、TensorFlow、BERT、T5、JAX、AlphaFold 和 AlphaCode 等重要的 AI 架构和工具集。

所以这一次,其也为所有主要框架提供推理和监督微调 (SFT) 工具链:JAX、PyTorch 和 TensorFlow(通过本地 Keras 3.0)。

还有随时可用的 Colab 和 Kaggle 笔记本,以及与 Hugging Face、MaxText 和 NVIDIA NeMo 和 TensorRT-LLM 等流行工具进行了集成,方便开发者更容易上手使用 Gemma。

经过预训练和指令调整的 Gemma 模型可在笔记本电脑、工作站或 Google Cloud 上运行,并能够部署在 Vertex AI 和谷歌 Kubernetes Engine 上。

除此之外,英伟达在今天宣布与 Google 合作,在包括本地 RTX AI PC 在内的所有英伟达 AI 平台上启动优化,用来加速 Gemma 的性能。

同尺寸下,最先进的性能

当然新模型的发布,难免要和业界已存在的大模型一较高下。Google 在发布一份 16 页的 Gemma 技术报告时,将其与 Meta 的 LLaMA 2(7B)、LLaMA 2(13B),以及 Mistral(7B)进行了性能对比。

Google 表示,“Gemma 2B 和 7B 与其他开放式模型相比,在其规模上实现了同类最佳的性能。”

Gemma 技术报告评测结果如下:

从学术基准角度来看,Gemma 7B 在数学、Python 代码生成、常识和常识推理任务的几个基准测试中,优于 Meta 的 Llama 2 7B 和 13B 模型。

详细来看,在 MMLU 基准测试中,Gemma 7B 模型不仅超过了所有规模相同或更小的开源模型,还超过了一些更大的模型,包括 Llama 2 13B。

Google:Gemma 是负责任的设计

对于 AI 模型的发布,Google 一直采取比较谨慎的态度。

这一次,Google 也特别强调,「Gemma 的设计是将 AI 原则放在首位。为了使 Gemma 预训练模型安全可靠,Google 使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外,他们还使用了大量的微调和人类反馈强化学习(RLHF),使指令调整模型与负责任的行为保持一致。为了了解并降低 Gemma 模型的风险,我们进行了严格的评估,包括人工红队、自动对抗测试和危险活动模型能力评估。」

此外,Google 还与 Gemma 一起发布了新的《负责任的生成式人工智能工具包》(https://ai.google.dev/responsible),以帮助开发人员和研究人员优先构建安全、负责任的人工智能应用。该工具包包括:

安全分类:发布 codelab(https://codelabs.developers.google.com/codelabs/responsible-ai/agile-classifiers),可使用最少的示例构建稳健的安全分类器。

调试:带来最新的模型调试工具 LIT(https://codelabs.developers.google.com/codelabs/responsible-ai/lit-gemma#0),可帮助开发者调查 Gemma 的行为并解决潜在问题。

指导:你可以根据 Google 在开发和部署大型语言模型方面的经验,获取模型构建者的最佳实践。

开放模型并不是指开源

最后,在很多专家学者来看,开源和开放权重的人工智能模型是确保聊天机器人透明度和隐私的重要步骤。

不过在发布 Gemma 之际,Google 特别强调了开源和开放模型的区别。其表示,“开放源代码的一个好处是,一旦发布,许可证就赋予用户完全的创作自主权。这为开发人员和最终用户获取技术提供了有力保障。另一个好处是,开放源码技术可以不受限制地进行修改,以适应最终用户的独特使用情况。”

但是 Gemma 遵循的规则是「开放模型」而非开源。开放模型的特点是可以免费获取模型权重,但使用、再分发和变体所有权的条款根据模型的具体使用条款而有所不同,这些条款可能不是基于开源许可证。

Gemma 模型的使用条款规定,个人开发者、研究人员和商业用户均可自由访问和重新分配这些模型。用户还可自由创建和发布模型变体。在使用 Gemma 模型时,开发者同意避免有害使用,这体现了 Google 对负责任地开发人工智能的承诺,同时也增加了对这项技术的使用。

之所以不用开源一词来形容 Gemma 的属性,在 Google 看来,现有的开源概念并不总能直接应用于 AI 系统,这就提出了如何在人工智能中使用开源许可证的问题。Google 所需要做的是,要澄清开源 AI 的概念,并解决衍生作品和作者归属等概念。

以下是修改后的内容:

Gemma 这个名字是否让你感到困惑呢?自从 Gemma 发布以来,它引起了众多 AI 从业者的关注,并有多家媒体将其与 Google 与 Meta 的 LLama 进行对比。

根据网友的分享,他们在 X 社交平台上展示了在 Macbook Pro M1 Max 32G 上安装了 Google 刚刚开源的 LLM gemma-7b 的经历,并表示“gemma-7b 的速度超过了 Llama 13 B”。

以下是他们进行的一个测试示例:

对 Gemma 感兴趣的朋友们,现在可以访问 Google 的官方网站(https://ai.google.dev/gemma)来亲自体验。

最后,回顾过去的三个月,Google 推出了多个产品。先是 Gemini,之后将 Bard 品牌名更名为 Gemini,并推出了更高级的版本 Gemini Advanced(类似于 ChatGPT Plus 的付费服务,请勿与 Gemini Ultra 混淆,该模型可与 OpenAI 的 GPT-4 相提并论)。

紧接着,Google 又推出了 Gemini 1.5,并带来了 Gemini for Workspace。据媒体报道,Google 内部还开发了一款名为“Goose”的产品,它是 Gemini 的后续版本,仅供内部使用,旨在帮助员工更高效地编写代码。

面对这些以“G”开头的名字不断涌现,据 Business Insider 报道,甚至连 Google 内部员工都感到有些无所适从,各种内部员工吐槽的表情包在网络上流传,有人甚至质疑:“哪位 VP 的 OKRs 是以 AI 产品名称的数量来衡量的?”

至此,你能准确分得清 Google 的各种模型吗?对最新发布的开放模型 Gemma 又有何看法?欢迎留言分享。

Google Gemma 官方博客:https://blog.google/technology/developers/gemma-open-models/

技术报告:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

使用地址:https://ai.google.dev/gemma

加入我们:

想参与根多多学术讨论,请加qq群

链接直达:00后编程交流qq群

如果想要聊天交友,可以加qq群

链接直达:00后聊天交友处cp  欢迎大家加入

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2807794.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

uni-app 实现拍照后给照片加水印功能

遇到个需求需要实现&#xff0c;研究了一下后写了个demo 本质上就是把拍完照后的照片放到canvas里&#xff0c;然后加上水印样式然后再重新生成一张图片 代码如下&#xff0c;看注释即可~使用的话记得还是得优化下代码 <template><view class"content"&g…

【ArcGIS】利用DEM进行水文分析:流向/流量等

利用DEM进行水文分析 ArcGIS实例参考 水文分析通过建立地表水文模型&#xff0c;研究与地表水流相关的各种自然现象&#xff0c;在城市和区域规划、农业及森林、交通道路等许多领域具有广泛的应用。 ArcGIS实例 某流域30m分辨率DEM如下&#xff1a; &#xff08;1&#xff09…

【新书推荐】7.6语句综合实战

本节必须掌握的知识点&#xff1a; 项目需求 示例二十八 综合实战&#xff0c;本小节将我们之前介绍的所有知识点结合在了一起&#xff0c;其目的就为了告诉大家&#xff0c;学了这么长时间的C语言了&#xff0c;我们可以做一些有趣的小游戏了。 7.6.1 项目需求 ■游戏界面 …

jQuery 基础、选择器和筛选器

【一】JQuery基础 【1】什么时Jquery &#xff08;1&#xff09;定义 jQuery是一个流行的JavaScript库&#xff0c;旨在简化JavaScript编程和处理HTML文档的任务。它提供了一组易于使用的功能和方法&#xff0c;可以加快开发速度并提高跨浏览器兼容性。一款轻量级的JS框架 …

vivado VHDL Objects、VHDL实体描述

VHDL对象包括&#xff1a;信号、变量、常量和运算符。 信号 在中声明VHDL信号&#xff1a; •体系结构声明部分&#xff1a;在该体系结构内的任何位置使用VHDL信号。 •一个块&#xff1a;在该块中使用VHDL信号。 使用<信号分配运算符分配VHDL信号。 signal sig1 : std…

matlab|计及源荷不确定性的综合能源生产单元运行调度与容量配置随机优化模型

目录 1 主要内容 1.1 风光场景聚类 1.2 主模型程序结果 1.3 随机模型和确定性模型对比 1.4 有无储气对比 1.5 煤价灵敏性分析 1.6 甲烷价格灵敏性分析 2 部分程序 3 下载链接 1 主要内容 本程序复现《计及源荷不确定性的综合能源生产单元运行调度与容量配置两阶段随机…

基础算法(算法竞赛)--排序区间合并火烧赤壁、堆 序列合并

1、B站视频链接&#xff1a;A21 排序 区间合并_哔哩哔哩_bilibili 题目链接&#xff1a;火烧赤壁 - 洛谷 #include <bits/stdc.h> using namespace std; #define N 20005 struct line{int l,r;bool operator<(line &t){return l<t.l;} }a[N];//定义结构体数组…

面向对象设计模式

一、单例 一个类只能创建唯一一个对象 利用限制构造、static完成 二、工厂模式 优势&#xff1a;规范接口&#xff08;纯虚函数&#xff09;&#xff1b;实现多态&#xff08;虚函数表&#xff09;&#xff1b;继承 1、简单工厂 一个工厂创建所有产品。 返回基类指针可…

µC/OS-II---两个系统任务

目录 空闲任务---OS_TaskIdle()统计任务---OS_TaskStat()统计任务初始化统计任务代码 OSInit()函数二者的协调使用 空闲任务—OS_TaskIdle() C/OS-II 规定&#xff1a;一个用户应用程序必须使用这个空闲任务&#xff0c;而且这个任务不能用软件来删除。优先级别&#xff1a;OS…

K线实战分析系列之七:行情顶部的看跌信号——黄昏星形态

K线实战分析系列之七&#xff1a;行情顶部的看跌信号——黄昏星形态 一、黄昏星形态二、黄昏线总结 一、黄昏星形态 二、黄昏线总结 黄昏星的高点形成阻力位&#xff0c;启明星的低点形成支撑位中间的星线实体与第一根K线的实体跳空区域比较宽&#xff0c;第三根K线覆盖了第一…

linux系统git仓库

git仓库 获取 Git 仓库&#xff08;初始化仓库&#xff09;创建裸库创建本地库 获取 Git 仓库&#xff08;初始化仓库&#xff09; 创建裸库 git仓库服务器创建useradd git passwd git mkdir /git-root/ cd /git-root/git init --bare shell.git #制作裸库chown -R git:gi…

Linux进程信号 ----- (信号保存)

前言 信号从产生到执行&#xff0c;并不会被立即处理&#xff0c;这就意味着需要一种 “方式” 记录信号是否产生&#xff0c;对于 31 个普通信号来说&#xff0c;一个 int 整型就足以表示所有普通信号的产生信息了&#xff1b;信号还有可能被 “阻塞”&#xff0c;对于这种多状…

在Win11上部署Stable Diffusion WebUI Forge

Stable Diffusion WebUI Forge 是 Stable Diffusion WebUI&#xff08;基于 Gradio&#xff09;之上的平台&#xff0c;可简化开发、优化资源管理并加快推理速度。“Forge”这个名字的灵感来自“Minecraft Forge”。这个项目旨在成为SD WebUI的Forge。 与原始 WebUI&#xff0…

MySQL数据库调优之关联查询、排序查询、分页查询、子查询、Group by优化

关联查询优化 1.准备工作 CREATE TABLE IF NOT EXISTS type(id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,card INT(10) UNSIGNED NOT NULL,PRIMARY KEY(id));CREATE TABLE IF NOT EXISTS book( bookid INT(10) UNSIGNED NOT NULL AUTO_INCREMENT, card INT(10) UNSIGNED N…

堆C++(Acwing)

代码&#xff1a; #include <iostream> #include <algorithm> #include <string.h>using namespace std;const int N 100010;int h[N], hp[N], ph[N], cnt;void heap_swap(int a, int b) {swap(ph[hp[a]] ,ph[hp[b]]);swap(hp[a], hp[b]);swap(h[a], h[b])…

1904_ARM Cortex M系列芯片特性小结

1904_ARM Cortex M系列芯片特性小结 全部学习汇总&#xff1a; g_arm_cores: ARM内核的学习笔记 (gitee.com) ARM Cortex M系列的MCU用过好几款了&#xff0c;也涉及到了不同的内核。不过&#xff0c;关于这些内核的基本的特性还是有些不了解。从ARM的官方网站上找来了一个对比…

[力扣 Hot100]Day33 排序链表

题目描述 给你链表的头结点 head &#xff0c;请将其按 升序 排列并返回 排序后的链表 。 出处 思路 归并排序即可。 代码 class Solution { public:ListNode* merge(ListNode *h1,ListNode *h2) {ListNode *head nullptr;if(h1->val<h2->val){head h1;h1h1-…

Sora:颠覆性AI视频生成工具

Sora是一款基于人工智能&#xff08;AI&#xff09;技术的视频生成工具&#xff0c;它彻底改变了传统视频制作的模式&#xff0c;为创作者提供了高效、便捷、高质量的视频内容生成方式。通过深度学习和自然语言处理等先进技术&#xff0c;Sora实现了从文字描述到视频画面的自动…

计算机体系架构初步入门

&#x1f3ac;个人简介&#xff1a;一个全栈工程师的升级之路&#xff01; &#x1f4cb;个人专栏&#xff1a;高性能&#xff08;HPC&#xff09;开发基础教程 &#x1f380;CSDN主页 发狂的小花 &#x1f304;人生秘诀&#xff1a;学习的本质就是极致重复! 目录 1 计算机五大…

数据结构-列表LinkedList

一,链表的简单的认识. 数组,栈,队列是线性数据结构,但都算不上是动态数据结构,底层都是依托静态数组,但是链表是确实真正意义上的动态数组. 为什么要学习链表? 1,链表时最简单的动态数据结构 2,掌握链表有助于学习更复杂的数据结构,例如,二叉树,trie. 3,学习链表有助于更深入…