2023 re:Invent AI 生成产品体验,从 Bedrock 到 Amazon Q

image.png

如果你也有如下问题,那么接下来的文字会一一为你解答

  1. 一套数据集,如何微调不同类型的开源大模型?—— Bedrock

  2. 如何只有产品说明书,如何构建一个智能问答机器人?—— Q

  3. 哪里还有免费的 GPU 算力——在线 Jupyter 平台?—— SageMaker

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

发布会

亚马逊云科技 re:lnvent 发布会,在 2023 年11月底于拉斯维加圆满召开,介绍了一些云产品的升级,以及自研芯片的升级、性能提升。当然今年的重头戏就是 AI,此次升级了Bedrock服务提供了更多功能,并推出了企业级 AI 助手——Q),对于 ML 研究者,升级后的 SageMaker 提供了和 Jupyter 一致的机器学习(ML)环境。

AI 云服务

此次发布会,我最关注的亚马逊的 AI 服务,我发现它在这上面做了非常多的差异化功能,相较于 openAI,微软、Google 等 AI 云服务公司,亚马逊云的 AI,这些功能是独居特色的的:

  1. 保护用户隐私、不会用用户的数据来训练

  2. 支持定制化得模型数据

  3. 对 fine tunning 优化,不需要太多专业知识就能微调大模型

  4. 模型价格便宜,微调之后的模型成本有所提升,但依然比 GPT3 便宜。

在当前 AI 淘金潮中,亚马逊坚持做最好的——“铲子”

面向开发者

如何让普通 IT 人员也能上手 AI 产品

作者我作为后端研发,天天 CURD 做业务。对于 AI 大模型,只会用用聊天机器人,用文字描述生成图片。至于如何训练、调试大模型我是丈二和尚——摸不着头脑,大家都在聊,AI 赋能产品,作为一名普通 IT 人员,当前只能“玩玩”它,至于产品赋还把握不住。当前时间点,但凡一个降低 AI 使用门槛的工具开源,那都是 10k Star 级别的热度,例如: lang-chain, hinese-LLaMA-Alpaca, LLaMA-Factory

所以,作为普通人,是非常愿意接触 AI 的,但目前开源 AI 产品对于普通人来讲,还是有非常高的使用门槛。现在就有很多云服务商就开始做人与 AI 算法产品之间的衔接工作。

Bedrock

Bedrock – Amazon 提供一个简单的入口,让大家能够快速构建起生成式人工智能应用程序。它的能力有这几个方向:

  • 文本生成

  • 聊天机器人

  • 向量搜索

  • 文本摘要

  • 图像生成

Bedrock 采用了市面上优秀开源的模型,来完成如上工作。模型有:

  • Jurassic-2

  • Claude

  • Command

  • Stable Diffusion

  • Llama 2

当然亚马逊自己也研发了大模型——Titan

小试身手

我们要试用大模型,还需要申请模型权限,其实就是勾选一下。

image.png

Chat 模型

这里体验了一下 LLama 2 13B, 具体使用情况如下:

image.png

文生图

使用 SDXL 1.0 生成了一张 1024\*1024 图片,耗时 20s 左右。

image.png

我又试用了一下 亚马逊的 Titan Image G1 模型, 同时生成了3张 1024\*1024 图,大概花了30+s

image.png

对了,如果一下生成多张图片,批量下载时会压缩成一个 zip 包再下载。但我用过后,发现这个 zip 包解不开,感觉这个压缩有问题,如果大家也遇到了,可以点开图片,一张张单独下载,就好了。关于: Amazon Bedrock Image playground,the zip of the generated image cannot be extracted

微调

相较于我们平常用的 ChatGPT3.5、4 两代通用模型, 亚马逊提供了可定制性、可微调,可以使用保存在云上语料库、知识库进行训练(fine tunning)。

也就是说你可以通过使用大量的数据微调大模型,让模型学习到新的东西,你再向模型提问时,就不需要提供冗长的上下文信息了,这样可以节约大量的 token,还能提高模型响应速度。

创建 Fine-tunning 任务

通过 Custom models 选择 Fine tuning job 就能

image.png

微调任务,你只需要提交数据集即可,数据集的格式,你可参看这个文档。datasetformat

image.png

这样就创建好 微调模型任务了,然后这个模型就是为你定制的,要是用这个 微调模型,还需要额外购买时间的,这个费用也不低,如果你的用量大,微调模型的性能是能抹平这部分成本的。

价格

Bedrock pricing

Meta Llama 2

按需和批量定价 

模型定制(微调)的定价:

Stability AI

相较于 GPT 系列,价格要便宜很多,因为模型大小可选,通用型不如 GPT,但提供了定制、预训练、微调功能,提供更具性价比的模型服务。

优势

Bedrock提供一站式的:多种开源大模型,以及配套的模型微调,dataset 预处理功能。在 Bedrock 你只需要熟悉一个模型的使用、调优、数据投喂功能,那么你就能使用其他所有同类型模型了,如果是自己调适多个模型,那么不同模型的 dataset 格式、调优参数都是巨大的时间成本。

在重度、商业化使用条件下,是占有成本、速度优势的。如果你有海量大模型使用请求,并且每次请求都要带上长长的上下文信息,那么不妨试试微调大模型。

企业级 AI 助手——Q

 > Amazon Q 是基于 Amazon Bedrock 构建一款完全托管的生成式 AI 驱动的企业聊天助手

最近登录亚马逊后台时,我就发现 Q 已实装到亚马逊云的控制台了。是的,它的主要形态就是聊天助手。通过聊天的形式为你提供服务,就是 IM 客服。

image.png

借助 Q 的能力,能够帮助普通用户快速了解亚马逊云服务,如果可能它还会提供对应的链接地址,大家点击就能跳转到对应的页面。让一般用户在没有专业的亚马逊技术售前的协助下,也能完成一些工作,这就是为 console 平台“增效”了。

定制自己的 Q

亚马逊云控制台里的 Q,可以说是 Q 的最佳实践。那么接下来,我就带大家来定制一个 IM 技术客服。

创建 应用

访问 Amazon Q 控制台, 创建一个应用

image.png

目前 Q 还是预览版,没有全球发布,所以制定地区可用,这里选的 弗吉尼亚。

第一步:命名

这里使用默认值,不用改,点下一步。授权可能会耽搁点时间,等一会儿就好。

image.png

第二步:Retriever 选择

如果不清楚就直接选择 native retriever。

image.png

第三步:数据源

数据源空过,直接脱到底创建。

image.png

体验

点击刚刚创建 Q application,进入到这个应用

image.png

空白的体验

点击 review web experience 就进入了一个聊天室。

当前,我们还没有上传任何文档,也没有配置 retriever,我们问它几个问题试试。

image.png

它直接回复没有数据源,不知道。

数据源添加

回到我们的应用主页面,点击 Add data source

image.png

这里我们选择上传文档,点击 Upload docs

image.png

关于数据源,我选择了 Codis 的文档。

image.png

上传文件, 他是支持 markdown 文件的,我就上传了 tutorial_en.md, FAQ_en.md 两个文件。

image.png

学习后的对话

上传文档后,我们再来问问 Q。可以看到它能根据我们提供的文档,进行回答了。

image.png

image.png

后面还跟上了数据源,也就是它的回答依据是哪些文档。

中文

大家都看到了我一直都在使用的英文和它交流,因为目前的预览版对中文的支持还不那么好,我这也上传了些中文文档,然后进行对话提问,结果如下。

还是比较期待它能完全支持中文,到时候就能赋能国内业务了。

image.png

感受

相比于其他 AI 产品,需要准备大量数据集,预训练,参数调优,以及服务部署。

你只要投喂文档、数据给 Amazon Q ,他就能成为某方面的专家,按照你的文档回答问题,你可以说它是一个更聪明的搜索引擎,或者智能客服。

整个体验下来,我觉得不懂 IT 的朋友也能上手,目前亚马逊对它的定义是——生成式 AI 驱动的企业聊天助手。从它的易上手程度、以及智能程度。我觉得它可以用作:

  • 个人知识库助手

  • 企业知识库搜索入口

  • 智能客服

  • 售后技术顾问

刚刚是在亚马逊的 Web 上体验了 Q,它当然提供了 API 供你介入自己应用内部。

响应速度

10词/秒 左右

我在 Web 端体验是这样的速度。不同于 ChatGPT 一个个字得吐,Q 是生成完所有文字后一次性返给前端,所以给人感觉是有点慢。但这个输出速度,其实和人打字速度差不多了。

价格

Amazon Q pricing

AI 技术顾问

就拿 AI 技术顾问为使用场景,我们把产品的使用文档,以及常见问题,以及解决方案投喂给 Q,Q 就可以按照用户的提问,帮文档去查找解决方案,并告诉客户。

是的,当你提供的云服务控制面板报错时,不需要让客户到处去百度,xx 云平台报错该怎么办了,这个时候,右下角弹出一个 Q ,咨询下客户遇到了什么问题,就能引导客户自行解决问题了。

相较于传统技术支持:

  1. 免费版没有技术支持

  2. 标准版工作日工单支持(工单还要排队

  3. 专业版 工作日通过IM技术支持。

  4. image.png

借助 Q 可以做到7*24小时 秒级支持我们的客户!便宜的价格可以让 Q 下放到标准版,甚至 使用版。

对于一些专业、有一定使用门槛的产品,借助 Q 是能够降低产品的使用难度,特别是在试用阶段,在新用户遇到困难并立马解决,是能提高成单率的。

增效

想象一下你需要客服,来解决售后问题,客服在客户和技术人员之间沟通解决问题,并把这些问题记录下来,慢慢得你积累了很多问题集——F&Q。慢慢地,客服反馈有些问题看看产品说明就能解决,但客户就是要打电话咨询。

这个时候,你把这些售后问题投喂到 Q 的 dataset,Q 就立马成为一名经验丰富的客户,能够帮客户解决一些常见问题了,解决不了的再接入到人工客服了。

SageMaker

SageMaker 提供专为数据科学家和开发人员高效地准备、构建、训练和部署高质量 ML 模型而构建的机器学习 (ML) 功能。

当团队内的数据专家,想进一步对数据做分析时,无需把数据下载到本地,亚马逊提供了在线 Jupyter 平台,通过它你可以在任何终端访问 Notebook 进行数据分析工作,一切运算都在云端,数据通过 S3 访问,让你无需担心本地磁盘,以及算力。

创建 Notebook

访问 SageMaker,翻到 Notebook, 点击 Create notbook instance

image.png

这里填了的不用改,只需要填一下名字就行了。

image.png

打开 Jupyter

创建好 notebook 实例后,点击 Open Jupyter 就能到一个你熟悉的界面了

image.png

是的,这就是 亚马逊云提供服务的 Jupyter。你看到的 Running 状态,就是我没有关闭那个实例,所以,你不用了的话记得手动关闭运行时,它不会自己关,程序会一直为你保存工作状态,随时衔接工作。哎,这样就不用写额外代码去保存中间状态了。(PS:说的就是你 Colab)

访问 S3 数据

那么如何访问 S3 数据呢

image.png

通过如上代码,说明 SageMaker 是和 S3 打通了的。只需要配置好数据权限,数据分析人员就能自己拿数据进行分析工作了。

SageMaker Studio

对了, 亚马逊还推出了 SageMaker Studio 一个免费的机器学习(ML)开发环境。独立于亚马逊的账号体系,目前是需要申请的,我的申请一天就过了,还是挺快的。(想白嫖的早点申请,😄)

image.png

用过 Colab,Kaggle 的同学,可以试试这个平台。每天免费4个小时的 GPU 算力,如果你只用 CPU 的话,那么会有8个小时运行时可供你用。

这个免费算力发放策略和 Colab 比较像啊,访问不了Google 的同学可以试试这个。

image.png

启动运行时之前,会让你填手机号,我填的国内的+86手机号,是可以畅通使用的。

image.png

访问速度

目前,我访问 Studio 没有网络障碍,大家放心冲。

生态

这场 AI 热潮,亚马逊云不仅仅是提供了大模型给大家使用,还围绕达模型的训练、调优、运行提供了一整套服务。

image.png

安全

作为云服务商,亚马逊非常重视用户的数据安全,并且公开承诺不会用客户的数据去改进他们的模型,至于他们怎么改进模型,估计是基于自己的业务。

image.png

还有生成的内容安全,由于 AI 生成模型,参数众多,可能你都不知道训练出来的模型,可能学到了什么坏毛病,关于这一天,Bedrok 提供了跟踪,以及完善的日志功能,并切发现错误会帮你屏蔽内容输出,同时也会检查用户的输入,

image.png

例如:我在玩文生图时,有几个词汇过于涩涩就直接告警,不给我生成图片。

image.png

跑得快不一定赢,不跌跟头才是成功

在国内环境下,这些功能都是必须的,它已经先一步帮我们想到了。

最后

看过发布会,体验过 Q 之后,个人感觉距离 AI 产品更近一步了。在当前隐私泄露严重,滥用个人信息的环境下,生成式 AI 这个婴儿在一旁嗷嗷待哺(数据投喂),还有一个云服务商把客户的安全、隐私放在第一位,是难能可能可贵的。

本文参与了「构」向云端 | 亚马逊云科技 x 思否 2023 re:Invent 构建者征文大赛,欢迎正在阅读的你也加入。

授权声明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 Developer Centre,知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道

文章来源:2023 re:Invent AI 生成产品体验,从 Bedrock 到 Amazon Q

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2821869.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

JQMobile Loader Widget 遮罩层改造

最近在用jqmobile 做一个混合APP项目时候用到 jqmobile1.4.3提供的Loader Widget控件,但是这个控件本身是一个loading弹出层,这个弹出层弹出之后,用户还是可以去点击按钮,重复发送请求,为了防止重复提交,我想了两种办法, 1,在loading弹出层弹出之后,让按钮不可用.但是form表单…

DC28V270V转AC36V115V航空逆变器

在当今的航空航天电源行业中,DC28V270V转AC36V115V航空逆变器发挥着至关重要的作用。作为一种关键的逆变器电源设备,DC28V270V转AC36V115V航空逆变器不仅在航空领域有着广泛的应用,还在许多其他领域发挥着重要作用。 一、DC28V270V转AC36V11…

源码的角度分析Vue2数据双向绑定原理

什么是双向绑定 我们先从单向绑定切入,其实单向绑定非常简单,就是把Model绑定到View,当我们用JavaScript代码更新Model时,View就会自动更新。那么双向绑定就可以从此联想到,即在单向绑定的基础上,用户更新…

GoFrame:如何简单地搭建一个简单地微服务

一切资料来源于GoFrame官网, 感兴趣的, 可以直接去官网查阅相关资料。 首先下载框架工具, 下载地址:https://github.com/gogf/gf/releases 然后进入你想要放置的项目文件夹, 执行命令行 gf init {project_name} #project_name为你的项目名 执行完后项目结构如图所示 然…

Java ElasticSearch-Linux面试题

Java ElasticSearch-Linux面试题 前言1、守护线程的作用?2、链路追踪Skywalking用过吗?3、你对G1收集器了解吗?4、你们项目用的什么垃圾收集器?5、内存溢出和内存泄露的区别?6、什么是Spring Cloud Bus?7、…

Java构造方法总结(很清晰)

构造方法扫盲:构造方法就是为了创建对象的 解释:真正创建对象的是 new 这个关键字,Java 虚拟机在创建对象时是有很多步骤的,构造方法只是其中的一步,它的作用是进行成员变量初始化。

AI大预言模型——ChatGPT在地学、GIS、气象、农业、生态、环境等应用

原文链接:AI大预言模型——ChatGPT在地学、GIS、气象、农业、生态、环境等应用 一开启大模型 1 开启大模型 1)大模型的发展历程与最新功能 2)大模型的强大功能与应用场景 3)国内外经典大模型(ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Di…

强大而灵活的python装饰器

装饰器(Decorators) 一、概述 在Python中,装饰器是一种特殊类型的函数,它允许我们修改或增强其他函数的功能,而无需修改其源代码。装饰器在函数定义之后立即调用,并以函数对象作为参数。装饰器返回一个新…

微信小程序云开发教程——墨刀原型工具入门(安装以及基础使用教程)

引言 作为一个小白,小北要怎么在短时间内快速学会微信小程序原型设计? “时间紧,任务重”,这意味着学习时必须把握微信小程序原型设计中的重点、难点,而非面面俱到。 要在短时间内理解、掌握一个工具的使用&#xf…

储能:储能大会“共建储能生态链,共创储能新发展”

数字储能网讯:由中国化学与物理电源行业协会主办,中国化学与物理电源行业协会储能应用分会和中国储能网联合承办的第十四届中国国际储能大会暨展览会将于2024年3月10-12日在杭州国际博览中心召开,大会主题为“共建储能生态链,共创…

模板初阶的补充和string一些函数的用法

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 模板初阶的补充 一、C语言中的字符串 二、标准库中的string类 2.1 string类(了解) 2.2 string类的常用接口说明(注意下面我只讲解最常用的接口&…

深度学习-回顾经典AlexNet网络:山高我为峰

深度学习-回顾经典AlexNet网络之山高我为峰 深度学习中,经典网络引领一波又一波的技术革命,从LetNet到当前最火的GPT所用的Transformer,它们把AI技术不断推向高潮。2012年AlexNet大放异彩,它把深度学习技术引领第一个高峰&#x…

[数据集][目标检测]鸡蛋破蛋数据集VOC+YOLO格式792张2类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):792 标注数量(xml文件个数):792 标注数量(txt文件个数):792 标注类别…

汽车虚拟仿真技术的实现、应用和未来

汽车虚拟仿真技术是一种利用计算机模拟汽车运行的技术,以实现对汽车行为的分析、评估和改进。汽车虚拟仿真技术是汽车工业中重要的开发设计和测试工具,可以大大缩短产品研发周期、降低研发成本和提高产品质量。本文将从汽车虚拟仿真技术的实现过程、应用…

深入解析Golang的encoding/ascii85库:从基础到实战

深入解析Golang的encoding/ascii85库:从基础到实战 引言基础知识什么是ASCII85编码?ASCII85编码的工作原理ASCII85编码的优点ASCII85编码的缺点 使用Golang的encoding/ascii85库引入encoding/ascii85包ASCII85编码ASCII85解码实战示例小结 进阶技巧和最佳…

msvcp140.dll安装教程_最新msvcp140.dll丢失的解决方法

msvcp140.dll 是一个动态链接库 (DLL) 文件,它是 Microsoft Visual C 运行时库的一部分,特别对应的是 Visual Studio 2015 版本编译的 C 应用程序所需的关键组件。DLL 文件的设计目的是为了实现代码和数据的共享,这样多个应用程序就可以在同一…

python中自定义报错

class MyError(Exception):def __init__(self,num):#录入的数Exception.__init__(self)self.numnumdef __str__(self):return 这是我定义的第%d个异常 %(self.num)使用 try:raise MyError(4) except MyError as e:print(e)raise 其作用是指定抛出的异常名称,以及异常…

瑞_Redis_Redis的Java客户端

文章目录 1 Redis的Java客户端1.1 Jedis快速入门1.1.1 入门案例1.1.1.1 项目构建1.1.1.2 引入依赖1.1.1.3 建立连接1.1.1.4 释放资源1.1.1.5 测试1.1.1.6 完整测试类代码 1.1.2 Jedis连接池1.1.2.1 连接池工具类1.1.2.2 改造原始代码 1.2 SpringDataRedis1.2.1 RedisTemplate1.…

锐捷网络携数据中心、以太全光等创新解决方案亮相2024MWC

在西班牙巴塞罗那举行的2024年世界移动通信大会(MWC)上,锐捷网络(下文简称“锐捷”)展示了将技术与应用充分融合的云数据中心、5G、光网络等产品及解决方案,帮助更多行业组织建设更贴近业务、智能、简单、高效、绿色低碳的网络基础设施,应对当下及未来的挑战,共同连接更广阔可能…

都说了能不动就别动,非要去调整,出生产事故了吧

MyBatis 替换成 MyBatis-Plus 背景介绍 一个老项目,数据库用的是 MySQL 5.7.36 , ORM 框架用的 MyBatis 3.5.0 , mysql-connector-java 版本是 5.1.26 新来了一个干练的小伙,精力充沛,看着就是一个喜欢折腾的主 他…