聚焦亚马逊云科技 re:Invent re:Cap专场,重构生成式AI的无限可能!

摘要:12月14日至17日,第十二届全球软件案例研究峰会(简称TOP100summit)在北京国际会议中心成功举办,亚马逊云科技资深开发者布道师郑予彬、亚马逊云科技解决方案研发中心应用科学家肖宇、可以科技产品负责人曹临杰、亚马逊云科技解决方案架构师莫梓元、PingCAP TiDB Serverless 研发负责人孙晓光、亚马逊云科技资深技术讲师魏星作为《亚马逊云科技 re:Invent re:Cap专场》讲师,在生成式AI方面给予了分享和实践的启发。

首先由郑予彬为大家带来了《生成式AI驱动以开发者为中心的AIOps优化》的干货分享。她分别从DevOps的发展和实践、AIOps的机遇和挑战、利用re:Invent 推出的AI新技术全面实现AIOps、AIOps的未来展望等四个方面进行了详述。

亚马逊云科技资深开发者布道师 郑予彬

如今,企业拥有广泛的模型选项来为其生成式 AI 应用程序提供支持。在具体应用场景中,为了在准确性和性能之间取得适当的平衡,企业必须有效地比较模型并根据其首选指标找到最佳选择。对于每个新场景模型,这些通过主观比较所需的时间、专业知识和资源限制了企业对生成式 AI 的使用。

生成式AI技术栈包括三层架构,自下而上有基础设施层、基础模型服务层、AI应用层。最下层的基础设施层有大家熟悉的GPU的使用,还有亚马逊专门为训练和推理自研的芯片,还有其他的一些基础设施。

亚马逊自研的模型Amazon Bedrock 可从 AI21 Labs、Amazon、Anthropic、Cohere、Meta 和 Stability AI 等行业领先的基础模型中选择最适合模型,同时它具备跨组织系统和数据源执行多步骤任务,兼顾安全保障,可以帮助客户使用自动或人工评估来评估、比较和选择适合其特定应用场景的最佳模型。借助Agents for Amazon Bedrock,客户可以提升准确性,加速生成式AI应用程序的开发。

谈到今年re:Invent 在工具方面的更新,郑予彬介绍了可以用于代码核审和观测Amazon CodeWhisperer 和用于优化和提升效率,专为业务量身定制的、生成式人工智能工作助手Amazon Q,它可以解读代码逻辑,还可以帮助开发人员完成日常的软件开发任务。只需点击几下,就能从问题中的一个想法转变为经过完整测试、准备合并、运行的应用代码,并且可以使用自然语言输入。

分享的最后,郑予彬表示,AIOps未来将以通过预测性维护、数据驱动的开发、运维决策支持来改变开发者的工作方式。

亚马逊云科技解决方案研发中心应用科学家肖宇为大家带来了《为扩散模型AI生图打造云上引擎,聚焦业务创新》的精彩话题。

亚马逊云科技解决方案研发中心应用科学家 肖宇

肖宇首先为大家分享了一个案例,客户希望通过引入生成式AI技术,快速扩展现有App的功能,从而实现更多业务创新。为此,尝试采用了Stable Diffusion模型生成风格化图像的功能,以增加App的吸引力和互动性。但遇到了本地算力资源有限,自建成本高 (硬件成本 + 维护成本)、基于开源项目搭建稳定性不够,无法保证业务正常运转、缺乏后端API调用弹性资源的能力,2C业务难开展、很难跟上开源社区功能迭代的速度等挑战。

为了帮助更多企业生图业务落地,亚马逊开发了生图云上的解决方案(将本地的模型调优、推理等工作负载低迁移成本的无感上云;云上CloudFormation模版一键部署;满足UI和API两种调用模式,满足两种用户需求;提供弹性云上资源;提供多用户权限管理和资源隔离)。并通过一个扩展、一个中间件拓展到云上,将SageMaker作为计算平台,通过此方法可以节省80%的部署时间,提升10X工作效率。

然后,肖宇详细的介绍了亚马逊解决方案中包含的核心功能、多用户权限配置、计算资源弹性配置、数据资产管理、底层AI生图框架(支持UI与API直接调用两种方式,灵活多样;支持多用户功能支持客户更便捷搭建内部媒资系统;适合2B/2C多种场景),并通过聚焦业务需求,加速GenAI创新;亚马逊云科技中国峰会GenAI展位“皮影随形”的案例,为大家分享了AI生图的成功实践,希望这些落地实践可以帮助企业更好的加快客户AI 生图业务的前期调研和模型验证的速度、提升客户搭建自有 AI 生图平台和工具的效率、降低客户开展 AI 生图业务的硬件要求、助力客户规范地管理同生成式 AI 业务相关的资产。

紧接着,可以科技产品负责人曹临杰、亚马逊云科技解决方案架构师莫梓元共同为大家带来了《爆款云原生儿童陪伴机器人背后的AI技术揭秘》的主题分享,话题主要围绕初识可以科技爆款云原生儿童陪伴机器人、可以科技智能萌宠产品化过程中遇到的挑战、借助亚马逊云科技产品,可以科技通过AI让机器人自由地表达情感、技术赋能,优化迭代,持续提升产品体验四部分展开。

可以科技产品负责人 曹临杰

亚马逊云科技解决方案架构师 莫梓元

可以科技推出了能够带动用户长期价值,又能让大众消费者接受的Loona产品,它具备五位一体的机器人新品类(人机多元深度交互,流畅灵活的运动,富有“生命感”的 设计,全方位、智能化的感知可拓展的多样化功能)。

在开发Loona项目中,遇到了几个关键挑战,一是机器人的工程设计开发,二是情感交互模型设计开发,三是全球各地市场的布局(安全合规完善、开发运维方便、全球覆盖保障、产品智能化、合作伙伴助力)。结合大模型的对话能力、交互能力以及生成能力,如何能够让Loona去实现风格化对话、情绪理解和丰富功能。亚马逊云科技解决方案架构师莫梓元给出了解决方案,但在这过程中也遇到了诸多技术挑战。

针对这些难题,莫梓元表示,为了让Loona能够听得见,利用基于Alexa技术堆栈的Amazon Lex ,以云原生的方式提供了ASR语音转文本、NLU语义理解能力,并且使用Bedrock生成式AI大语言模型辅助Lex意图快速开发,原生集成无服务器Lambda服务,极大提升了开发人员的效率,在短短一个月内完成了 Loona 对话式交互功能的研发、部署,全球交付;同时Amazon Kinesis Video Streams 支持的 Loona 双向音视频实时通话功能,使得 Loona 除了给人以情感陪伴以外,还具有符合安全隐私标准的远程监控功能;此外还加入了 Amazon Polly 服务完成TTS文本转语音,让机器人不仅“听得懂“,还可以通过自然语言在语音交互中回应用户;未来也将基于亚马逊云科技的大语言模型能力探索更多的智慧萌宠场景。

PingCAP TiDB Serverless 研发负责人孙晓光为大家带来的《TiDB Serverless 的云原生架构进化:从0到2万+集群的极速狂奔》话题火爆全场。

PingCAP TiDB Serverless 研发负责人 孙晓光

随着云原生开发模型的日渐流行,serverless 服务正在成为越来越多开发者技术选型时的第一选择。借助 serverless 服务,在不绑定某种具体技术架构的前提下。用户能够不再关心基础设施,以高投入产出比的状态服务各种场景的多样化工作负载要求。

TiDB Serverless 是 TiDB Cloud 上全面服务化的数据库产品。在正式发布之后短短的 400 天即收获了大量用户,当前正在为超过两万个用户集群持续提供高质量的服务。

TiDB Serverless 用户高速增长背后的一个原因是始终遵循着 serverless 产品目标客户的核心诉求,在产品能力和设计理念上紧跟这个明确客户群体的诉求。得益于 TiDB 过去打下的扎实基础。TiDB Serverless 能够全面兼容 MySQL,让用户继续使用熟悉的技术栈和工具; 具备无缝的弹性,随时应对业务增长和流量激增; 以天然的高可用能力保障业务连续性,提供零停机时间的服务能力; 还可以借助内置的 HTAP 能力助力企业实时洞察业务。在拥有这一切优势的前提下,仍然以按需按量付费的方式极大的降低了用户的使用成本。此外,TiDB Serverless 在商业上还采用了有限免费的策略。这为大量处于起步阶段的创新产品提供了 0 成本的数据库服务,助力更多创新的诞生。

从客户视角看 serverless 的数据库虽然有各种美好。然而,对于服务供应商来说,在线交易数据库的 serverless 化道路却并非一帆风顺。孙晓光提到,Serverless 数据库面临着自动化弹性扩展和冷启动等等挑战。在应对这些挑战中,孙晓光强调,亚马逊云科技的创新领导地位,包括其在弹性资源服务和 serverless 产品上的先进技术,为 TiDB Serverless 提供了坚实的基础。利用亚马逊云科技的产品和服务(如 Amazon EKS 和 Amazon S3),PingCAP 成功重构了云上的 TiDB 架构,使其成为一个真正的 serverless 数据库服务。此外,亚马逊云科技Marketplace 的渠道优势也为 TiDB Serverless 的客户快速增长做出了重要的贡献。

最后,孙晓光认为,serverless 数据库是云原生技术步入下一发展阶段时云产品矩阵的关键组成部分。随着产品的持续迭代和成熟 serverless 数据库将拥有更广泛的应用场景。

亚马逊云科技资深技术讲师魏星分享了《面向业务/技术决策者的生成式 AI 入门》话题,话题围绕生成式人工智能 (AI) 简介:可能性的艺术、规划生成式 AI项目、构建生成式 AI 就绪型企业三方面阐述。

亚马逊云科技资深技术讲师 魏星

魏星对生成式AI和机器学习进行了介绍,对于二者的区别,他表示,“生成式 AI 是深度学习的一个子集,因为它可以调整使用深度学习构建的模型,但无需进行重新训练或微调。而深度学习使用神经元和突触的概念,类似于我们大脑的连接方式。生成式 AI 是一种 AI,可以创建新的内容,包括对话、故事、图像、视频、音乐和代码。”

亚马逊云科技实现生成式AI,主要分四层,最底层是芯片层,一个是称之为加速器的Trainium,以及可以按照浮点数租用芯片的能力的Inferentia,第二层是帮助实现几乎所有机器学习场景的平台级服务SageMaker,第一层是Bedrock。

当下,应用大语言模型商用使用案例包括医护、生命科学、金融服务、制造、零售、媒体和娱乐。但是它也存在法律、社会、隐私问题等风险。接着,他还介绍了与生成式 AI 相关的技术基础知识和术语,规划了生成式 AI 项目(定义范围、选择模型、调整模型、使用模型)。

最后,他介绍到,想要在企业构建大语言模型项目,需要先从文化入手、保证团队成员理解生成式AI、解决就业问题。还要为生成式 AI 的成功定位团队、为生成式 AI 建立监管模型。

本专场论坛在热烈的讨论和意犹未尽中落下帷幕。未来,亚马逊云科技将始终从客户需求出发,持续深耕人工智能和机器学习技术,不断创新重构,致力于为企业提供负责任的 AI 应用,助力企业应对挑战,重塑业务并加速生成式 AI 之旅。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2660668.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

架构设计系列 5:常见架构介绍

前面讲了架构是什么,架构的发展史,架构设计的基础理论,这次针对常见架构设计风格进行介绍和分析。 一、MVC:三层架构经典 经典的 MVC 架构(Model-View-Controller)架构是软件系统架构设计中的经典&#xf…

提升设计效率:全面了解如何使用Figma插件

Figma组件库包括颜色、字体、图标、按钮、阴影、圆角、间距等。当Figma组件库的样式和Figma组件达到一定数量时,将难以维护,设计和开发的对接成本将大大提高。Figma可以在同一母版下单独设置样式,而不影响与母版之前的关系,这是Sk…

前端基础:Vue搞笑白话文(工作之余瞎写)

1、data:{}与data(){return{}}这两个是个什么鬼? vue实例 new Vue({el:#app,data:{name:李四}}) 组件实例 const aaa Vue.extent({data(){return {name:}} }) 为什么Vue实例可以那么写而组件实例就不行了?原因就是因为在底层原理上,组件…

学习使用wps将ppt的页面保存为图片的方法

学习使用wps将ppt的页面保存为图片的方法 方案 方案 1、打开ppt,点击文件,另存为,选择文件类型为图片格式,jpg或者png,如下图: 2、点击每张幻灯片

springcloud中使用openfeign来优化接口调用

简单介绍在springcloud中使用openfeign来优化接口调用 目录 一、引入依赖二、为服务提供者编写openfeign接口三、服务消费者调用定义的openfeign接口四、项目结构五、日志级别配置1、通过配置类进行全局配置2、通过配置类进行局部配置3、通过配置文件配置 一、引入依赖 <!-…

Hive中支持毫秒级别的时间精度

实际上&#xff0c;Hive 在较新的版本中已经支持毫秒级别的时间精度。你可以通过设置 hive.exec.default.serialization.format 和 mapred.output.value.format 属性为 1&#xff0c;启用 Hive 的时间精度为毫秒级。可以使用以下命令进行设置&#xff1a; set hive.exec.defau…

音频修复和增强软件:iZotope RX 10 (Win/Mac)中文汉化版

iZotope RX 是一款专业的音频修复和增强软件&#xff0c;一直是电影和电视节目中使用的行业标准音频修复工具&#xff0c;iZotope能够帮助用户对音频进行制作、后期合成处理、混音以及对损坏的音频进行修复&#xff0c;再解锁更多功能之后还能够对电影、游戏、电视之中的音频进…

OSPF被动接口配置-新版(14)

目录 整体拓扑 操作步骤 1.基本配置 1.1 配置R1的IP 1.2 配置R2的IP 1.4 配置R4的IP 1.5 配置R5的IP 1.6 配置PC-1的IP地址 1.7 配置PC-2的IP地址 1.8 配置PC-3的IP地址 1.9 配置PC-4的IP地址 1.10 检测R1与PC3连通性 1.11 检测R2与PC4连通性 1.12 检测R4与PC1连…

unity学习笔记----游戏练习02

一、阳光值的展示和消耗 1.创建一个文本组件用于显示阳光的数值&#xff0c;然后在脚本中得到这个UI。 在SunManger中得到这个组件的引用 public TextMeshProUGUI sunPointText; 写一个用于更新显示的方法 public void UpdataSunPointText() { sunPointText.tex…

计算机网络(6):应用层

每个应用层协议都是为了解决某一类应用问题&#xff0c;而问题的解决又往往是通过位于不同主机中的多个应用进程之间的通信和协同工作来完成的。 应用层的具体内容就是规定应用进程在通信时所遵循的协议。 应用层的许多协议都是基于客户服务器方式。即使是对等通信方式&#x…

Grafana Loki 组件介绍

Loki 日志系统由以下3个部分组成&#xff1a; Loki是主服务器&#xff0c;负责存储日志和处理查询。Promtail是专为loki定制的代理&#xff0c;负责收集日志并将其发送给 loki 。Grafana用于 UI展示。 Distributor Distributor 是客户端连接的组件&#xff0c;用于收集日志…

uniapp:实现手机端APP登录强制更新,从本地服务器下载新的apk更新,并使用WebSocket,实时强制在线用户更新

实现登录即更新&#xff0c;或实时监听更新 本文介绍的是在App打开启动的时候调用更新&#xff0c;点击下方链接&#xff0c;查看使用WebSocket实现实时通知在线用户更新。 uniapp&#xff1a;全局消息是推送&#xff0c;实现app在线更新&#xff0c;WebSocket&#xff0c;ap…

《MySQL系列-InnoDB引擎01》MySQL体系结构和存储引擎

文章目录 第一章 MySQL体系结构和存储引擎1 数据库和实例2 MySQL配置文件3 MySQL数据库路径4 MySQL体系结构5 MySQL存储引擎5.1 InnoDB存储引擎5.2 MyISAM存储引擎5.3 NDB存储引擎5.4 Memory存储引擎5.5 Archive存储引擎5.6 Federated存储引擎 6 连接MySQL6.1 TCP/IP6.2 命名管…

docker compose 部署 grafana + loki + vector 监控kafka消息

Centos7 随笔记录记录 docker compose 统一管理 granfana loki vector 监控kafka 信息。 当然如果仅仅是想通过 Grafana 监控kafka&#xff0c;推荐使用 Grafana Prometheus 通过JMX监控kafka 目录 1. 目录结构 2. 前提已安装Docker-Compose 3. docker-compose 自定义服…

关于java选择结构switch及反编译

关于java选择结构switch及反编译 在上一篇文章中&#xff0c;我们了解了选择结构中的if else等&#xff0c;本章内容让我们说明一下上一篇文章中的伏笔&#xff0c;switch选择结构&#x1f914; switch多选择结构 多选择结构&#xff1a;多选择结构除了else if &#xff0c;…

Codeforces Round 918 (Div. 4)(AK)

A、模拟 B、模拟 C、模拟 D、模拟 E、思维&#xff0c;前缀和 F、思维、逆序对 G、最短路 A - Odd One Out 题意&#xff1a;给定三个数字&#xff0c;有两个相同&#xff0c;输出那个不同的数字。 直接傻瓜写法 void solve() {int a , b , c;cin >> a >>…

YOLOv5改进 | 2023主干篇 | 华为最新VanillaNet主干替换Backbone实现大幅度长点

一、本文介绍 本文给大家来的改进机制是华为最新VanillaNet网络&#xff0c;其是今年最新推出的主干网络&#xff0c;VanillaNet是一种注重极简主义和效率的神经网络架构。它的设计简单&#xff0c;层数较少&#xff0c;避免了像深度架构和自注意力这样的复杂操作(需要注意的是…

鸿蒙Harmony(十一)Stage模型

Stage模型&#xff1a;HarmonyOS 3.1 Developer Preview版本开始新增的模型&#xff0c;是目前主推且会长期演进的模型。在该模型中&#xff0c;由于提供了AbilityStage、WindowStage等类作为应用组件和Window窗口的“舞台”&#xff0c;因此称这种应用模型为Stage模型。 UIAb…

verilog rs232串口模块

前面发了个发送模块&#xff0c;这次补齐&#xff0c;完整。 串口计数器&#xff0c;波特率适配 uart_clk.v module uart_clk(input wire clk,input wire rst_n,input wire tx_clk_en,input wire rx_clk_en,input wire[1:0] baud_sel,output wire tx_clk,output wire rx_clk )…

js遍历后端返回的集合将条件相同的放入同一个数组内

项目场景&#xff1a; echarts折线图需要根据条件动态展示多条不同曲线 解决方案&#xff1a; 后端直接将使用sql将数据查询出来返回即可,因为我这里不是Java使用的C#不是很熟练后台不好写逻辑,所以在前端js完成的 代码如下: function createline(villagename, buildingname…