IPRally巧用Google Kubernetes Engine和Ray改善AI

专利检索平台提供商 IPRally 正在快速发展,为全球企业、知识产权律师事务所以及多个国家专利和商标局提供服务。随着公司的发展,其技术需求也在不断增长。它继续训练模型以提高准确性,每周添加 200,000 条可供客户访问的可搜索记录,并映射新专利。

随着每年发布数百万份专利文件,并且这些文件的技术复杂性不断增加,即使是经验最丰富的专利专业人士也可能需要花费几个小时的研究才能使用传统专利检索工具解决案件。 2018 年,芬兰公司 IPRally 开始采用基于图的方法来解决这个问题。

IPRally如何通过Google Kubernetes Engine 和 Ray利用AI?

“专利搜索引擎大多是复杂的布尔型搜索引擎,您需要花费数小时构建复杂的查询,”这家拥有 50 名员工的公司的首席技术官兼联合创始人 Juho Kallio 说道。 “我想打造一些重要且具有挑战性的东西。”

该公司利用机器学习 (ML) 和自然语言处理 (NLP),将超过 1.2 亿份全球专利文档的文本转换为嵌入可搜索向量空间的文档级知识图。现在,专利研究人员可以在几秒钟内收到相关结果,其中包括人工智能选择的关键信息亮点和可解释的结果。

为了满足这些需求,IPRally 使用Google Kubernetes Engine (GKE) 和开源 ML 框架Ray构建了一个定制的 ML 平台,平衡了效率、性能并简化了机器学习操作 (MLOps)。该公司使用开源KubeRay在 GKE 上部署和管理 Ray,这使他们能够利用经济高效的 NVIDIA GPU Spot 实例进行探索性 ML 研究和开发。它还使用 Google Cloud 数据构建块,包括Cloud Storage和Compute Engine永久性磁盘。接下来将扩展到 Ray Data 和BigQuery的大数据解决方案。

“Ray on GKE 有能力在未来支持我们任何规模和任何类型的分布式复杂深度学习,”Kallio 说。

专为提高性能和效率而构建的定制机器学习平台

IPRally 工程团队的主要关注点是研发以及如何继续改进其 Graph AI,以使技术知识更容易获取。只需两名 DevOps 工程师和一名 MLOps 工程师,IPRally 就能够以 GKE 和 Ray 作为关键组件构建自己的定制 ML 平台。

作为开源的大力支持者,IPRally 在计算需求增长时将所有内容都转移到了 Kubernetes。然而,他们不想自己管理 Kubernetes。这促使他们选择了 GKE,因为它具有可扩展性、灵活性、开放生态系统以及对各种加速器的支持。总而言之,这为 IPRally 提供了性能和成本之间的适当平衡,以及计算资源的轻松管理以及在不需要时有效缩减容量的能力。

“GKE 提供了我们满足这些复杂的培训和服务需求所需的可扩展性和性能,并且我们获得了对数据和计算的正确控制粒度,”Kallio 说。

Kallio 强调的一项特殊的 GKE 功能是容器镜像流,它显着加快了启动时间。

“我们已经看到 GKE 中的容器镜像流对于加快我们的应用程序启动时间具有重大影响。图像流帮助我们将提交后训练作业的启动时间缩短了 20%,”他分享道。 “而且,当我们能够重复使用现有的 Pod 时,我们可以在几秒钟而不是几分钟内启动。”

下一层是 Ray,该公司使用它来扩展用于机器学习的分布式并行 Python 和 Clojure 应用程序。为了更轻松地管理 Ray,IPRally 使用 KubeRay,这是一种可以简化 Kubernetes 上的 Ray 集群管理的专用工具。 IPRally 使用 Ray 执行最高级的任务,例如大规模数据预处理和研发中的探索性深度学习。

“Ray 和 GKE 自动缩放之间的互操作性平稳且强大。我们可以不受任何限制地组合计算资源。”Kallio 说道。

最重的 ML 负载主要部署在配备 8 个 NVIDIA L4 GPU 的G2 虚拟机上,配备多达 8 个NVIDIA L4 Tensor Core GPU,为 AI 推理工作负载提供尖端的性价比。通过在 GKE 中利用它们,IPRally 有助于按需创建节点,根据需要扩展 GPU 资源,从而优化其运营成本。每个区域都有一个由 Terraform 提供的 Kubernetes 集群,用于 IPRally 搜索廉价的现货实例。然后,GKE 和 Ray 介入进行计算编排和自动扩展。

为了进一步简化 MLOps,IPRally 在 KubeRay 和 Ray 之上构建了自己的精简编排层 IPRay。该层为数据科学家提供了一个命令行工具,可以轻松配置模板化的 Ray 集群,该集群可以有效地向上和向下扩展,并且可以在 Ray 中运行作业,而无需了解 Terraform。这个自助服务层减少了摩擦,让工程师和数据科学家能够专注于他们更高价值的工作。

技术为强劲增长铺平道路

通过选择 Google Cloud 和开源框架,IPRally 表明初创公司无需花费数百万美元即可构建企业级 ML 平台。从一开始就专注于提供强大的 MLOps 和自动化基础,这在效率和团队专注于研发的能力方面带来了回报。

IPRally 的 ML 工程师 Jari Rosti 表示:“用最好的部件打造灵活的 ML 基础设施是非常值得的。” “现在,随着我们调整基础设施以适应不断发展的现代机器学习理念,我们看到这项投资的好处成倍增加。其他年轻公司也可以通过利用 Google Cloud 和 Ray 来实现这一目标。”

此外,该公司通过使用Spot 实例节省了 70% 的 ML 研发成本。这些经济实惠的实例提供与按需实例相同质量的虚拟机,但可能会出现中断。但由于 IPRally 的研发工作负载具有容错能力,因此非常适合 Spot 实例。

IPRally去年完成了 1000 万欧元的 A 轮投资,目前正在不断吸收和处理来自全球的知识产权文档,重点是改进其图神经网络模型并构建用于专利检索的最佳人工智能平台。到2022 年,专利申请量将达到 340 万件(连续第三年增长),数据将持续流动,IPRally 可以继续帮助知识产权专业人士找到每一条相关信息。

“通过 GKE 上的 Ray,我们建立了 ML 基础,这证明了 Google Cloud 在 AI 方面的强大功能,” Kallio 说道。 “现在,我们准备探索更先进的深度学习并不断发展。”

完整原文传送门:IPRally如何通过Google Kubernetes Engine和Ray利用AI?-国外VPS网站icon-default.png?t=N7T8https://www.vps911.com/gwvpstj/1506.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2980234.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

iOS ------代理 分类 拓展

代理协议 一,概念: 代理,又称委托代理(delegate),是iOS中常用的一种设计模式。顾名思义,它是把某个对象要做的事委托给别的对象去做。那么别的对象就是这个对象的代理,代替它来打理…

安装eog照片查看程序

安装eog照片查看程序 apt-get install --reinstall liburi-perl apt-get install eog解决 参考文章

milvus对象存储和消息中间件的工厂设计模式分析

milvus对象存储和消息中间件的工厂设计模式分析 需求 根据参数设置创建mq和storage mq有kafka,pulsar storage有local,minio,remote 配置文件 根据配置文件选择初始化mq和存储: mq:type: pulsarcommon:storageType: minio对于这种类型一个是mq,一个是存储&…

ClickHouse用UDF解析XML字符串和XML文件

一.如果是读取xml文件的时候,文件入库需要使用文件读取UDF 创建了1个测试文件 wsdFileRead(): 直接读取文件内容 SELECT wsdFileRead(/home/temp/wsd_test.xml)Query id: 09b6e5fe-7169-43f7-b001-90e2eeabb8da┌─wsdFileRead(/home/temp/wsd_test.xm…

OpenHarmony实战开发-内存快照Snapshot Profiler功能使用指导。

DevEco Studio集成的DevEco Profiler性能调优工具(以下简称为Profiler),提供Time、Allocation、Snapshot、CPU等场景化分析任务类型。内存快照(Snapshot)是一种用于分析应用程序内存使用情况的工具,通过记录…

鸟哥的Linux私房菜 总结索引 | 第二章:主机规划与磁盘分区

要安装好一部Linux主机并不是那么简单的事情,你必须要针对distributions的特性、服务器软件的能力、 未来的升级需求、硬件扩充性需求等等来考虑,还得要知道磁盘分区、文件系统、Linux操作较频繁的目录等等, 都得要有一定程度的了解才行 1、…

LlamaIndex 加 Ollama 实现 Agent

AI Agent 是 AIGC 落地实现的场景之一,与 RAG 不同,RAG 是对数据的扩充,是模型可以学习到新数据或者本地私有数据。AI Agent 是自己推理,自己做,例如你对 AI Agent 说我要知道今天上海的天气怎么样,由于 AI…

李沐56_门控循环单元——自学笔记

关注每一个序列 1.不是每个观察值都是同等重要 2.想只记住的观察需要:能关注的机制(更新门 update gate)、能遗忘的机制(重置门 reset gate) !pip install --upgrade d2l0.17.5 #d2l需要更新import torch from tor…

集群工具之HAProxy

集群工具之HAProxy HAProxy简介 它是一款实现负载均衡的调度器适用于负载特别大的web站点HAProxy的工作模式 mode http:只适用于web服务mode tcp:适用于各种服务mode health:仅做健康检查,很少使用 配置HAProxy client&#x…

Datawhale |【独家】万字长文带你梳理Llama开源家族:从Llama-1到Llama-3

本文来源公众号“Datawhale”,仅用于学术分享,侵权删,干货满满。 原文链接:【独家】万字长文带你梳理Llama开源家族:从Llama-1到Llama-3 0. 引言 在AI领域,大模型的发展正以前所未有的速度推进技术的边界…

4(第三章,数据治理)

目录 概述 业务驱动因素 目标和原则 1、可持续发展 2、嵌入式 3、可度量 基本概念 数据治理与数据管理的关系 数据治理组织 数据治理运营模型类型 数据管理岗位的类型 数据治理的成果体现 国内的数据治理 什么是数据治理 为什么进行数据治理 数据治理的必要性 …

Linux 操作系统的引导过程

Linux系统开机引导过程: 开机自检 检测硬件设备,找到能够引导系统的设备,比如硬盘MBR引导 运行MBR扇区里的主引导程序GRUB启动GRUB菜单 系统读取GRUB配置文件(/boot/grub2/grub.cfg)获取内核的设置和…

《内向者优势》:不要低估一个内向的人

#世界读书日 作者主页: 🔗进朱者赤的博客 精选专栏:🔗经典算法 作者简介:阿里非典型程序员一枚 ,记录在大厂的打怪升级之路。 一起学习Java、大数据、数据结构算法(公众号同名) ❤…

[RTOS 学习记录] 复杂工程项目的管理

[RTOS 学习记录] 复杂工程项目的管理 这篇文章是我阅读《嵌入式实时操作系统μCOS-II原理及应用》后的读书笔记,记录目的是为了个人后续回顾复习使用。 前置内容: 工程管理工具make及makefile 文章目录 1 批处理文件与makefile的综合使用1.1 批处理文件…

C语言学习/复习29--内存操作函数memcpy/memmove/memset/memcmp

一、内存操作函数 1.memcpy()函数 注意事项1:复制的数目以字节为单位 注意事项2:一定要保证有足够空间复制 模拟实现1 拷贝字符案例:由于拷贝时函数本事就以字节为单位拷贝所以该例子也可用于其他类型数据的拷贝。 模拟实现2 将自身的…

YOLOv8 关键点检测模型训练部署

文章目录 1、YOLOv8安装及使用1.2、命令行使用1.3、使用python-API模型预测1.4、pt转换ONNX 2、训练三角板关键点检测模型2.1、训练命令 3、ONNX Runtime部署 1、YOLOv8安装及使用 参考链接: 同济子豪兄视频 github原文链接 # 安装yolov8 pip install ultralytics --upgrade …

Linux-LVM与磁盘配额

一、LVM概述 Logical Volume Manager,逻辑卷管理 能够在保持现有数据不变的情况下动态调整磁盘容量,从而提高磁盘管理的灵活性 /boot分区用于存放引导文件,不能基于LVM创建 LVM机制的基本概念 PV(物理卷)&#xff…

情感识别——情感计算的模型和数据集调查

概述 情感计算指的是识别人类情感、情绪和感觉的工作,已经成为语言学、社会学、心理学、计算机科学和生理学等领域大量研究的主题。 本文将概述情感计算的重要性,涵盖思想、概念和方法。 情感计算是皮卡德于 1997 年提出的一个想法,此后出…

生产数据采集系统

在数字化浪潮的推动下,生产数据采集系统已经成为企业提升生产效率、优化运营管理的关键工具。那么,什么是生产数据采集系统呢?简单来说,生产数据采集系统是指通过一系列技术手段,实时收集、处理和分析生产线上的各类数…

STM32 I²C通信

一、IC总线通信 1.1 IC总线特点 IC(Inter Integrated Circuit,集成电路总线),通过串行数据线SDA(Serial Data)和串行时钟线SCL(Serial Clock)来完成数据的传输。 特点:…