Jina Reranker 新模型发布,更小、更快、更便宜!

在传统文本搜索技术已经相对成熟的背景下,如何进一步提高搜索的效率和速度成为了新的追求目标。应对这一挑战,Jina Reranker 模型系列推出了两款针对性能调优的新模型:jina-reranker-v1-turbo-enjina-reranker-v1-tiny-en,它们在保证搜索高准确度的同时,特别强化了处理速度和资源优化。这两款模型现已上线 AWS Sagemaker 和 Hugging Face 平台,为需要快速响应和高效资源利用的场景提供了理想的解决方案。

Jina Reranker Turbo 和 Tiny 模型的速度,这得益于我们独创的 JinaBERT:一个增强版本的 BERT 架构,采用了对称双向的 ALiBi 方案,能够处理长达 8192 Token 的输入,非常适合对大型文档和复杂查询进行深入分析。

Jina Reranker Turbo: https://huggingface.co/jinaai/jina-reranker-v1-turbo-en

Jina Reranker Tiny: https://huggingface.co/jinaai/jina-reranker-v1-tiny-en

根据我们在 Jina Reranker v1 模型中获得的经验,考虑到 AI 模型的运行成本,许多用户更倾向于选择更小、更快、更便宜的模型,哪怕可能牺牲一些准确度。因此我们简化了模型设计,特别是减少隐藏层的数量,并缩减其宽度,以此不仅加快了处理速度,还显著减小了模型的体积,大幅降低了成本,而对性能的影响几乎可以忽略,非常适合那些对延迟有严格要求的场景。

接下来,本文将详细介绍 Jina Reranker Turbo 和 Tiny 的架构设计、性能表现,并提供开始使用这些模型的具体指导。

精简架构

Jina Reranker Turbo 采用了 6 层架构,总共有 3780 万参数,相较于我们的基础 Reranker 模型 jina-reranker-v1-base-enTurbo 模型仅是其参数数量的 1/4,同时处理速度提高了 3 倍,适用于对即时处理需求较高的应用场景。

Jina Reranker Tiny 进一步精简到 4 层架构,仅 3300 万参数,提供了更大的并行处理能力,以及更快的处理速度,速度是基础模型的 5 倍,并且相较于 Turbo 模型,在内存成本上减少了 13%。Tiny 模型非常适用于资源受限的环境,能够在保持低成本的同时,提供高效的处理性能。

c3364a3904a9767ae1a1708738bc43f3.pngJina Reranker 各版本性能对比,Y 轴表示每 50 毫秒处理的文档数量

知识蒸馏

我们采用知识蒸馏的方式培训了 Jina Reranker Turbo 和 Tiny 模型,用一个已经训练完毕的大型 AI 模型(我们称之为“教师”模型)来引导小型模型(即“学生”模型)学习,让它们近似地复制大模型的能力。

在训练过程中,我们让性能强大的jina-reranker-v1-base-en 模型扮演了教师的角色,提供了高质量的输出示例,作为训练数据指导 Jina Reranker Turbo 和 Tiny 模型学习如何有效地解决排名任务。通过这种方式,这些较小的模型能在保持小体积、低资源需求的同时上,性能接近“教师”模型。

测评结果表明,即使在计算资源受限的环境下,Jina Reranker Turbo 和 Tiny 模型在执行任务时的表现也能有效地执行排名任务,接近大型模型的处理效果。

详细内容可以参考: https://jina.ai/news/distilled-ai-using-large-models-to-teach-smaller-ones/

BEIR 评估

在信息检索领域的 BEIR 基准测试中,我们对 Jina Reranker Turbo 和 Tiny 模型进行了性能评估。评估结果显示,jina-reranker-v1-turbo-en 的准确度达到了基础模型的 95%,而 jina-reranker-v1-tiny-en 的准确度也达到了 92.5%。

与市场上其他主流的 Reranker 模型相比,Jina Reranker 系列模型在大幅降低模型体积和提升处理速度的同时,依然保持了出色的性能。无论是从模型大小、处理速度还是成本效益角度来看,Jina Reranker Turbo 和 Tiny 模型都展现出了显著的竞争力。

以下是各模型在 BEIR 基准测试中的得分和参数对比:

模型BEIR 分数 (NDCC@10)参数
Jina Reranker 模型

jina-reranker-v1-base-en52.45137M
jina-reranker-v1-turbo-en49.6038M
jina-reranker-v1-tiny-en48.5433M
其他 Reranker 模型

mxbai-rerank-base-v149.19184M
mxbai-rerank-xsmall-v148.8071M
ms-marco-MiniLM-L-6-v248.6423M
bge-reranker-base47.89278M
ms-marco-MiniLM-L-4-v247.8119M

注:NDCC@10分数越高表示搜索结果越好。

319e10a1c709ccf2930f24300891b5df.png
BEIR 基准:吞吐量 x 轴,分数 y 轴,注意 y 轴不在原点

该图表展示了不同重排模型的 BEIR 得分以及每 50 毫秒处理文档的性能评估。在 BEIR 基准测试中,只有 MiniLM-L6 和 MiniLM-L4 模型在尺寸和速度上与我们的模型相似,但 jina-reranker-v1-turbo-en 和 jina-reranker-v1-tiny-en 的性能明显更优。

在 LlamaIndex RAG 基准测试中,我们也获得了相似的结果。我们测试了三种 Jina Rerankers 在 RAG 系统中的表现,并使用三种不同的 Embedding 模型进行向量搜索,计算了它们的平均得分。Embedding 模型分别是jina-embeddings-v2-base-en, bge-base-en-v1.5, 和 Cohere-embed-english-v3.0

以下是各模型在 LlamaIndex RAG 基准测试中的平均命中率和平均 MRR(平均倒数排名):

重排模型平均命中率平均 MRR
Jina Reranker 模型

jina-reranker-v1-base-en0.84390.7006
jina-reranker-v1-turbo-en0.83510.6498
jina-reranker-v1-tiny-en0.83160.6761
其他重排模型

mxbai-rerank-base-v10.81050.6583
mxbai-rerank-xsmall-v10.81930.6673
ms-marco-MiniLM-L-6-v20.80520.6121
bge-reranker-base0.81750.6480
ms-marco-MiniLM-L-4-v20.82460.6354

对于检索增强生成(RAG)任务,我们发现在保持处理速度的同时,结果质量的损失非常小。虽然 ms-marco-MiniLM-L-4-v2 提供了更高的吞吐量,但结果质量却有较大牺牲。

de24681bdbb33fe06e35f50492acb8c4.pngLlamaIndex RAG Benchmark:x 轴为吞吐量,y 轴为命中率

在 AWS 上更便宜

对于 AWS 用户而言,采用 Jina Reranker Turbo 和 Tiny 模型能够显著降低成本,因为这些服务是基于内存使用量和 CPU 计时收费的。仅内存使用量的减少就达到了约 75%,能直接转化成云服务费用的大幅下降。

此外,更快的吞吐量意味着您可以在更便宜的 AWS 实例上执行更多查询,进一步降低成本。

开始使用

Jina Reranker 模型非常容易使用,并且可以轻松集成到您的应用程序和工作流程中。您可以访问 Jina Reranker API 页面 https://jina.ai/reranker/ 了解如何使用我们的服务,我们提供了 100 万个免费 token 供您试用。

fec32723d9b486f5509b8ea9c2e0f329.png

我们的模型也已经在 AWS SageMaker 上线,如果您需要在企业环境中进行本地部署,您可以通过 AWS Marketplace 轻松实现,详情请访问

https://aws.amazon.com/marketplace/seller-profile?id=seller-stch2ludm6vgy。

我们也将模型在 Hugging Face 开源了,您也可以在 https://huggingface.co/jinaai/ 下载我们的开源模型。

d014fbf85e87450f57cda4be444f36b4.png

Jina AI 致力为您的搜索和 RAG 系统提供世界一流的向量模型,通过使用我们先进的Reranker API 能够最大限度提高搜索相关性的 RAG 准确性!

欢迎通过官网 https://jina.ai/ 或社区 https://discord.jina.ai/ 与我们联系,分享您的反馈,并获取我们最新模型的信息。

09c11970f747b9f7cff816d2679fed44.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2981316.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

矽塔SA6288Q栅极驱动器,可替代峰绍FD6288Q

SA6288 是一款集成了三个独立半桥栅极驱动器,特别适合于三相电机应用中高速功率MOSFET 和 IGBT 的栅极驱动。可在高达250V 电压下工作。 SA6288内置 VCC 和 VBS 欠压( UVLO )保护功能,防止功率管在过低的电压下工作,…

赛劲SEJINIGB零背隙滚轮齿条齿圈产品助力高精度运动平台

在高度精密化的工业时代,传统齿轮齿条系统所面临的背隙、摩擦粉尘、润滑等问题愈发凸显,这些问题不仅限制了设备的精度和稳定性,还对生产效率和产品质量造成严重影响。为此,赛劲SEJINIGB经过长期研发和技术积累,推出了…

springboot论文格式系统

采用springbootmysqlhtmlvue技术 详细运行视频地址B站运行效果视频地址 (1)系统具备用户管理功能,包括用户注册、登录、权限管理等功能。 (2)系统具备格式规范管理功能,包括格式规范创建、编辑、删除等操…

两天速通阿里

感觉这一周太梦幻了,就像一个梦,很不真实~~~ 感觉这个暑期,我的运气占了99成,实力只有百分之一 4.15上午 腾讯csig 腾讯云部门,面完秒进入复试状态 4.16下午 美团优选供应链部门,4.18上午发二面 4.17晚上 阿…

2款摄像头录像软件,满足你的多种要求!

“有没有一款能够录制摄像头视频的软件呀?我计划录制一些生活小窍门和教学视频,想要能清楚地拍到自己的操作过程。但找了好多软件,都不太满意,真心希望大家能给我推荐几款好用的摄像头录像软件,最好能简单易上手的&…

vue2项目升级到vue3经历分享

依据vue官方文档,vue2在2023年12月31日终止维护。因此决定将原来的岁月云记账升级到vue3,预计工作量有点大,于是想着把过程记录下来。 原系统使用的技术栈 "dependencies": {"axios": "^0.21.1","babel-…

js鼠标经过就增加一个open 进行展开 遍历数组,为每个id对应的元素添加事件监听器

js鼠标经过就增加一个open 进行展开 遍历数组,为每个id对应的元素添加事件监听器 {% javascript %}const ids [Details-HeaderMenu-aaaaaa2,Details-HeaderMenu-aaaaaa6, Details-HeaderMenu-aaaaaa4,Details-HeaderSubMenu-1,Details-HeaderSubMenu-2,Details-H…

python基础知识点(蓝桥杯python科目个人复习计划66)

今日复习内容:算法双周赛 第一题:疯狂星期六 题目描述: 麦肯鸡是一家名声在外的汉堡店,他们最近推出了一份名为vivo50的套餐,只需要在门口大声喊出vivo50,就可以获得这个套餐。 现在,请你打…

W801学习笔记十二:掌机进阶V3版本之驱动(PSRAM/SD卡)

本次升级添加了两个模块,现在要把他们驱动起来。 一:PSRAM 使用SDK自带的驱动,我们只需要写一个初始化函数,并在其中添加一些自检代码。 void psram_heap_init(){wm_psram_config(0);//实际使用的psram管脚选择0或者1&#xff…

程序员过了35岁没人要?“这行越老越香”

程序员35岁失业?参加完OceanBase开发者大会,我又悟了! 周六参加了OceanBase2024 开发者大会的现场,来之前我其实挺忐忑的,我觉得一个数据库产品的发布会,能有什么新鲜的东西? 踏入酒店的那一刻&…

HORROR SYSTEM

HORROR SYSTEM是一个创新的工具包,允许开发者在Unity3D中创建独特的原创恐怖游戏。 HORROR SYSTEM是一款强大而灵活的工具,旨在基于Unity3D引擎创建沉浸式第三人称恐怖游戏。 这项资产易于使用且直观,可以让任何经验水平的开发人员将他们的想法付诸实践,创造出高质量、充满…

Git 保姆级教程(一):Git 基础

一、获取 Git 仓库 通常有两种获取 Git 项目仓库的方式: 1. 将尚未进行版本控制的本地目录转换为 Git 仓库; 2. 从其它服务器克隆 一个已存在的 Git 仓库。 两种方式都会在你的本地机器上得到一个工作就绪的 Git 仓库。 1.1 git init(本地…

Linux的学习之路:19、进程信号(1)

摘要 今天这张说一下信号的一部分知识 目录 摘要 一、信号 1、生活角度的信号 2、技术应用角度的信号 3、注意 4、用kill -l命令可以察看系统定义的信号列表 5、信号处理常见方式概览 二、产生信号 1、通过终端按键产生信号 2、调用系统函数向进程发信号 3、由软件…

JAVA toString方法详解

hi,我是程序员王也,一个资深Java开发工程师,平时十分热衷于技术副业变现和各种搞钱项目的程序员~,如果你也是,可以一起交流交流。 今天我们来聊聊Java中toString方法~ toString方法的定义 在Java中,toStri…

boa.conf配置详解

boa的配置文件路径:/etc/boa/boa.conf Port 80 # 监听的端口号,缺省值是80 若80被占用,可修改监听端口为其他未占用端口(如:88) Listen 192.68.0.5 # 绑定调用的IP地址,一般注释掉,…

人工智能热度攀升市场广阔 业内:人机协同将成发展主流

以下文章来源:央广网 今年以来,人工智能产业热度持续攀升。文生视频软件Sora、文生音乐软件Suno等人工智能应用不断涌现,带给人们冲击的同时,也在影响着千行百业。本报今起推出“聚焦人工智能发展”系列报道,围绕人工智…

【JAVA进阶篇教学】第六篇:Java线程中状态

博主打算从0-1讲解下java进阶篇教学,今天教学第六篇:Java线程中状态。 理解并掌握线程的休眠、停止和挂起等操作是多线程编程中的重要内容。下面我将详细说明这些操作,并提供相应的代码案例。 目录 一、线程休眠(Thread Slee…

Hadoop格式化namenode出错

​ 我们在对Hadoop进行格式化时 很有可能会出现以下错误 输入命令:hadoop namenode -format 报错信息:-bash:hadoop:command not found 我们总结的最主要原因有三个 Hadoop的环境变量是否配置 配置以后是否使其生效 vim /e…

java中线程池的简介及使用方法

目录 介绍 优点 运行原理 线程池的使用流程 基本使用步骤: 代码示例: 介绍 线程池是一种并发编程的技术,用于管理和复用多个线程以执行异步任务。它通常由两部分组成:任务队列和一组线程。任务队列用于存储待执行…

el-select下拉框远程搜索且多选时,编辑需要回显的一个简单案例

前端业务开发中不管使用vue2~3,还是react,angular各种前端技术栈,经常会遇到这种业务。一个下拉框Select中,不仅需要需要支持远程模糊搜索,还需要支持多选。并且在编辑时,还能正常把已经多选好的内容回显到…