商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!

文 | BFT机器人 

图片

近日,商汤科技正式发布「日日新SenseNova 4.0」,宣告大模型体系多维度全面升级。这款模型具备更全面的知识覆盖、更可靠的推理能力,以及更优越的长文本理解和数字推理能力。同时,它还支持跨模态交互,为不同应用场景提供了强大的支持。

商汤科技推出的「日日新·商量大语言模型-通用版本(SenseChat V4)」,具备强大的语言能力,支持128K语境窗口长度,整体评测成绩水平比肩GPT 4,相较GPT 3.5已经实现了全面超越。为了方便开发者使用,商汤还推出了Function call & Assistants API版本的大语言模型,显著降低了使用大模型的门槛。

图片

基于最新发布的Function call & Assistants API版本大语言模型,商汤科技已经开发并发布了数据分析工具“办公小浣熊”。此外,商汤还将大模型能力转化为实际场景的产品应用,推出了面向办公场景的商汤⽇⽇新·商量语⾔⼤模型-数据分析版本、面向医疗场景的日日新·商量语言大模型-医疗版本“大医”、 面向自动驾驶及工业场景的日日新·商量多模态大模型,以及面向创作创意场景的日日新·秒画文生图大模型等丰富的工具。

目前,商汤科技的「日日新SenseNova」大模型体系已经与在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业超过500家客户建立深度合作,加速了行业企业的智能化转型。未来,商汤将继续推动「日日新SenseNova」大模型体系及相关产品和工具的发展,为实现通用人工智能(AGI)提供有力支持,助力全场景、多产业实现智能化升级。

最高支持12万文字长文本

   综合成绩比肩GPT-4

「日日新SenseNova 4.0」为开发者提供了丰富而灵活的API接口和服务,使他们可以根据实际应用需求轻松调用大模型的AI技术能力。这种设计理念旨在降低成本、提高效率,从而加速各类AI应用的实现。

大模型性能提升的关键在于语言建模能力的增强。「日日新SenseNova 4.0」在语言建模方面实现了全新升级,推出了「日日新·商量大语言模型-通用版本(SenseChat V4)」。该模型支持不同长度的token窗口,包括4k、32k和128k,进一步扩大了模型的应用范围。

图片

图片

在能力提升方面,SenseChat V4在知识理解阅读理解综合推理数理代码长文本理解等领域展现出强大的通用能力。综合整体评测成绩水平比肩GPT-4,尤其在推理和代码编程测评中,表现甚至超越了GPT-4。在权威测试集HumanEval Coding的测试中,一次通过率高达75.6%,这一数据优于GPT-4的74.4%。

构建专业大模型

  填补行业空缺

除了基础模型,商汤科技还致力于通过高效融合垂直领域知识,帮助人们构建各类专业大模型,从而降低大模型的下游应用成本和门槛。这一目标旨在推动大模型技术在更多领域的应用和普及。

在技术演进方面,多模态成为人工智能大模型的重要方向

商汤科技的新一代「日日新 SenseNova」推出了拥有300亿参数的日日新·商量多模态大模型(SenseChat-Vision V4),其图文感知能力在全球范围内处于领先水平。在权威评测基准测试集MME Benchmark上,该模型的综合得分排名首位,展现了出色的性能表现。

图片

目前,该模型已经支持智能驾驶智能车舱电力行业等多个实际场景的应用。与传统的OCR能力相比,日日新·商量多模态大模型不仅能理解图像中的文字和物体,还能根据逻辑进行推理,实现了更高程度的认知能力。这一特点使得该模型在处理复杂场景和任务时具有更高的灵活性和准确性。

办公与数据分析领域,商汤科技推出了日日新·商量语言大模型-数据分析版本(SenseChat-DataAnalysisCode V4)。这款工具具备强大的自然语言输入功能,结合商汤大模型的意图识别、逻辑理解与代码解释器的能力,能够自动将数据转化为有意义的分析和可视化结果。

图片

在实际应用方面,该工具已经广泛支持xls、xlsx、csv、txt、json等格式的文件和表格处理。在1000+测试集的精度上,办公小浣熊的表现略胜于GPT-4。这一优势使得该工具在处理复杂的数据分析任务时更加高效和准确。

此外,在医疗健康领域,商汤科技也对大语言模型的医疗版本进行了全新升级。日日新·商量语言大模型-医疗版本“大医”(SenseChat-Medical V4)在本次更新后,实现了专业医学问答及复杂医学任务推理的功能。同时,该模型还支持更多模态医学文件的智能解读和交互问答。

图片

在两项行业权威评测中,大医的表现均非常出色。在2023年职业药剂师考试大模型评测和中文医疗大语言模型开放评测平台MedBench中,大医的综合评分均排名第二,性能接近GPT-4。这一成绩充分证明了其在医疗领域的强大实力和广泛应用前景。

商汤科技自主研发的日日新-秒画文生图大模型(SenseMirage V4)相较于前一版本,参数量大幅提升至百亿量级。通过采用Mixture of text experts、Spatial-aware CFG等先进的算法优化,该模型的语义理解能力与图像质感细节表现得到了显著增强,能够达到电影级海报的生成水平。

图片

同时,结合Adversarial Distillation算法,商汤科技还发布了秒画SenseMirage-Turbo V4版本。相较于基础版本,该版本在推理速度上实现了10倍的提升。这一显著的优势使得秒画SenseMirage-Turbo V4在处理大规模图像生成任务时更加高效,为实际应用提供了更加强大的支持。

结语

自23年商汤科技推出「日日新 SenseNova」大模型体系以来,这一创新产品形态已成为大模型技术落地应用的重要尝试之一。该体系为企业用户提供了丰富的AI应用工具和服务,使得超过3000家企业能够快速融入大模型技术应用领域,覆盖了互联网、游戏、文旅、教育、医疗健康、金融和编程等多个行业。

图片

商汤科技始终致力于降低大模型的使用门槛,通过不断的技术创新和产品优化,拓展人工智能在各行业的落地场景。这一目标使得大模型技术真正在行业中得到了广泛应用,为各行业带来了更高效、智能的解决方案。

未来,商汤科技将继续推进「日日新 SenseNova」大模型体系的建设,实现更多创新场景的应用。通过不断的技术创新和产品升级,商汤将不断推动大模型的前置化,让更多的智能走向更多场景、更多行业。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2776763.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

C++初阶篇----新手进村

目录 一、什么是C二、C关键字三、命名空间3.1命名空间的定义3.2命名空间的使用 四、C输入和输出五、缺省参数5.1缺省参数的概念5.2缺省参数的分类 六、函数重载6.1函数重载的概念6.2函数重载的原理----名字修饰 七、引用7.1引用概念7.2引用特性7.3常引用7.4引用的使用7.5传值、…

解析十六进制雷达数据格式:解析雷达数据长度。

以Cat62格式雷达数据为例,十六进制雷达数据部分代码: 3e0120bf7da4ffee0085 雷达数据长度使用4个字符(2个字节)标识,在这里是“0120”,转换为十进制数为288。 雷达数据长度父类: base_length_…

Easy Excel动态表头的实现

步骤: 1.查找官方API文档理解实现 2.实现融入到代码里面 一:Easy Excel动态头实时生成头写入 动态头实时生成头写入 二:实现 目的:实现表头为,第一列是固定列,第二列为动态生成的时间段的每一天的日期…

《MySQL 简易速速上手小册》第7章:MySQL监控和日志分析(2024 最新版)

文章目录 7.1 配置和使用 MySQL 监控工具7.1.1 基础知识7.1.2 重点案例:使用 Python 和 Prometheus 监控 MySQL 性能7.1.3 拓展案例 1:自动化 MySQL 慢查询日志分析7.1.4 拓展案例 2:实时警报系统 7.2 解读 MySQL 日志文件7.2.1 基础知识7.2.…

Linux网络编程——udp套接字

本章Gitee地址&#xff1a;udp套接字 文章目录 创建套接字绑定端口号读取数据发送数据聊天框输入框 创建套接字 #include <sys/types.h> #include <sys/socket.h> int socket(int domain, int type, int protocol);int domain参数&#xff1a;表面要创建套接字的域…

07 A B 从计数器到可控线性序列机

07. A.从计数器到可控线性序列机 让LED灯按照亮0.25秒。灭0.75秒的状态循环亮灭让LED灯按照亮0.25秒&#xff0c;灭0.5秒&#xff0c;亮0.75秒&#xff0c;灭1秒的状态循环亮灭让LED灯按照指定的亮灭模式亮灭&#xff0c;亮灭模式未知&#xff0c;由用户随即指定。以0.25秒为一…

Vuex介绍和使用

1. 什么是Vuex Vuex 是一个专为 Vue.js 应用程序开发的状态管理模式和库。它解决了在大型 Vue.js 应用程序中共享和管理状态的问题&#xff0c;使得状态管理变得更加简单、可预测和可维护。 在 Vue.js 应用中&#xff0c;组件之间的通信可以通过 props 和事件进行&#xff0c…

Java基础常见面试题总结-集合(一)

常见的集合有哪些&#xff1f; Java集合类主要由两个接口Collection和Map派生出来的&#xff0c;Collection有三个子接口&#xff1a;List、Set、Queue。 Java集合框架图如下&#xff1a; List代表了有序可重复集合&#xff0c;可直接根据元素的索引来访问&#xff1b;Set代表…

Unity类银河恶魔城学习记录5-3 P64 Foundation of Skill System源代码

Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释&#xff0c;可供学习Alex教程的人参考 此代码仅为较上一P有所改变的代码 【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili SkillManager.cs using System.Collections; using System.Collections.G…

(1)短距离(<10KM)

文章目录 1.1 Bluetooth 1.2 CUAV PW-Link 1.3 ESP8266 wifi telemetry 1.4 ESP32 wifi telemetry 1.5 FrSky telemetry 1.6 Yaapu双向遥测地面站 1.7 HOTT telemetry 1.8 MSP(MultiWii 串行协议)(4.1 版) 1.9 MSP (version 4.2) 1.10 SiK Radio v1 1.11 SiK Radio …

速过计算机二级python——第9讲 详解第 2 套真题

第9讲 详解第 2 套真题 基本编程题【15 分】简单应用题【25 分】综合应用题【20 分】**问题 1**【10 分】:**问题 2【10 分】:**基本编程题【15 分】 考生文件夹下存在一个文件 PY101.py,请写代码替换横线,不修改其他代码,实现以下功能:【5 分】题目: import __________ b…

算法---回溯(正文)

1.什么是回溯&#xff1f; 回溯算法的定义就是和暴力枚举一样枚举所有可能并加撤回&#xff0c;也能和暴力一样去掉一些重复&#xff08;在之前就被筛出&#xff0c;但还要枚举这个&#xff0c;我们可以跳过这个了---------这个就是回溯剪枝&#xff09;。但为什么回溯不是暴力…

Python实现文本情感分析

前言 文本情感分析是一种重要的自然语言处理(NLP)任务&#xff0c;旨在从文本数据中推断出情感信息&#xff0c;例如正面、负面或中性情感。它在社交媒体分析、产品评论、市场调研等领域都有广泛的应用。本文将详细介绍如何使用Python进行文本情感分析&#xff0c;包括基础概念…

【从零开始学设计模式】第四章_抽象工厂模式(与工厂方法模式区分)

第四章_抽象工厂模式&#xff08;与工厂模式区分&#xff09; 1.介绍 1.1定义 为访问类提供一个创建一组相关或相互依赖对象的接口&#xff0c;且访问类无须指定所要产品的具体类 就能得到同族的不同等级的产品的模式结构&#xff1b; 1.2解决的问题 主要解决接口选择的问…

解析十六进制雷达数据格式:解析雷达数据类型。

以Cat62格式雷达数据为例&#xff0c;十六进制雷达数据部分代码&#xff1a; 3e0120bf7da4ffee0085 雷达数据使用2个字符&#xff08;1个字节&#xff09;标识&#xff0c;在这里是“3e”&#xff0c;转换为十进制数为62。 雷达数据类型父类&#xff1a; base_header_process…

Git简单了解

文章目录 1、Git概述2、Git下载与安装3、Git代码托管服务3.1、使用码云托管服务 1、Git概述 什么是Git Git是一个分布式版本控制工具&#xff0c;主要用于管理开发过程中的源代码文件&#xff08;Java类、xml文件、html页面等&#xff09;&#xff0c;在软件开发过程中被广泛使…

jvm问题自查思路

本文聊一下最近处理了一些jvm的问题上&#xff0c;将这个排查和学习过程分享一下&#xff0c;看了很多资料&#xff0c;最终都会落地到几个工具的使用&#xff0c;本文主要是从文档学习、工具学习和第三方技术验证来打开认知和实践&#xff0c;希望有用。 一、文档 不仅知道了…

新年新展望

去年其实是收获颇丰的一年&#xff0c;除了工作中各项工作都得到了很大的推进&#xff0c;个人生活中也有很多变化&#xff0c;其中还拿到了功能安全工程师的证书&#xff0c;以及功能安全经理的证书。 展望一下2024年准备输出的内容&#xff0c;一个是对ISO26262的解读&#x…

力扣刷题之旅:进阶篇(五)—— 动态规划(DP)的妙用

力扣&#xff08;LeetCode&#xff09;是一个在线编程平台&#xff0c;主要用于帮助程序员提升算法和数据结构方面的能力。以下是一些力扣上的入门题目&#xff0c;以及它们的解题代码。 --点击进入刷题地址 引言&#xff1a; 在算法的世界中&#xff0c;动态规划&#xff…

开发JSP应用程序

开发JSP应用程序 问题陈述 TecknoSoft Pvt Ltd.公司的首席技术官(CTO)John Barrett将创建一个应用程序的任务委托给了开发团队,该应用程序应在客户访问其账户详细信息前验证其客户ID和密码。客户ID应是数字形式。John希望如果所输入的客户ID或密码不正确,应向客户显示错误…