漫谈AI 时代的信息模型

模型化- 数字化转型的重要基石 

     在各行各业推行数字化转型过程中,构建信息化模型十分重要,它是数字化转型的基石。事实上,数字化转型的核心是“万物皆模型”,在工业领域,以德国为主导的工业4.0 发展进程中,标准信息模型的构建是主要工作之一。他们提出了资产管理壳模型的概念和一系列标准。并且着力于各种物理设备,软件服务等数字化模型的构建。步伐稳健又迅速。在产品研发阶段重点发展基于AutomationML语言的建模,而现场控制领域正逐步推广OPCUA 信息化模型和协议的应用。

    所有的信息模型几乎都是采用了形式化语言描述的结构化数据。并且清晰地定义了模型的语义。使信息模型能够被机器和软件准确地理解和一致性性访问。主要的描述语言是XML 语言,鉴于JSON语言的处理简洁性,也有部分模型使用JSON格式描述。

共识-语言的基础

        语言的核心是语法和语义。 对于人类自然语言而言,语法和语义都不是非常规范的。有时候是模糊的含义和简化的语法。人类依靠“社会俗称规约”相互理解。但是在大语言模型(LLM)还没有出现之前,机器仍然无法准确地使用自然语言相互交流。于是人类创建了各种形式化语言,它们具有严格的语法和语义定义。这种形式化语言是人类自然语言的一个子集。消除了自然语言的二义性。

  机器之间交换信息的方式也受到严格的定义,这便是通信协议(protocol)。因此,语法,语义和协议是机器交流信息的三要素。

     推广一种形式化机器语言的关键是语言的标准化及其推广。使用者之间达成共识。流行的机器之间的语言包括 modebus,TCP/IP,CAN,OPC UA ,,AutomationML,工业4.0 知产管理壳等等语言和协议。

万物皆模型-并非易事

        从技术的角度来看,构建各种资产的数字化模型并不存在什么障碍。现代IT技术提供了各种方法和工具。但是实现“万物皆模型”的目标却并非易事。

      采用开放的数字模型,意味着各利益方打破了原有的护城河,大公司除非找到了新的技术壁垒,它们不会轻易地拥抱开放系统。

   数字化模型的生态没有形成之前,个别公司或者个别项目中采用基于模型的设计方法可能比传统设计工作量更大。学习和采纳模型化设计方法的意愿不足。而且难以达成共识!

      由于缺乏广泛的用户,模型化设计的工具软件短缺。

    构建资产数字化模型需要专业领域的专家与自动控制与IT行业专家的通力合作。在德国和欧洲,这些行业的数字化模型是由专业的行业协会发起并组织实施的。而我国的行业协会不具备这样的组织能力。

         由此可见,构建制造业资产数字化模型是一件说说容易,干起来费劲的事情。笔者看来,至今没有找到可行的方法。

       我们需要寻找一种方法,实现便捷,低成本,大批量地构建数字化模型。只有模型库非常丰富之后,人们才会喜欢使用基于模型的设计,生态才会形成。

大语言模型LLM-建模的新工具

        大语言模型的出现,极大地提升了机器理解人类自然语言的能力。人们似乎看到了希望,是否能够直接使用自然语言提示大语言模型自动建立资产的数字化模型呢?

     人们普遍对LLM 的能力预期过高,让它回答刁钻的问题,一旦chatGPT答非所问,又对LLM失去了信心。对于LLM 编程写代码这样的事情同样是如此,一开始就让它直接写计算机程序。对于LLM 产生的错误再嘲笑一番。

     令人遗憾的是目前大模型目前还不能完成这项工作。由于工业领域的资产描述内容繁多,准确性和一致性要求非常高。而大语言模型构建的模型会出现一定概率的差异性。

         

中间语言-AI时代的建模方法

    语言大模型基于模型模板(template)构建模型。而不是基于schema或者元模型规范来建立模型。因此,除非有大量的模板供LLM 学习,直接生成形式化的模型比较困难。

        同样地,LLM 生成程序代码也是基于代码的实例来构建代码的。由于网络上程序代码比较多,所以效果要好一点,但是如果需要实现比较复杂的控制算法,它就无能为力了,除非是已有的标准算法。目前的许多程序代码没有详细的注解和描述,LLM 能够学习语言的语法,却难以理解语义。

     以笔者的观点,如果要让LLM 生成形式化的模型文本或者复杂的程序代码,使用中间语言更加有效。

        所谓中间语言(模型)是指一个介于自然语言和形式化语言之间的语言,它有利于从自然语言描述转换,有能够转化成为标准化的机器可读的程序或者模型。

    LLM 的出现使机器理解自然语言的能力大幅度提升,它对语言的语法要求降低了,另一方面,自然语言能够表达语义明确的内容,比如:

  • 我要吃饭
  • 我想吃饭
  • 我想要吃饭

      这三句话表达的含义是一致的,明确的。所以说,自然语言完全能够准确的描述事物(模型),只是需要有一定的表达能力和逻辑性(或者说限制)就可以了。要比计算机的形式化语言的简单的多。使用中间语言建立自然语言和机器语言之间的桥梁是可行的方法。

    

         LLM 最擅长的是自然语言的理解和生成,但是它要完成复杂的AI能力,仍然需要使用各种传统的IT工具,比如网络搜索,数据库,软件工具。才能完成复杂的AI任务。所谓智能体是通过自然语言连接起来的工具链(langchain)实现的,我们已有的所有IT技术是AI的基础。其中包括工业自动化行业的各种标准,建模方法和理论。

      许多人没有将大语言模型和大语言模型的应用程序区分开来,其实许多所谓的大模型大模型的应用,它通过大模型调用各种软件工具实现的神奇能力。所以说,并不是由于LLM 的出现,其它技术都歇菜了,程序员要失业了。IT 工程师的作用依然非常重要,我们为LLM 提供新的工具,让它能够做的更多,更好。

中间语言有如下几个特点:

  • 简单的结构化形式语言

        比如使用JSON 格式或者其他DSL 语言描述。这种结构化模型能够通过程序转化为机器可读的形式化模型。能够通过程序转化为标准化的数字模型或者代码,例如管理壳,OPCUA 模型,计算机代码等。在转化过程中,根据模型的规范,自动添加规范中要求的语义、语法细节。

  • 代码或者模型中增加了比较多的自然语言描述(Description)

       有利于LLM 理解模型或者语言模型的含义,帮助LLM 准确地生成基于中间语言的代码或者模型。

在中间模型中,每个对象,属性都要增加描述(Description)例如

   current=     {

            value:10"

            description :"current of motor Driver"

           unit:"A"

        }

 同样地,在程序代码中的每个函数也需要描述,例如

   一个获取天气的函数function get_weather(locaton)需要下面的描述

  {
            "name": "weather",
            "description": "当需要了解天气时调用 需要 位置参数",
            "parameters": {
                "type": "object",
                "properties": {

                    "location": {
                        "type": "string",
                        "description": "输入您想要了解天气的位置。 示例:无锡",
                    },
                },
                "required": ["location"],
            },
        }

LLM 通过描述理解语义,未来的程序对于“人类”的可读性又非常重要了,这一次是LLM的可读性。

  •    能够转换成标准的模型

   中间语言是形式化结构型语言,通过添加细节,能够使用软件工具转换成标准化的模型文本。   比如OPC UA 和资产管理壳(AAS)。

        这种方法已经被人采纳过,例如OPCUA 的NodeSet2 格式非常复杂,OPCUA 基金会设计了一种ModelDesign的中间模型,通过基金会提供的UAModelCompier 软件生成C# 代码和NodeSet2.xml。ModelDesign便于人工编写和其它程序输出。

   由此可见,中间语言是介于自然语言与计算机语言之间的一种“高级”语言。中间语言和模型的另一个优点是它能够生成各种程序设计语言的代码和模型。

初步的实验

在下面的实验中,我们将分三步进行:

  • 基于工业4.0 的资产管理壳的数据模型,设计一种资产模型(中间模型)
  • 将自然语言编写的资产模型描述通过LLM 生成中间模型
  • 设计一个软件工具将中间模型转换成标准的AAS XML 文档

(待续)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2982372.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

七分钟“手撕”三大特性<多态>

目录 一、学习多态之前需要的知识储备 二、重写 1.什么是重写 2.重写可以干嘛 3.怎么书写重写 4.重载与重写的区别 三、向上转型 1.什么是向上转型? 2.向上转型的语法 3.向上转型的使用场景 四、多态是什么 六、多态实现 七、多态的好处 八、多态的缺…

机器学习/算法工程师面试题目与答案-数学基础部分

机器学习/算法工程师面试题目--数学基础部分 一、数学基础1、微积分SGD,Momentum,Adagard,Adam原理L1不可导的时候该怎么办sigmoid函数特性 2、统计学,概率论求 Max(a, b) 期望拿更长的玫瑰花的最好策略最大化工作天数的员工数切比雪夫不等式随机截成三段组成三角形…

[tkinter实现]汉字笔顺小软件

软件简介 本软件旨在帮助小学生通过互动式学习掌握汉字的基本笔画和笔顺。软件采用Tkinter库构建,提供了一个用户友好的图形界面,适合小学生使用。 主要功能: 汉字展示:软件能够展示单个汉字,并以动画形式演示其标准…

SWOT分析法:知彼知己的战略规划工具

文章目录 一、什么是SWOT分析法二、SWOT分析法如何产生的三、SWOT分析法适合哪些人四、SWOT分析法的应用场景五、SWOT分析法的优缺点六、SWOT分析实例 一、什么是SWOT分析法 SWOT分析法是一种用于评估组织、项目、个人或任何其他事物的战略规划工具。SWOT是Strengths&#xff…

每日OJ题_BFS解决拓扑排序③_力扣LCR 114. 火星词典

目录 力扣LCR 114. 火星词典 解析代码 力扣LCR 114. 火星词典 LCR 114. 火星词典 难度 困难 现有一种使用英语字母的外星文语言,这门语言的字母顺序与英语顺序不同。 给定一个字符串列表 words ,作为这门语言的词典,words 中的字符串已…

光伏储能控制系统的功能策略

一、控制策略 1、功率控制策略 光伏阵列的输出功率受光照和温度影响,最大功率点是转换太阳能为电能的最高效点。MPPT控制器根据实时参数调整光伏阵列工作点,确保其始终处于最大功率输出状态,提高能量转换效率,增加发电量&#x…

基于51单片机智能鱼缸仿真LCD1602显示( proteus仿真+程序+设计报告+讲解视频)

基于51单片机智能鱼缸仿真LCD显示 1. 主要功能:2. 讲解视频:3. 仿真4. 程序代码5. 设计报告6. 设计资料内容清单&&下载链接资料下载链接: 基于51单片机智能鱼缸仿真LCD显示( proteus仿真程序设计报告讲解视频) 仿真图prot…

免费开源!手机上有这一款软件就够了!

今天这款软件解决了你们最近常问我的资源问题,甚至解决的不是一种,而是好多种,所以这款软件我一定要分享给你,也建议需要这方面软件的小伙伴都去体验一下,说不定就爱上了呢。 01 - 简阅免费小说(安卓&#…

低代码信创开发核心技术(四)动态元数据系统设计

一、概述 在当今快速发展的信息技术领域,动态元数据系统扮演着至关重要的角色。它不仅能够提供数据的描述信息,还能动态地适应业务需求的变化,从而提高系统的灵活性和可扩展性。构建一个动态元数据系统意味着我们可以在不重启系统的情况下&a…

CUDA的应用场景

CUDA的应用场景随着技术的发展不断扩展,其核心优势在于能够显著提高并行计算任务的处理速度,这对于任何需要处理大量数据和执行复杂计算的领域都是极其有价值的。CUDA开发的应用场景非常广泛,主要得益于其强大的并行计算能力,以下…

上网行为管理软件有哪些?三款常用上网行为管理软件评测

互联网的普及,企业和个人对于网络安全和信息保护的需求越来越高。为了确保网络环境的安全和稳定,上网行为管理软件应运而生。本文将对三款常用的上网行为管理软件进行评测,分别是域智盾、Splunk Enterprise Security和安企神。 1、域智盾 域…

冯喜运:4.24 周三黄金原油市场分析报告及操作策略

黄金消息面解析:周三(4月24日)黄金反弹后微幅回跌,金价在2325美元附近喘息。尽管美国国债收益率下降,美元走弱,金价未能维持涨势。标普全球PMI弱于预期,引发了对美联储可能降息的猜测。中东地缘紧张局势有所缓解&#…

dist包在windows的nginx下部署运行

nginx 附带下载包 我用夸克网盘分享了「nginx-1.18.0.zip」 链接:https://pan.quark.cn/s/e87bbf87a742 将dist放到html文件目录下 3.找到nginx的配置文件,conf 下,用编辑器打开 nginx.conf 编辑。 location ^~/api {rewrite ^/api/(.*)…

kubernetes中DaemonSet控制器

一、概念 使用DaemonSet控制器,相当于在节点上启动了一个守护进程。通过DaemonSet控制器可以确保在每个节点上运行Pod的一个副本。如果有心的node节点加入集群,则DaemonSet控制器会自动给新加入的节点增加一个Pod的副本;反之,当有…

企业工商信息查询API接口如何对接

企业工商信息查询API接口指的是输入公司名全称/注册号/社会统一信用代码的任意一种,获得企业工商注册登记中包含的各类重要信息,主要信息包括:注册号,注册资金,登记机关,注册地址,核准时间&…

Maven基础篇6

Idea环境中资源上传与下载 具体问题本地仓库如何与私服打交道; 本地仓库向私服上传文件,上传的文件位置在哪里? 访问私服配置相关信息:用户名密码; 下载东西,需要的各种信息,需要的仓库组的…

JavaEE 初阶篇-深入了解网络通信相关的基本概念(三次握手建立连接、四次挥手断开连接)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 网络通信概述 1.1 基本的通信架构 2.0 网络通信三要素 3.0 网络通信三要素 - IP 地址 3.1 查询 IP 地址 3.2 IP 地址由谁供应? 3.3 IP 域名 3.4 IP 分…

H800算力低至5.99元/卡时!抢鲜体验LLaMA3最佳实践就在潞晨云

由Meta发布的LLaMA3 8B和LLaMA3 70B的,将开源AI大模型推向新的高度。在多个基准测试上的表现均大幅超过已有竞品,成为AI应用的最新优选。 潞晨云现已上架 LLaMA3 8B和LLaMA3 70B从推理到微调和预训练的实践教程。 提供免费测试代金券,限时特…

树莓派学习之入门必会操作

树莓派学习之入门指南 一、软件准备二、镜像烧录三、远程登录 一、软件准备 ①raspberry pi image(官方烧录工具,将操作系统烧录到SD卡,SD卡插入树莓派) ②putty(远程登录软件,输入ip,以及username/password就可以远程登录树莓派不带图形化的…

【SMART目标法】项目管理必会的思维分析工具 06

SMART分析方法,是让管理者的工作变被动为主动的一个很好的手段。实施目标管理不但是有利于员工更加明确高效地工作,更是为未来的绩效考核制定了目标和考核标准,使考核更加科学化、规范化,更能保证考核的公开、公平与公正。 “sma…