浙大知识图谱基础:学习笔记

0 基础知识

  • 知识图谱中,知识的结构化表示主要有符号表示向量表示两类方法。符号表示包括:一阶谓词逻辑,语义网络,描述逻辑和框架系统等。当前主要采用基于图的符号化知识表示,最常用的是有向标记图

  • 有向标记图分为:属性图(property graph)和RDF图(Resource Description Framework,RDF)。

    • 属性图:图数据库Neo4j实现的图结构表示模型,工业界最常用的知识图谱建模方法。优点:允许为实体或边添加属性,易于存储和查询。缺点:缺乏工业标准规范的支持,不关注更深层次的语义表达、不支持符号逻辑推理。
      • 顶点(vertex)/节点(node)
      • 边(edge)/关系(relation):有向边和对应标签
      • 标签(label)
      • 属性(property):键值对
    • RDF:W3C推出的语义数据交换标准与规范,支持逻辑推理。RDF的基本组成单元是 (S,P,O)三元组,(Subject主,Predicate谓,Object宾)。
      • 在RDF的基础上还提供了RDFS(Resource Description Framework Schema)。定义了Class、subClass、Property、subProperty、domain、range、type…等概念。
  • OWL(Ontology Web Language): 在RDFS的基础上增加了更多的语义表达构建,如一对多、多对一、多对多等关系,全称量词和存在量词,互反关系、传递关系、自反关系、对称性等。

1 图数据存储

  • 知识图谱的存储分为:基于关系数据库的存储和基于原生图的存储。图数据库对于知识图谱并非必须项。
  • 考虑存储结构主要考虑:存储的物理结构、存储的性能问题、图的查询问题。

基于关系数据库的存储

  • 一般不用这种方式,除非场景非常简单。
  • 图上的查询语言:SPARQL。
  • 最简单的存储:SPO三元组
  • 属性表存储:把同一实体类型的属性组织为一张表进行存储。优点:self-join减少了。缺点:空值多,对Subject聚类比较复杂,不易处理多值属性。

  • 二元表存储:对三元组按属性分表。优点:无空值,不用聚类,对subject-subject-join性能好,缺点:insert代价高,subject-object join性能差。
  • 全索引结构存储:

基于原生图的存储

  • Neo4j 定义了图查询语言:Cypher。
  • 实现原理:免索引邻接(index-free adjacency),为每个节点维护了一组指向相邻节点的引用,这个引用可以看作相邻节点的微索引。



2 知识抽取

  • 文本知识抽取:命名实体识别、概念抽取、关系抽取、事件抽取。

命名实体识别

  • 最朴素的做法是定义规则进行正则匹配,但规则难以维护。因此一般用AI来进行序列标注。

  • 基于机器学习的方法有:HMM、CRF;目前主要研究基于深度学习的序列标注算法,如CNN/RNN/Transformer,如:BiLSTM+CRF,基于预训练模型。

  • 参考文献:《A Survey On Deep Learning for Named Entity Recognition》(TKDE2020)

关系抽取与属性补全




  • 实体-关系联合抽取


  • 多元关系

  • 半监督
  • 属性补全:

  • 参考资料:开源中文关系抽取框架 deepke

概念抽取


事件识别与抽取






知识抽取前沿问题






3 知识图谱推理



基于本体的推理




基于规则的推理







基于embedding的推理




基于规则学习的推理

本章后续略。

4 知识融合




本体匹配


  • 距离度量:编辑距离、汉明距离、字串相似度、dice距离、jaccard系数等等;

实体对齐



  • 知识融合工具:silk


技术前沿



5 基于知识图谱的智能问答系统







基于查询模板的知识图谱问答

  • TBSL














基于语义解析的知识图谱问答

  • 一步解析的困难:
  • 更合理的方式是两步解析:






  • 短语重写:

基于检索排序的知识图谱问答


  • 实体链接






基于深度学习的知识图谱问答








6 图算法与图数据分析

图神经网络与图表示学习


























图神经网络与知识图谱










7 知识图谱前沿

多模态知识图谱





知识图谱与语言预训练







事理知识图谱









知识图谱与低资源学习











Reference

  1. 浙大 知识图谱
  2. 知识图谱:知识表示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/255174.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

识别在线视频中的歌曲并下载音乐

问题:视频中的歌曲觉得很好听,但又不知道是什么歌曲,如何解决? 1、在chrome商店中找到aha music 插件。 2、安装. 3、打开需要识别的视频网站,点击aha music按钮。 4、当找到该歌曲时,点击。 5、按F12 在…

小程序简单实现搜歌、听歌

这篇文章用了两个网易云音乐的接口(不清楚是否是官方的),附上官方接口链接: 网易云音乐API / 本文所用接口: 1、http://musicapi.leanapp.cn/search 2、http://neteasecloudmusicapi.zhaoboy.com/song/url 效果图 相关代码如下 先…

java爬虫爬取音乐

以前写过一个音乐网站,我都是手动去下载音乐,并上传到网站,非常麻烦。 学习了HttpClinet和Jsoup 我决定完成一个简单的爬虫去收集音乐信息,并下载音乐; 先尝试做几个简单的小功能: 基本功能 1.根据歌曲…

计算机上面的音乐,电脑上如何识别音乐

电脑上如何识别音乐 我们都知道怎么在手机上使用软件来实现识别音乐的功能,但是在网上怎么识别呢。那么电脑上如何识别音乐呢?下面就让jy135小编来告诉大家吧,欢迎阅读。 首先打开midomi网站(http://www.midomi.com/) 见下图 点击网站上的“Click and S…

python音乐爬取

思路 本次爬取音乐使用reqursts模块,在安装此模块的基础上爬取音乐。 首先要获取抓包链接,这是一串网址,获取方法就是当你在浏览器界面播放音乐时打开开发者界面寻取。其次使用get()向服务器发送get请求 .content获取二进制数据。最后将此写入…

Spring AOP简介及相关案例

目录 一、Spring AOP简介 二、AOP相关术语 三、AOP入门案例 1. 引入依赖 2. 编写连接点 3. 编写通知类 4. 配置切面 5. 测试 四、通知类型 1. 编写通知方法 2. 配置切面 3. 测试 五、切点表达式 六、多切面配置 1. 编写发送邮件的通知 2. 配置切面 3. 测试 …

Java与数据库:JDBC和ORM框架的使用和效率优化

第一章:引言 随着互联网的快速发展和大数据时代的到来,数据库在软件开发中起到了至关重要的作用。Java作为一门强大而广泛应用的编程语言,提供了多种与数据库交互的方式。其中,JDBC和ORM框架是最常用的两种方式。本文将深入探讨J…

适合打游戏用的蓝牙耳机有哪些?吃鸡无延迟的蓝牙耳机推荐

现在手游的兴起,让游戏市场变得更加火爆,各种可以提高玩家体验的外设也越来越多,除了提升操作的外置按键与手柄外,能带来更出色音质与舒心使用的游戏耳机,整体氛围感更好,让玩家在细节上占据优势&#xff0…

打游戏的蓝牙耳机推荐哪一款?吃鸡蓝牙游戏耳机推荐

选倒一款好的蓝牙耳机,即可以享受美妙音乐,也可以沉浸于深度游戏体验之中,能够让自己的身心压力得到释放。不过呢,最近发现很多人在买蓝牙耳机的时候都不知道怎么选一款靠谱的产品。作为已有5年多玩机经验的爱好者,今天…

即兴演讲、怎么锻炼即兴演讲能力、一些即兴演讲的模板

文章目录 应有素质准备方法模糊性临场性 组合形式并列式正反式递进式 基本技巧举例说明**一. 散 点 联 想 法****二. 问题--原因--解决方案****三. 感谢--回顾--愿景****四. 观 音 按 揭 法****五. 黄 金 三 点 法****六. 总 结****1. 五个名称-锻炼你的大脑快速反应能力****2.…

String字符串

文章目录 String类String常用的字符串处理方法StringBuffer类 StringBufferStringBuffer类中常用的方法StringBuilder类(了解为主)StringTokenzier类(了解为主) final属性,不可扩展,不可子类,不…

在idea中创建一个SpringBoot模块

方式一:自动创建(需要联网) 第一步:新建模块 按住ctrlshiftalts,打开项目结构,选择新建模块; 第二步:选择Spring Web (1)选择SpringBoot版本&#xff0c…

结构型模式的设计模式笔记

此笔记是在软件秘笈-设计模式那点事上做的笔记 一.适配器模式 1.设计思路 既有的软件结构具有稳定运行的基础,但是却无法直接利用到新的程序当中,这时就需要一个适配器,在原有内容和新的结果之间沟通,从而达到预期的效果 &#…

asp.net 面试题目

1、页面传值的方式及其优缺点?Session,Application,Cookies,Requst.QueryString,Requst.Form,Server.Transfer(通过Context.Handler接收整个页面)2、ASP.NET身份验证方式及其工作原理Windows 身份验证提供程序提供有关如何将 Windows 身份验证与 Microsoft Internet 信息服务 …

浮躁的原罪-兼答网友留言

交流的起点: 首先感谢所有回帖和关注的网友。因为下面主要是对异议和反对者的答复,这看来对支持/认同我的观点和心有戚戚焉的各位不公平,所以这里先对你们的支持表示感激。无论是对反对者还是支持者,随着我的观点的展…

【案例】 生成词云玩玩?

案例介绍 今天我们来生成词云,所谓词云,就是以一定的频度将大小不用的词汇显示在图片模板上。 准备工作 wordcloud(生成词云核心)PILnumpyjieba(提供分词功能)模板图片需要分析的文本 模板图片 文本内容…

python汉语意思-python汉语谐音

广告关闭 2017年12月,云社区对外发布,从最开始的技术博客到现在拥有多个社区产品。未来,我们一起乘风破浪,创造无限可能。 上面介绍beautifulsoup的特点时说到了,beautifulsoup支持python标准库的解析器html5lib&…

android的属性如何使用方法,Android第二大控件,EditText的属性和使用方法

原标题:Android第二大控件,EditText的属性和使用方法 EditText与TextView非常相似,它甚至与TextView 共用了绝大部分XML属性和方法。EditText与TextView的最大区别在于:EditText可以接受用户输入。 一、EditText简介 EditText支持…

android textview点击部分,Android开发第二大控件,EditText的属性和使用方法

EditText与TextView非常相似,它甚至与TextView 共用了绝大部分XML属性和方法。EditText与TextView的最大区别在于:EditText可以接受用户输入。 一、EditText简介 EditText支持的XML属性及相关方法见TextView表中介绍的与输入有关的属性和方法&#xff0c…

C# 学习笔记入门篇

文章目录 C# 学习笔记入门篇〇、写在前面Hello World!这篇学习笔记适合什么人这篇学习笔记到底想记什么附加说明 一、命名空间“进入”命名空间嵌套的命名空间、分立的命名空间习题习题答案 二、类与面向对象相关概念在 C# 中定义类静态方法,程序入口习题 三、变量其…