图解李白的“朋友圈”

《长安三万里》作为2023年票房第一的国漫电影,以安史之乱为背景,从诗人高适的视角铺设了一幅绚丽的历史长卷,细细讲述“诗仙”李白跌宕起伏的一生,以及大唐盛世一路荣耀幻灭的唏嘘。同时,在这部动画电影中出现了多位大诗人,可谓群星璀璨……

图片

李白算是唐代当之无愧的第一大V,非常喜欢结交朋友。杜甫、王维、孟浩然、王昌龄等其他诗人也算是头部顶流。诗圣杜甫是李白的迷弟,特别崇拜李白;李白则崇拜孟浩然;李白和高适曾经是好友,后面友谊的小船翻了!

图片

那么如何通过一种简单、直观地的方式,了解李白和他的“朋友圈”呢?那就不得不提到知识图谱了!   

什么是知识图谱?

知识图谱是以结构化的形式将节点通过关系相互连接起来,构成一张知识网络图。它可以把真实世界的各个场景抽象成图形,将信息表达成一种关系网络图。

举个例子,下图就是一个简单的图,节点(node)用红色标出,通过黑色的边(edge)连接。节点可以表示实体和属性,边可以表示为实体-实体和实体-属性之间的关系,这种形式对处理复杂的关联关系有着天然的优势,也更接近人类认知世界的形式,为数据处理提供了一种更好的组织和管理能力。

图片

通常来说知识图谱的生命周期分为:构建、存储管理以及应用,下面我们逐一为大家演示介绍。

如何构建李白“朋友圈”知识图谱?

如何利用现有的数据构建知识图谱一直是知识图谱领域的一个难题。知识图谱自动化构建平台gBuilder是通过结合NLP技术、机器学习、人工智能、知识图谱、图数据库等众多技术,打造的一个知识图谱自动化构建平台。我们可以利用知识图谱自动化构建平台将结构化数据通过D2RQ技术进行映射,无损转化成知识图谱。也可以通过编写数据抽取程序、抽取模型等方式对半结构化和非结构化的数据进行抽取。   

图片

此外,我们还提供了表单录入的方式,用户可通过填写表单便捷快速地构建知识图谱。首先,平台会根据schema自动生成每种实体类型的表单;然后,用户直接在页面上即可新增实体,通过填写表单的方式,录入实体属性及关系,最后生成RDF数据。

图片

    

图片

本次我们从互联网上搜集了有关《长安三万里》中的人物以及其他唐代著名诗人的基本信息,然后以诗人、诗歌为主要实体类型,梳理了诗人之间的关系,在gBuilder中用非结构化数据表单录入的方式,最终得到了唐朝诗人关系的RDF文件。(文件下载地址http://file.gstore.cn/f/3ff6db5ed4604abbbb5a/?dl=1)

RDF文件是构建知识图谱的基础,有了RDF文件之后,大家就可以构建知识图谱了。在实际项目中,也可以根据不同类型的数据选择不同的抽取方式,或多种方式结合的形式来构建知识图谱。         

图片

如何存储和管理知识图谱?

我们可以将生成的RDF数据无缝导入gStore中进行存储与管理。gStore是由北京大学王选计算机研究所邹磊教授领导的数据管理研究室(PKUMOD)研发的面向知识图谱的开源图数据库系统,支持数据库的增删改查、导入、导出、备份、还原、事务ACID等功能;支持横向动态扩展解决存储容量限制;在查询速度方面通过底层的源头创新可在百亿规模的数据集且包含六跳查询情况下做到秒级响应。   

2023年11月,gStore 上线发布了最新的V1.2版本,在V1.0版本基础上新增及优化了多项功能,详情请查看文章《gStore 1.2版本正式上线,体验再度升级!》,开源地址为:https://github.com/pkumod/gStore欢迎大家下载试用。

构建出来的知识图谱如何应用?

知识图谱构建完成后,我们就可以开始对李白及他的“朋友圈”用图的方式开始探索啦~

1. 知识图谱整体查询

我们可以在gStore可视化管理工具gWorkbench中输入SPARQL查询语句对整体的人物关系进行查询。查询语句:

SELECT *
WHERE {?a ?b ?c .
}

查询结果:   

图片

2. 李白“朋友圈”查询

我们可自定义输入SPARQL语句,一目了然地看到李白“朋友圈”的社交关系。

查询语句:

SELECT *
WHERE {<李白> ?b ?c .?c ?a ?d .?d ?d1 ?d2 .?d2 ?c1 ?c2 .?c2 ?c3 ?c4 .
}

查询结果:

图片

3.李白所有相关信息查询

我们可输入SPARQL检索与之关联的其他实体。比如我们想看李白相关的所有信息,输入下方查询Sparql语句即可:

SELECT *
WHERE {<李白> ?b ?c .
}

查询结果:    

图片

4.李白的代表作里涉及哪些城市和著名景点

李白的代表作《望庐山瀑布》是其初游庐山时所作,以庐山的香炉峰入笔描写庐山瀑布之景。《黄鹤楼送孟浩然之广陵》是李白创作的一首送别诗。首句点出送别的地点:一代名胜黄鹤楼;二句写送别的时间与去向:“烟花三月”的春色和东南形胜的“扬州”。

图片

那么李白还在哪些地方留下了他绝美的诗句,带我们领略了哪些祖国的名胜古迹呢?我们可以通过查询语句:    

SELECT *
WHERE {
<李白> <代表作> ?a .
?a ?b ?c.
}

查询结果:    

5.重要诗人分析

我们还可以采用紧密中心性算法来对重要诗人进行分析。紧密中心性算法gStore的内置图分析算法。具体的查询SPARQL语句:  

SELECT (closenessCentrality(?t , false, {}) AS ?x) 
WHERE{
?t a <诗人>
}

我们只取排名前5的诗人,查询结果为:

{"paths":[{"src":"<李白>","result":0.65625},{"src":"<杜甫>","result":0.575342},{"src":"<王维>","result":0.545455},{"src":"<王昌龄>","result":0.545455},{"src":"<孟浩然>","result":0.531646}]
}

从而我们可以发现李白、杜甫、王维、王昌龄、孟浩然在唐代诗人中具有重要地位。

由于本次录入的数据量比较小,只给大家展示了图分析比较基础的功能。除了以上应用,知识图谱在金融监管、公安侦查、政务大数据、智慧医疗、智慧教育等领域也有广泛应用。

我们已经将之前发布的《狂飙》、《人民的名义》、《水浒传》、西方哲学等相关数据集分享至基于gCloud云服务平台中(http://cloud.gstore.cn/),欢迎大家登录云平台探索更多知识图谱的应用。   

相关阅读

图解《狂飙》人物关系

图解西方哲学

图说《人民的名义》

图片

图片

免责声明:本文封面及插图来源于网络开放信息,如有侵权,请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2804236.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

CP04大语言模型ChatGLM3-6B特性代码解读(2)

CP04大语言模型ChatGLM3-6B特性代码解读&#xff08;2&#xff09; 文章目录 CP04大语言模型ChatGLM3-6B特性代码解读&#xff08;2&#xff09;构建对话demo_chat.py定义client对象与LLM进行对话 构建工具调用demo_tool.py定义client对象定义工具调用提示词定义main&#xff0…

接口测试需求分析

测试接口的时候&#xff0c;可能很多人都会想&#xff0c;按着研发给的接口协议文档来测&#xff0c;不就好了吗&#xff1f; 其实&#xff0c;对于接口的测试&#xff0c;还需要有点深度的需求分析&#xff0c;然后再进行对应的测试。对于接口测试&#xff0c;这里有个不太详…

利用nginx内部访问特性实现静态资源授权访问

在nginx中&#xff0c;将静态资源设为internal&#xff1b;然后将前端的静态资源地址改为指向后端&#xff0c;在后端的响应头部中写上静态资源地址。 近期客户对我们项目做安全性测评&#xff0c;暴露出一些安全性问题&#xff0c;其中一个是有些静态页面&#xff08;*.html&…

Android 开发一个耳返程序(录音,实时播放)

本文目录 点击直达 Android 开发一个耳返程序程序编写1. 配置 `AndroidManifast.xml`2.编写耳返管理器3. 录音权限申请4. 使用注意最后我还有一句话要说怕相思,已相思,轮到相思没处辞,眉间露一丝Android 开发一个耳返程序 耳返程序是声音录入设备实时播放的一种程序,理论上…

XFF伪造 [MRCTF2020]PYWebsite1

打开题目 直接查看源码 看到一个./flag.php 访问一下 购买者的ip已经被记录&#xff0c;本地可以看到flag&#xff0c;那么使用xff或者client-ip伪造一下ip试试 bp抓包 加一个X-Forwarded-For头 得到flag

关于git子模块实践(一)

背景 在日常项目开发中&#xff0c;随着项目的迭代&#xff0c;不可避免的是主项目会引入到很多三方库&#xff0c;或者自研的一些模块。有一种场景&#xff0c;就是这些模块&#xff0c;是随着开发而进行迭代&#xff0c;且多个项目公用的&#xff0c;这种情况&#xff0c;在…

探讨javascript中运算符优先级

如果阅读有疑问的话&#xff0c;欢迎评论或私信&#xff01;&#xff01; 本人会很热心的阐述自己的想法&#xff01;谢谢&#xff01;&#xff01;&#xff01; 文章目录 深入理解JavaScript运算符优先级运算符优先级概述示例演示示例1&#xff1a;加法和乘法运算符的优先级示…

86、移除推理路径上的所有内存操作

动态申请内存的影响,前两节已经介绍过了,细心的朋友可能会发现,在使用 C++实现的 resnet50 代码中,还存在一处动态申请内存的操作。 那就是对于每一层的输入或输出 feature map 数据进行内存申请,比如在 3rd_preload/ops/conv2d.cc 文件中,卷积的计算中存在对于输出 fea…

MaxScale实现mysql8读写分离

MaxScale 实验环境 中间件192.168.150.24MaxScale 22.08.4主服务器192.168.150.21mysql 8.0.30从服务器192.168.150.22mysql 8.0.30从服务器192.168.150.23mysql 8.0.30 读写分离基于主从同步 1.先实现数据库主从同步 基于gtid的主从同步配置 主库配置 # tail -3 /etc/my.…

Aigtek电压放大器的应用场合有哪些

电压放大器是一种主要用于信号处理的重要电子设备&#xff0c;它可以将输入的低电压信号放大到较高的输出电压水平。在各个应用领域中&#xff0c;电压放大器发挥着重要的作用。下面西安安泰点击将介绍电压放大器的应用场合。 通信系统&#xff1a;电压放大器在通信系统中具有重…

ant-design-charts 对带缩略轴柱状图 根据数据自定义列处理, 以颜色为例

摘要 本文主要对ant-design-charts中带缩略柱状图进行自定义列处理 ant-design-charts版本&#xff1a;1.4.2 1、定义数据 const data1 [{"a": "七台河","b": 52827.32,c: 2},{"a": "万县","b": 20000,c: 1},…

队列的基本操作——常见队列的对比分析(c语言完整代码包含注释)

目录 一、队列 1.1基本概念 1.2基本操作 1.3 队列分类 1.3.1带头队列 1.3.2不带头队列 1.3.3 循环带头队列 1.3.4 循环不带头队列 1.3.5 总结 二、代码实现 2.1带头队列 2.2不带头队列 2.3循环带头队列 2.4循环不带头队列 一、队列 1.1基本概念 队列&#xff08…

openGauss学习笔记-227 openGauss性能调优-系统调优-其他因素对LLVM性能的影响

文章目录 openGauss学习笔记-227 openGauss性能调优-系统调优-其他因素对LLVM性能的影响 openGauss学习笔记-227 openGauss性能调优-系统调优-其他因素对LLVM性能的影响 LLVM优化效果不仅依赖于数据库内部具体的实现&#xff0c;还与当前所选择的硬件环境等有关。 表达式调用C…

Ubuntu 20.04.1 共享samba给windows 10

通过ssh登录ubuntu&#xff0c;修改/etc/下的smb配置文件&#xff0c; uidq4932hzh57415u:/work$ cat /etc/samba/smb.conf [global] security ads realm V01.NET workgroup V01 idmap uid 10000-20000 idmap gid 10000-20000 winbind enum users yes winbind enum grou…

pandas/geopandas 笔记:判断地点在不在路网上 不在路网的点和路网的距离

0 导入库 import osimport pandas as pd pd.set_option(display.max_rows,5)import osmnx as oximport geopandas as gpd from shapely.geometry import Point 1 读取数据 假设我们有 如下的数据&#xff1a; 1.1 新加坡室外基站位置数据 cell_stationpd.read_csv(outdoor…

耐腐蚀的液位传感器有哪些

液位传感器在不同的应用环境中有着不同的要求&#xff0c;特别是在需要耐腐蚀性液体的环境中&#xff0c;选择合适的传感器至关重要。对于这种情况&#xff0c;一种常见且有效的选择是不锈钢液位传感器。 不锈钢液位传感器具有耐腐蚀性好、安装简便、功耗低、耐压性强等优点。…

企业计算机服务器中了crypt勒索病毒怎么办,crypt勒索病毒解密数据恢复

计算机服务器设备为企业的生产运营提供了极大便利&#xff0c;企业的重要核心数据大多都存储在计算机服务器中&#xff0c;保护企业计算机服务器免遭勒索病毒攻击&#xff0c;是一项艰巨的工作任务。但即便很多企业都做好的了安全运维工作&#xff0c;依旧免不了被勒索病毒攻击…

shiro 整合 springboot 实战

序言 前面我们学习了如下内容&#xff1a; 5 分钟入门 shiro 安全框架实战笔记 shiro 整合 spring 实战及源码详解 这一节我们来看下如何将 shiro 与 springboot 进行整合。 spring 整合 maven 依赖 <?xml version"1.0" encoding"UTF-8"?> …

Spring Boot应用集成Actuator端点自定义Filter解决未授权访问的漏洞

一、前言 我们知道想要实时监控我们的应用程序的运行状态&#xff0c;比如实时显示一些指标数据&#xff0c;观察每时每刻访问的流量&#xff0c;或者是我们数据库的访问状态等等&#xff0c;需要使用到Actuator组件&#xff0c;但是Actuator有一个访问未授权问题&#xff0c;…

2.21日学习打卡----初学Nginx(一)

2.21日学习打卡 目录: 2.21日学习打卡一. Nginx是什么&#xff1f;概述Nginx 五大应用场景HTTP服务器正向代理反向代理正向代理与反向代理的区别&#xff1a;负载均衡动静分离 为啥使用Nginx? 二.下载Nginx&#xff08;linux&#xff09;环境准备下载Nginx和安装NginxNginx源码…