likes
comments
collection
share

Neo4J 快速入门

作者站长头像
站长
· 阅读数 4

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用 可视化技术描述知识资源及其载体,挖掘、分析、 构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、 图形学、信息可视化技术、 信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、 前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

简介

知识图谱由于其数据包含实体、属性、关系等,常见的关系型数据库诸如MySQL之类不能很好的体现数据的这些特点,因此知识图谱数据的存储一般是采用图数据库(Graph Databases)。而Neo4j是其中最为常见的图数据库。

安装

首先在 neo4j.com/download/ 下载 Neo4J。Neo4J分为社区版和企业版,企业版在横向扩展、权限控制、运行性能、HA等方面都比社区版好,适合正式的生产环境,普通的学习和开发采用免费社区版就好。

在Mac或者Linux中,安装好jdk后,直接解压下载好的Neo4J包,运行bin/neo4j start即可。

使用

Neo4J提供了一个用户友好的web界面,可以进行各项配置、写入、查询等操作,并且提供了可视化功能。类似ElasticSearch一样,我个人非常喜欢这种开箱即用的设计。

打开浏览器,输入http://127.0.0.1:7474/browser/,如下图所示,界面最上方就是交互的输入框。

Neo4J 快速入门

Cypher 查询语言

Cypher 是Neo4J的声明式图形查询语言,允许用户不必编写图形结构的遍历代码,就可以对图形数据进行高效的查询。Cypher的设计目的类似SQL,适合于开发者以及在数据库上做点对点模式(ad-hoc)查询的专业操作人员。其具备的能力包括: - 创建、更新、删除节点和关系 - 通过模式匹配来查询和修改节点和关系 - 管理索引和约束等。

删除数据库中以往的图,确保一个空白的环境进行操作:

MATCH (n) DETACH DELETE n

MATCH 是匹配操作,而小括号 () 代表一个节点 node(可理解为括号类似一个圆形),括号里面的 n 为标识符。

创建一个人物节点:

CREATE (n:Person {name:'Quintion Tang'}) RETURN n

CREATE 是创建操作,Person 是标签,代表节点的类型。花括号 {} 代表节点的属性。这条语句的含义就是创建一个标签为 Person 的节点,该节点具有一个name 属性,属性值是 Quintion

如图所示,在Neo4J的界面上可以看到创建成功的节点。

Neo4J 快速入门

继续来创建更多的人物节点,下列语句分别执行:

CREATE (n:Person {name:'Ezra Tillman'}) RETURN n
CREATE (n:Person {name:'Dante Carter'}) RETURN n
CREATE (n:Person {name:'Christopher Mcclure'}) RETURN n
CREATE (n:Person {name:'Ruby Rocha'}) RETURN n
CREATE (n:Person {name:'Imelda Hardin'}) RETURN n

接下来创建地区节点

CREATE (n:Location {city:'Miami', state:'FL'})
CREATE (n:Location {city:'Boston', state:'MA'})
CREATE (n:Location {city:'Lynn', state:'MA'})
CREATE (n:Location {city:'Portland', state:'ME'})
CREATE (n:Location {city:'San Francisco', state:'CA'})

可以看到,节点类型为Location,属性包括 citystate

接下来创建关系

MATCH (a:Person {name:'Christopher Mcclure'}), 
      (b:Person {name:'Ruby Rocha'}) 
MERGE (a)-[:FRIENDS]->(b)

这里的方括号 [] 即为关系,FRIENDS 为关系的类型。注意这里的箭头 -> 是有方向的,表示是从a到b的关系。 如图,Christopher Mcclure 和 'Ruby Rocha' 之间建立了 FRIENDS 关系,通过Neo4J的可视化很明显的可以看出:

关系增加属性

MATCH (a:Person {name:'Imelda Hardin'}), 
      (b:Person {name:'Ezra Tillman'}) 
MERGE (a)-[:FRIENDS {since:2022}]->(b)

在关系中,同样的使用花括号 {} 来增加关系的属性,这里给 FRIENDS 关系增加了 since 属性,属性值为 2022,表示他们建立朋友关系的时间。

接下来增加更多的关系

MATCH (a:Person {name:'Imelda Hardin'}), (b:Person {name:'Quintion Tang'}) MERGE (a)-[:FRIENDS {since:2018}]->(b)
MATCH (a:Person {name:'Christopher Mcclure'}), (b:Person {name:'Imelda Hardin'}) MERGE (a)-[:FRIENDS {since:2016}]->(b)
MATCH (a:Person {name:'Ezra Tillman'}), (b:Person {name:'Dante Carter'}) MERGE (a)-[:FRIENDS {since:2016}]->(b)
MATCH (a:Person {name:'Ruby Rocha'}), (b:Person {name:'Quintion Tang'}) MERGE (a)-[:MARRIED {since:2012}]->(b)

建立不同类型节点之间的关系-人物和地点的关系

MATCH (a:Person {name:'Quintion Tang'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1988}]->(b)

这里的关系是 BORN_IN,表示出生地,同样有一个属性,表示出生年份。

建立更多人的出生地

MATCH (a:Person {name:'Ruby Rocha'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1981}]->(b)
MATCH (a:Person {name:'Christopher Mcclure'}), (b:Location {city:'San Francisco'}) MERGE (a)-[:BORN_IN {year:1980}]->(b)
MATCH (a:Person {name:'Imelda Hardin'}), (b:Location {city:'Miami'}) MERGE (a)-[:BORN_IN {year:1980}]->(b)
MATCH (a:Person {name:'Dante Carter'}), (b:Location {city:'Lynn'}) MERGE (a)-[:BORN_IN {year:1990}]->(b)

至此,知识图谱的数据已经插入完毕,可以开始做查询了。我们查询下所有在 Boston 出生的人物

MATCH (a:Person)-[:BORN_IN]->(b:Location {city:'Boston'}) RETURN a,b

结果如下:

Neo4J 快速入门

查询所有对外有关系的节点

MATCH (a)-->() RETURN a

Neo4J 快速入门

注意这里箭头的方向,返回结果不含任何地区节点,因为地区并没有指向其他节点(只是被指向)

查询所有有关系的节点

MATCH (a)--() RETURN a

结果如下:

Neo4J 快速入门

查询所有对外有关系的节点,以及关系类型

MATCH (a)-[r]->() RETURN a.name, type(r)

结果如下:

Neo4J 快速入门

查询所有有结婚关系的节点

MATCH (n)-[:MARRIED]-() RETURN n

创建节点的时候就建好关系

CREATE (a:Person {name:'Jonah Johns'})-[r:FRIENDS]->(b:Person {name:'Herman Rosa'})

查找某人的朋友的朋友

MATCH (a:Person {name:'Quintion Tang'})-[r1:FRIENDS]-()-[r2:FRIENDS]-(friend_of_a_friend) RETURN friend_of_a_friend.name AS fofName

返回 Quintion Tang 的朋友的朋友:

Neo4J 快速入门

增加/修改节点的属性

MATCH (a:Person {name:'Imelda Hardin'}) SET a.age=34
MATCH (a:Person {name:'Ruby Rocha'}) SET a.age=32
MATCH (a:Person {name:'Christopher Mcclure'}) SET a.age=44
MATCH (a:Person {name:'Quintion Tang'}) SET a.age=25

这里,SET 表示修改操作

删除节点的属性

MATCH (a:Person {name:'Quintion Tang'}) SET a.test='test'
MATCH (a:Person {name:'Quintion Tang'}) REMOVE a.test

删除属性操作主要通过 REMOVE

删除有关系的节点

MATCH (a:Person {name:'Quintion Tang'})-[rel]-(b:Person) DELETE a,b,rel

删除重复的节点和关系

# 删除关系
match (n)-[r:FRIENDS]-()  detach delete r
# 删除节点
MATCH(n:'Quintion Tang') detach delete n
# 删除重复的关系和节点
MATCH (a)-[r:key_app]->(b) WITH a, b, TAIL (COLLECT (r)) as rr WHERE size(rr)>0 FOREACH (r IN rr | DELETE r)

总结

本文从介绍、安装和体验简单的查询,了解知识图谱(Knowledge Graph)的表现形式。