海量数据催生的地理知识服务
基础地理信息数据具有空间载体和知识存储两大作用。
以往的地理信息数据往往以地理信息服务的形式为人们提供基础信息,人们通过网络可以随时随地获取地理信息目标。随着社会的发展与进步,在“四个全面”战略布局及生态文明建设方针的指导要求下,用户不仅需要地理目标的空间信息,还要知道其空间格局、地域差异、时空规律、归因机制等相关地理知识。数据海量、信息复杂、知识难求……用户的需求无法得到满足,基础地理信息数据的信息作用受到了严重的限制。
所谓地理知识服务即以地理知识为服务内容,以计算机中的形式化知识表示为地理知识载体,以地理空间认知智能为智能特征,以面向情境或问题或主动或应需准确提供地理知识为服务目标。(慎利《从地理信息服务到地理知识服务:基本问题与发展路径》)
时空知识图谱助力情景化智能推理
地理知识服务与地理信息服务之间联系密切,但又有本质区别,准确来说地理知识包含地理信息服务,地理信息服务只占地理知识的极小一部分内容。
下面我们以一个场景做一个简单介绍:设想春运期间出现新冠肺炎疫情,需要驾车回老家的地理信息服务场景。
现有的导航服务软件可以准确地提供实时导航,但是它不能在导航开始前就给出途经地的疫情防控政策,如某一高速口没有24小时内的核酸检测阴性证明就无法通行,那么以“在出行前需要做核酸检测”这一重要提示信息为例,图1给出了地理知识推理的整体流程。
![技术探讨‖从地理信息服务到地理知识服务的转变 技术探讨‖从地理信息服务到地理知识服务的转变]()
图1 疫情期间通行情景化下的地理知识推理的整体流程
在现实中类似的基于知识的情景化推理智能服务非常普遍,如野生环境保护区有野兽出没提醒、野外移动网络信号覆盖提醒、隧道行车易发生交通事故地段提醒等等,从本质上来说这些场景所需要的服务就是地理知识服务。
河南数慧信息技术有限公司为助力地理知识服务,自主研发了基于neo4j图数据库的知识图谱构建平台,为用户提供从知识获取到图谱生成,再到图谱应用一整套流程。不管是与关系型数据库相比,还是与其他NoSQL数据库相比,Neo4j都表现出很多前所未有的优势,主要体现在查询的高性能、设计的灵活性和开发的敏捷性等。
时空知识图谱构建平台包括5大模块。
(1) 数据管理——数据库接入及知识抽取。
(2) 概念模型指明实体和关系存储模式——比如关于人的信息很多,而可获取的信息有限,有价值的信息也有限,通过概念模型可以指定具体哪些信息需要存储到图库中,以及如何存储这些信息。
(3) 知识图谱入库——支持csv文件形式和数据库的接入入库,将模块(1)获取的知识,通过模块(2)建立的模型存储到知识图谱中。
(4) 图谱搜索——支持知识图谱的精确和模糊查询,以及关系和实体的搜索。
(5) 提供图的常见算法——目前先提供最短路径、路径查找、pagerank、LPA四个算法,后续持续添加。
![技术探讨‖从地理信息服务到地理知识服务的转变 技术探讨‖从地理信息服务到地理知识服务的转变]()
图2 时空知识图谱数据层构建流程
![技术探讨‖从地理信息服务到地理知识服务的转变 技术探讨‖从地理信息服务到地理知识服务的转变]()
图3 时空知识图谱构建平台功能模块