最新图数据库Neo4j 5大幅提升查询性能可达千倍

最新图数据库Neo4j 5现在正式推出,官方提到,这个版本无论是在性能还是可扩展性,都提升数个量级,同时也提供更高的敏捷性,经改进的自治集群功能可减少管理员的手动管理工作。

在特定的场景中,图数据库的性能优于关系型数据库,当问题越复杂,图数据库所能提供的性能优势也越大,现在Neo4j 5还针对常用算法进行优化,像是可用于关系探索、欺诈侦测和供应链关注的算法K-Hop查询,根据官方内部的基准测试,8次跳跃查询比之前的版本快了1,000倍。

而常用于以文本属性过滤结果的Cypher子句CONTAINS和ENDS WITH也获得加速,Neo4j 5新的文本索引实例,可使查询结果提高达百倍,官方提到,结合Neo4j 5的改进和优化查询规划,使得Neo4j 5成为目前最快速的实例版本。

虽然Neo4j 5能够以极快的速度回应复杂查询,但是当资料集增长到数十亿甚至数兆个节点,那查询效率可能出现挑战,用户可能需要划分大图成分片,从Neo4j 4开始,用户可以使用Fabric,以单图的方式从数据库分片中读取资料,而在Neo4j 5中,用户可以使用Cypher合成数据库命令,即时创建Fabric数据库。

在用户想要创建跨多个数据库查询时,Fabric也能够派上用场打破资料孤岛,Neo4j 5中的Fabric功能获得强化,可以对多集群中的资料执行联合查询。

Neo4j 5的自治集群能力更加强大,管理负担将从管理员转移到软件上。当Neo4j资料用户持续增加,那自治集群便能够发挥作用,Neo4j 3用户就能够运行多个Neo4j数据库,并将其横向扩展,满足每秒钟数万次仅有毫秒延迟的查询。

而Neo4j 5由软件接受管理员的自治集群管理工作,用户仅需要声明需要的主要和次要副本数量,自治集群就能够回应吞吐量变化,扩展或是缩减数据库服务器数量,减少管理的手动工作,并充分利用基础设施弹性。

Neo4j 5中的Ops Manager则是一个UI控制台,提供管理员更多控制功能,以及跨数据库、执行实例和集群的操作指标。而托管图数据库服务Aura的用户,将可以从任意版本升级至Neo4j 5,并且获得自治集群零停机滚动升级。