有人试图neo4j与泰坦 – 利弊

有谁可以提供或指出Neo4j和泰坦之间的一个很好的比较? 我能看到的一件事就是规模 – Titan是扩展的,需要像cassandra这样的基础可扩展数据存储。 Neo4j仅适用于HA,并拥有自己的embedded式数据库。 任何其他利弊? 任何具体的使用情况。 (Titan目前在任何地方使用?)

我也有以下链接: http : //architects.dzone.com/articles/16-graph-databases-compared给出了一个graphics数据库的客观比较,但没有太多的利弊Neo4j和泰坦之间。

我们有一个社交图,在一天中,我们添加了近1百万个节点和两倍的边。 我们从neo4j图开始,因为是的,它的速度非常快,因为它的存储在graphics引擎运行的同一台机器上。 但以下是我们想与您分享neo4j的经验。

  1. 不适合实时查询。 我们有像twitter这样的社会结构。 我们必须显示用户在其时间线上所遵循的所有用户的最近20次活动(及其相关活动)。 我们有一些用户跟随1000多个用户。 我们为此编写的gremlin查询(如果您感兴趣,那么我们可以共享gremlin查询)真的产生了如此之多的GC,以至于有一个8 cpu和48 GB内存的服务器用于冻结,我们不得不重新启动服务器再次联机。
  2. 观察了许多时间networking分区。
  3. graoh数据库中没有非常需要的顶点中心索引。

最终,我们用gremlin查询来消除服务器性能,我们不得不将数据库更改为titan。

在泰坦,我们正在获得合理的性能,并且缩放非常容易,因为我们使用cassandra作为后端存储。 但是请记住,在这里使用gremlin也不是一个好主意,因为multiget查询是非常丑陋的写和没有multiget其查询变得非常缓慢。

很高兴看到你探索graphics数据库。 我会跟你的问题的Neo4j部分说话:

Global 2000中的30多个产品现在使用Neo4j进行广泛的使用案例,其中许多令人惊讶,即使对我们来说也是如此! (我们发明了属性图!)

客户的部分列表可以在下面find: http://www.neotechnology.com/customers

Neo4j已经进行了10年的全天候生产,从那时起,这个产品当然有了很大的发展,它的基础是非常坚实的。

大多数转向图数据库的公司 – 为我所知的Neo4j发言 – 是这样做的,因为:a)他们的RDBMS不能处理他们连接的查询需求的范围和规模,和/或b )将graphics(社交,networking和数据中心pipe理,欺诈,投资组合,身份等)build模为域的巨大便利性和速度,而不是表格。

对于踢球,你可以在这里find几个客户谈话,从今年在全球主要城市举行的四(很快)五个GraphConnect会议:

http://watch.neo4j.org/

如果你在伦敦,最后一个将在下周举行: http : //www.graphconnect.com

您将在下面findNeo4j背后的一些技术总结以及一些客户案例。 要直接说出您的扩展问题:Neo4j具有独特的架构,旨在通过允许横向扩展以最大限度地提高查询响应时间和查询可预测性,使每个实例可以访问graphics,而无需跳过networking。 (需要更多的读取吞吐量,只需添加实例)事实certificate,这种方法适用于95%以上的图表,其中包括一些生产客户,其中有超过一半的Facebook社交图在单个Neo4j集群中运行,支持“永远在线”的24×7网站。

http://www.neotechnology.com/neo4j-scales-for-the-enterprise/

世界上最大的邮政递送服务之一就是使用Neo4j完成所有的实时包裹路由。 铁路正在Neo4j上build立路由系统。 一些全球最大的客户正在使用它们进行人力资源和数据治理,备用path路由,networking和数据中心pipe理,实时欺诈检测,生物信息学等。

Neo4j的Cypher查询语言是唯一为属性图build立的声明式查询语言。 它从我们13岁的本地Java API(这是其他graphics数据库已经采用的蓝图的基础)中汲取了所有的经验教训,并将其推广到下一代语言中。 Cypher是学习graphics和开发应用程序的好方法; 如果您有特殊的需求或价值“裸机”性能(即亚毫秒与单位数毫秒)的性能超出便利性总是有原生的Java API。 Neo4j是从头开始支持graphics,并有一个graphics存储引擎,用于存储graphics; 不同于graphics数据库生态系统中最近增加的一些新function,它们在非graphics数据库之上构build为graphics库,并受到一些固有的限制。 (例如FlockDB,因为它是基于MySQL的,对于任何超过一跳的东西来说,仍然会很慢)。

如果你需要更具体的东西,绝对可以联系Neo团队。 我们将非常乐意帮助您! http://info.neotechnology.com/ContactUs.html

祝你好运!