Tag: nosql

无模式数据库系统的吸引力是什么?

我一直听到很多关于无模式(通常是分布式)的数据库系统的讨论,比如MongoDB,CouchDB,SimpleDB等等。 虽然我可以理解他们可能是有价值的某些目的,在我的大多数应用程序中,我试图持有具有特定types的特定数量的字段的对象,我只是自动思考在关系模型中。 我一直在考虑具有唯一整数ID,空/非空字段,SQL数据types和select查询来查找集的行。 虽然我被这些新系统的分布式本质和简单的JSON / RESTful接口所吸引,但是我不明白如何松散地input键/值哈希将帮助我进行开发。 为什么松散types的无模式系统能够保持干净的数据集? 我怎么能find所有date在x和y之间的项目,当他们可能没有date? 有没有join的概念? 我知道很多系统有自己的差异和优势,但是我想知道范式的差异。 我想这是一个开放式的问题,但也许社区的答案和他们亲眼看到这些系统的优点的方式将有助于启发我和其他人什么时候我想要利用这些(公认的更多臀部)系统,而不是传统的RDBMS。

Redis,CouchDB还是Cassandra?

各种NoSQL数据库有哪些优势和劣势? 特别是Redis似乎很难在多个服务器上分配写入负载。 是这样吗? 这是一个大问题吗? 在这之前,服务需要增长多less可能是一个重大问题?

selectMongoDb / CouchDb / RavenDb – 性能和可伸缩性的build议

我们正在寻找一种具有故障转移群集function的文档数据库存储解决scheme,用于某些读/写密集型应用程序。 我们将平均每秒钟写入数据库的并发写入(平均每秒高达70,000次),并可能有几乎相似的读取次数。 我们还需要一个db的机制来通知新写入的logging(在db级别的某种触发器)。 在正确select文档数据库和相关的容量规划方面,什么是一个好的select? 更新 关于期望的更多细节。 平均而言,我们预计在3-4个数据库/文档集合中,每秒插入(新文档)数量为40,000(40K)。 峰值可能高达12万(120K)插入 Inserts应该是可以立即读取的 – 几乎是实时的 与此同时,我们预计每秒大约5000次更新或删除 与此同时,我们也期望500-600个并发查询访问数据。 这些查询和执行计划在某种程度上是已知的,尽pipe这可能需要在一周左右更新一次。 系统应支持存储端的故障转移群集

Windows Azure PaaS(networkingangular色)的真正替代品?

我正在寻找Windows Azure PaaS(平台即服务)产品的替代产品,满足以下要求: 该平台应该提供高可用性和可扩展性。 平台应该为我pipe理/更新应用程序服务器和操作系统。 该平台应提供某种forms的NoSQL数据库 (如Azure Table Storage或SimpleDB)。 该平台应本机支持ASP.NET MVC ,即IIS和运行时环境应该自动pipe理/修补我。 虽然亚马逊满足第1项和第3项,但它仅提供IaaS(基础架构即服务),这意味着我仍然有大量的pipe理开销。 所以这个问题是,Windows Azure有什么替代scheme,提供了一个大致相同的function集? 任何build议,欢迎!

如何selectCassandra,Membase,Hadoop,MongoDB,RDBMS等?

是否有关于何时使用Cassandra或Membase或Hadoop或普通的旧关系数据库的文章/博客文章? 有没有一篇论文讨论每个技术的优缺点,以及应该select哪种技术? 我正在考虑编写一个新的web服务,每天大约有一百万次访问,数据跨越几TB。

使用HBaseshell进行扫描

有谁知道如何扫描logging基于一些扫描filter,即: column:something = "somevalue" 像这样的东西,但从HBase壳?

NoSQL究竟是什么?

NoSQL究竟是什么? 数据库系统是否只能与{key:value}对配合使用? 据我所知MemCache是这样的数据库系统之一,我说得对吗? 还有哪些stream行的NoSQL数据库在那里,它们究竟有用? 谢谢,Boda Cydo。

使用ElasticSearch的负载均衡器是不必要的?

我有一个在AWS EC2上运行的3个ElasticSearch节点集群。 这些节点使用OpsWorks / Chef进行设置。 我的目的是devise这个集群是非常有弹性和弹性的(节点可以在需要时进出)。 从我读过的有关ElasticSearch的一切,似乎没有人推荐将负载均衡器放在集群前面; 相反,似乎build议做两件事之一: 将您的客户端指向一个节点的URL / IP,让ES为您做负载平衡,并希望节点永不停机。 将所有节点的URL / IP硬编码到客户端应用程序中,让应用程序处理故障切换逻辑。 我的背景主要是在Web农场,创build一个巨大的自治Web服务器池,在它们前面放置一个ELB,并让负载平衡器决定哪些节点是活着或死亡是常识。 为什么ES似乎不支持这个相同的架构?

Voldemort和Cassandra相比如何?

Voldemort和Cassandra相比如何? 我不是在谈论社区的大小,而只是想听听那些实际使用过这两者的人。 特别是我感兴趣的是: 它们在添加和删除节点时如何dynamic缩放 查询性能 添加节点(线性)时它们如何缩放? 写入速度

MongoDBselect_id的数组中的哪个位置?

在mongo db中可以select像SQL这样的集合文档: SELECT * FROM collection WHERE _id IN (1,2,3,4); 或者如果我有一个_id array我必须一个接一个地select,然后重新array/object的结果?