Tag: ravendb

如何search巨大的非文本数据集?

在我工作的一个项目中,客户有一个旧的和巨大的(TB级)RDBMS。 所有types的查询都很慢,没有时间修复/重构模式。 我已经确定了需要优化的一组常用查询。 该组分为两部分:全文和元数据查询。 我的计划是从数据库中提取数据,并将其分区到两个不同的存储系统,每个存储系统都针对特定的查询集进行了优化。 对于全文search,Solr是最有意义的引擎。 这是分片和复制function,使它非常适合问题的一半。 对于元数据查询,我不知道要采取什么路线。 目前,我正在考虑使用一个非常规规范化模式的RDBMS,它表示来自“权威”RDBMS的特定数据子集。 然而,我的客户担心这种子系统缺乏分片和复制function,而与已经包含这些function的Solr相比,设置这些function的困难/复杂性更为困难。 在这种情况下,元数据采用整数,date,布尔,位和string(最大大小为10个)的forms。 是否有一个数据库存储系统具有内置的分片和复制function,可能对查询元数据特别有用? 也许一个没有SQL的解决scheme提供了一个好的查询引擎? 请照亮。 添加/回应: Solr可以用于元数据,但是元数据是不稳定的。 所以,我不得不经常去索引。 这会导致search速度非常快。

selectMongoDb / CouchDb / RavenDb – 性能和可伸缩性的build议

我们正在寻找一种具有故障转移群集function的文档数据库存储解决scheme,用于某些读/写密集型应用程序。 我们将平均每秒钟写入数据库的并发写入(平均每秒高达70,000次),并可能有几乎相似的读取次数。 我们还需要一个db的机制来通知新写入的logging(在db级别的某种触发器)。 在正确select文档数据库和相关的容量规划方面,什么是一个好的select? 更新 关于期望的更多细节。 平均而言,我们预计在3-4个数据库/文档集合中,每秒插入(新文档)数量为40,000(40K)。 峰值可能高达12万(120K)插入 Inserts应该是可以立即读取的 – 几乎是实时的 与此同时,我们预计每秒大约5000次更新或删除 与此同时,我们也期望500-600个并发查询访问数据。 这些查询和执行计划在某种程度上是已知的,尽pipe这可能需要在一周左右更新一次。 系统应支持存储端的故障转移群集

如何使用双层架构将UseEmbeddedHttpServer设置为true时,使我的RavenDB应用程序正确执行?

我在我的应用程序中使用RavenDB-Embedded 2.0.2230与不同程序集中的ASP .Net Web API交互。 当我在文档存储上设置UseEmbeddedHttpServer = true时,第一次向RavenDB发送请求时,它正确执行,但是当我第二次尝试时,我的应用程序显示Raven Studio。 当我删除UseEmbeddedServer设置时,我的应用程序运行没有任何问题。 我的RavenDB在数据层中configuration了以下代码: this.documentStore = new EmbeddableDocumentStore { ConnectionStringName = "RavenDB", UseEmbeddedHttpServer = true }.Initialize(); 并且Web.config实现在服务层中具有这些设置: <connectionStrings> <add name="RavenDB" connectionString="DataDir=~\App_Data\RavenDatabase" /> </connectionStrings> 有没有我错过的设置? 有什么设置,我需要申请点Raven Studio到不同的端口?