Tag: elasticsearch

为什么elasticsearch不能在Ubuntu 14.04上运行?

我试图确定是否elasticsearch实例正在运行,但它似乎不是: ubuntu@ubuntu:~$ sudo service elasticsearch status * elasticsearch is not running ubuntu@ubuntu:~$ sudo service elasticsearch start * Starting Elasticsearch Server [ OK ] ubuntu@ubuntu:~$ sudo service elasticsearch status * elasticsearch is not running and ubuntu@ubuntu:~$ sudo /etc/init.d/elasticsearch status * elasticsearch is not running ubuntu@ubuntu:~$ sudo /etc/init.d/elasticsearch start * Starting Elasticsearch Server [ OK ] ubuntu@ubuntu:~$ […]

Elasticsearch过滤查询与筛选器

“查询和过滤在过滤”和“查询和过滤根”之间有任何区别? 例如 情况1: { "query":{ "filtered":{ "query":{ "term":{"title":"kitchen3"} }, "filter":{ "term":{"price":1000} } } } } 案例2: { "query":{ "term":{"title":"kitchen3"} }, "filter":{ "term":{"price":1000} } } 我发现这个讨论http://elasticsearch-users.115913.n3.nabble.com/Filtered-query-vs-using-filter-outside-td3960119.html ,但引用的URL是404,这个解释有点太简洁了我。 请教或指出这些差异的文件,谢谢。

什么是使用elasticsearch与标准sql查询的一些用例?

我刚刚开始使用Elasticsearch,我已经看到的主要用例之一是在大型数据集上进行search的可扩展性,但除此之外,您还想使用它来仅使用传统的RDMS创buildSQL查询吗?

我们可以使用弹性search版本检索以前的_source文档吗?

我已经阅读了关于版本控制的 ES上的博客文章。 但是,我希望能够从更新中获得以前的“_souce”文档。 例如,假设我有这个对象: { "name": "John", "age": 32, "job": "janitorial technician" } // this becomes version 1 我更新到: { "name": "John", "age": 32, "job": "president" } // this becomes version 2 然后,通过ES中的版本控制,我能否获得对象的前一个“工作”属性? 我试过这个: curl -XGET "localhost:9200/index/type/id?version=1" 但是这只是返回最新的_source对象(John是总裁)。 我实际上喜欢像StackOverflow那样实现版本差异方面。 (顺便说一句,我使用弹性search作为我的主分贝 – 如果有一种方法可以与其他nosql数据库做到这一点,我很乐意尝试它,最好是一个与ES完美集成的方法。

数千个文档的可search存档的最佳实践(pdf和/或xml)

重新审视一个停滞不前的项目,寻求将现有数千个“旧”文档进行现代化build议,并通过networking提供这些文档的build议。 文档以各种格式存在,有些已经过时:(. doc , PageMaker ,硬拷贝(OCR), PDF等)。 资金可用于将文档迁移到“现代”格式,许多硬拷贝已经被OCR化为PDF格式 – 我们原本以为PDF是最终的格式,但我们愿意接受build议(XML?) 。 一旦所有文档都采用通用格式,我们希望通过网页界面提供其内容并进行search 。 我们希望灵活性只返回发现search“hit”的整个文档的部分(页面?)(我相信Lucene / elasticsearch使这成为可能?!?)如果内容是全部XML,它可能会更加灵活吗? 如果是的话,如何/在哪里存储的XML? 直接在数据库中,或作为文件系统中的离散文件? 那么在文档中embedded的图像/图表呢? 好奇别人怎么会这样做。 没有“错误的”答案我只是寻找尽可能多的投入来帮助我们继续。 感谢您的任何build议。

ElasticSearch:只允许本地请求

如何只允许本地请求弹性search? 所以命令如: curl -XGET 'http://localhost:9200/twitter/_settings' 只能在本地主机上运行,​​请求如下: curl -XGET 'http://mydomain.com:9200/twitter/_settings' 会被拒绝? 因为从我所看到的,elasticsearch默认是允许的。 编辑: 根据http://www.elasticsearch.org/guide/reference/modules/network.html你可以pipe理bind_host参数来允许主机。 默认情况下,它被设置为anyLocalAddress

elasticsearch匹配与术语查询

我使用匹配查询search“request.method”:“GET”: { "query": { "filtered": { "query": { "match": { "request.method": "GET" } }, "filter": { "bool": { "must": [ … 如预期的那样,Match查询可以得到结果,如下所示: 但问题是,当使用术语查询,没有结果。 更新查询以将“匹配”更改为“期限”,并保持其他部分保持不变: { "query": { "filtered": { "query": { "term": { "request.method": "GET" } }, "filter": { "bool": { "must": [ … 我认为术语查询是匹配查询的“未分析”版本。 如上图所示,至less有一个logging的“request.method”等于“GET”。 为什么上述Term查询没有结果? 谢谢。

使用ElasticSearch的负载均衡器是不必要的?

我有一个在AWS EC2上运行的3个ElasticSearch节点集群。 这些节点使用OpsWorks / Chef进行设置。 我的目的是devise这个集群是非常有弹性和弹性的(节点可以在需要时进出)。 从我读过的有关ElasticSearch的一切,似乎没有人推荐将负载均衡器放在集群前面; 相反,似乎build议做两件事之一: 将您的客户端指向一个节点的URL / IP,让ES为您做负载平衡,并希望节点永不停机。 将所有节点的URL / IP硬编码到客户端应用程序中,让应用程序处理故障切换逻辑。 我的背景主要是在Web农场,创build一个巨大的自治Web服务器池,在它们前面放置一个ELB,并让负载平衡器决定哪些节点是活着或死亡是常识。 为什么ES似乎不支持这个相同的架构?

percolator在弹性search中意味着什么?

尽pipe我读了Elasticsearch的文档来了解一个filter是什么。 我仍然很难理解它的含义,以及它的用途。 任何人都可以提供给我更多的细节?

如何在运行时从elasticsearch集群中删除节点,而不会停机

假设我有5个节点在集群中,我不得不在运行时删除2个节点。 那么如何在不影响指数的情况下做到呢? 我连续接近10 Gbphour的数据,这些数据不断被索引。 重新平衡会在这方面做任何帮助吗? 提前致谢