Tag: cosine

在lucene中获得两个文档之间的余弦相似度

我已经在Lucene中build立了一个索引。 我希望不指定查询,只是为了获得索引中两个文档之间的分数(余弦相似度或另一个距离?)。 例如,我从以前打开的索引阅读器IR与ID 2和4的文件。Document d1 = ir.document(2); 文件d2 = ir.document(4); 我怎样才能得到这两个文件之间的余弦相似? 谢谢