Faster way to get distinct values from Lucene Query(从 Lucene Query 获取不同值的更快方法)
问题描述
目前我喜欢这样:
IndexSearcher searcher = new IndexSearcher(lucenePath);
Hits hits = searcher.Search(query);
Document doc;
List<string> companyNames = new List<string>();
for (int i = 0; i < hits.Length(); i++)
{
doc = hits.Doc(i);
companyNames.Add(doc.Get("companyName"));
}
searcher.Close();
companyNames = companyNames.Distinct<string>().Skip(offSet ?? 0).ToList();
return companyNames.Take(count??companyNames.Count()).ToList();
如您所见,我首先收集所有字段(数千个)然后区分它们,可能会跳过一些并取出一些.
As you can see, I first collect ALL the fields (several thousands) and then distinct them, possibly skip some and take some out.
我觉得应该有更好的方法来做到这一点.
I feel like there should be a better way to do this.
推荐答案
老实说,我不确定是否存在,因为 Lucene 不提供独特"的功能.我相信使用 SOLR 您可以使用构面搜索来实现这一点,但是如果您想在 Lucene 中实现这一点,则必须自己编写某种构面功能.所以只要你没有遇到任何性能问题,你应该没问题.
I'm not sure there is, honestly, as Lucene doesn't provide 'distinct' functionality. I believe with SOLR you can use a facet search to achieve this, but if you want this in Lucene, you'd have to write some sort of facet functionality yourself. So as long as you don't run into any performance issues, you should be ok this way.
这篇关于从 Lucene Query 获取不同值的更快方法的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:从 Lucene Query 获取不同值的更快方法


- MoreLinq maxBy vs LINQ max + where 2022-01-01
- 输入按键事件处理程序 2022-01-01
- 带有服务/守护程序应用程序的 Microsoft Graph CSharp SDK 和 OneDrive for Business - 配额方面返回 null 2022-01-01
- Web Api 中的 Swagger .netcore 3.1,使用 swagger UI 设置日期时间格式 2022-01-01
- C#MongoDB使用Builders查找派生对象 2022-09-04
- 良好实践:如何重用 .csproj 和 .sln 文件来为 CI 创建 2022-01-01
- 在哪里可以找到使用中的C#/XML文档注释的好例子? 2022-01-01
- 如何用自己压缩一个 IEnumerable 2022-01-01
- WebMatrix WebSecurity PasswordSalt 2022-01-01
- C# 中多线程网络服务器的模式 2022-01-01