Tag: semantic web

实体提取/识别与免费工具同时喂Lucene指数: 我目前正在研究从文本（网上很多文章）中提取人名，位置，技术词汇和类别的选项，然后将这些文本导入到Lucene / ElasticSearch索引中。附加信息将作为元数据添加，并应提高search精度。例如，当有人询问“wicket”时，他应该能够决定他是指板球运动还是Apache项目。我试图自己实现这一点，迄今取得了微小的成功。现在我发现了很多工具，但是我不确定它们是否适合这个任务，哪些与Lucene集成，或者实体提取的精度是否足够高。 Dbpedia聚光灯，演示看起来非常有前途 OpenNLP需要培训。使用哪些训练数据？ OpenNLP工具 Stanbol NLTK balie UIMA GATE – > 示例代码 Apache Mahout 斯坦福CRF-NER 毛伊岛，索引槌伊利诺伊州命名实体标记不开源，但免费维基百科数据我的问题：有没有人有上述的一些列出的工具和精度/召回经验？或者如果有需要的培训数据+可用。是否有文章或教程，我可以开始实体提取（NER）每个工具？他们如何可以与Lucene集成？以下是与该主题相关的一些问题： algorithm是否存在帮助检测英语句子的“主要话题”？用于Java的命名实体识别库用Java命名实体识别

什么是语义网？: 我已经听说了很多有关语义networking的知识，但是我仍然不确定它是什么。这与现在我们所知道的networking有什么不同？

Interesting Posts

如何获得一个列字段的两行之间的差异？

如何在swift中将这个varstring转换为NSURL

改变下拉箭头的颜色和外观

'has_key（）'或'in'？

System.Windows.Forms.TextBox中的水印

在字节中设置特定位

在iPhone上使用CoreData或SQLite？

为什么strncpy不安全？

Zalgo文本如何工作？

如何从我的虚拟环境中更新pip本身？

如何使用json.net将数据表转换为jsonstring？

我如何在Windows上应用diff补丁？

Android模拟器：selectAVD（Android虚拟设备）默认运行

通过Wi-Fi运行/安装/debuggingAndroid应用程序？

fopen弃用的警告