Tag: 文本挖掘

什么是“熵和信息获得”?

我正在阅读这本书( NLTK ),它很混乱。 熵被定义为 : 熵是每个标签的概率乘以相同标签的对数概率的总和 如何在文本挖掘中应用熵和最大熵 ? 有人可以给我一个简单,简单的例子(视觉)?

R-Project没有适用于'meta'类的对象的适用方法

我试图运行这个代码(Ubuntu 12.04,R 3.1.1) # Load requisite packages library(tm) library(ggplot2) library(lsa) # Place Enron email snippets into a single vector. text <- c( "To Mr. Ken Lay, I'm writing to urge you to donate the millions of dollars you made from selling Enron stock before the company declared bankruptcy.", "while you netted well over a $100 […]