Tag: 停止词

使用NLTK清除停用词

我试图通过使用nltk工具包删除停用词来处理用户input的文本,但与停止词删除像'和','或','不''被删除。 我希望这些词在停用词删除过程后出现,因为它们是以后处理文本作为查询所需的运算符。 我不知道在文本查询中哪些是可以作为操作符的词,我也想从我的文本中删除不必要的词。

如何使用nltk或python删除停用词

所以我有一个数据集,我想删除使用停用词 stopwords.words('english') 我正在努力如何在我的代码中使用这个只是简单地拿出这些单词。 我已经从这个数据集的单词列表中,我正在努力与该列表比较,并删除停用词。 任何帮助表示赞赏。