Tag: 垃圾邮件预防

公开发布的垃圾邮件filter培训集

我是机器学习的新手,对于我的第一个项目,我想写一个朴素的贝叶斯垃圾邮件filter。 我想知道是否有公开可用的标签为垃圾邮件/不是垃圾邮件的训练集,最好是纯文本而不是关系数据库的转储(除非他们漂亮地打印这些?)。 我知道这样一个公开可用的数据库存在其他types的文本分类,特别是新闻文章的文本。 我只是无法find电子邮件相同的东西。

如何检测假用户(爬虫)和curl

其他一些网站使用cURL和假http引用来复制我的网站内容。 我们有没有办法检测cURL或不是真正的networking浏览器?

在投票竞争中狩猎作弊者

目前我们正在进行一场非常好的比赛。 不幸的是,我们已经有了所有那些正在运行脚本的作弊者,他们会自动投票。 我们已经看到一些作弊者通过手动查看数据库条目 – 例如,使用相同浏览器的5星级评分完全是70分钟。 现在随着用户群的增长,识别它们变得越来越困难。 我们到现在为止所做的: 我们存储的IP和浏览器,并阻止组合到一个小时的时间框架。 cookies不会对这些家伙有帮助。 我们也在使用一个已经被破解的validation码 有谁知道我们如何能find我们的数据库模式与PHP脚本或如何我们可以更有效地阻止他们? 任何帮助将不胜感激…

当机器人攻击!

除了CAPTCHA,还有哪些stream行的垃圾邮件防范方法?