Tag: 训练数据

用于neural network训练的数据集

我正在寻找一些相对简单的数据集来testing和比较不同的人工neural network训练方法。 我希望数据不会花费太多的预处理来将其转换为input和输出列表(标准化为0-1)的input格式。 任何链接赞赏。

改变训练的图像训练neural network

我目前正试图制定一个计划,根据其外观区分腐烂的橙子和食用橙子。 为了做到这一点,我正计划使用卷积neural network来训练腐烂的橙子和普通的橙子。 经过一番search,我只能find约一个数据库。 黑色背景上的150个橙子和150个普通橙子( http://www.cofilab.com/downloads/ )。 显然,一个机器学习模式将需要至less几千个桔子才能达到90%左右的精度。 但是,我可以通过某种方式改变这150个橙子来制作更多的橘子照片吗? 通过改变,我的意思是在柑橘类水果上添加不同的橙色色调,以形成“不同的橙色”。 这是否是训练neural network的有效方法?

公开发布的垃圾邮件filter培训集

我是机器学习的新手,对于我的第一个项目,我想写一个朴素的贝叶斯垃圾邮件filter。 我想知道是否有公开可用的标签为垃圾邮件/不是垃圾邮件的训练集,最好是纯文本而不是关系数据库的转储(除非他们漂亮地打印这些?)。 我知道这样一个公开可用的数据库存在其他types的文本分类,特别是新闻文章的文本。 我只是无法find电子邮件相同的东西。

培训数据进行情绪分析

我在哪里可以得到一个在企业领域已被归类为正面/负面情绪的文件? 我想要一大批为公司提供评论的文件,比如分析师和媒体提供的评论。 我发现有产品和电影评论的语料库。 是否有商业领域的语料库,包括与企业语言相匹配的公司评论?

如何向pipe理层certificate,平庸的开发者正在伤害团队

我处于“pipe理”一个小公司的开发团队的危险境地。 我说“pipe理”,因为虽然我分配工作,并提供他们的performance反馈,我实际上没有惩罚个人的追索权。 我的一些团队我不知道该怎么做,他们无法独立工作,需要大量的手持,一般情况下通常会给项目造成严重的破坏。 当失败发生的时候,我会留下来挽救这个项目,并把它推到终点线上(有时是一瘸一拐的)。 这些开发人员不仅缺乏编程概念的技能,而且通常还有能力为代码中的问题制定解决scheme。 简单的事情,比如编写循环对于他们来说很难,更不用说devise和实现一个问题的解决scheme。 我们尝试了结对编程,提供课程付款,购买书籍,在工作日内分配时间进行培训,甚至花费整整一天的时间来培训团队。 另一位高级开发人员和我不知道该怎么做,但是我们的日常生产力却因为不得不面对这些人而受到限制。 pipe理迫使我们给他们工作,他们主要的抱怨是事情没有做得很快。 我们的pipe理团队没有一个直接与除我和其他高级开发人员以外的任何开发人员合作。 pipe理是非技术性的,相信每个开发者都是平等创造的,而且我们显然需要更多的人来完成这些项目,以使他们更快地完成任务。 我已经准备了一个文件,内容是“神话人月”和“代码完整”部分,发送给pipe理层,希望能够用统计数字说明,真正阻碍我们的是拖拽平庸的人在整个开发周期。 还有哪些其他资源? 书籍,文章,一般build议任何东西都会有所帮助。