我目前正在试图让人工neural network玩一个电子游戏,我希望能从这个美妙的社区获得一些帮助。 我决定使用“暗黑破坏神2”(Diablo 2)。因此,玩家可以实时从等轴测视angular观看,并且玩家可以控制相机所在的一个angular色。 为了使事情具体化,任务是让你的angular色x的经验值不降低到0,通过杀死怪物获得经验值。 这是一个游戏的例子: 现在,因为我希望networking完全基于从屏幕像素获得的信息进行操作,为了有效地播放它,它必须学习非常丰富的表示,因为这可能需要它知道(至less隐含)如何把游戏世界分成对象和如何与之交互。 而所有这些信息都必须被教给networking……不知何故。 我不能为了我的生活想到如何训练这个东西。 我唯一的想法是有一个单独的程序从屏幕上直观地提取游戏中天生好/坏的东西(例如健康,黄金,经验),然后在强化学习过程中使用该属性。 我认为这是答案的一部分 ,但我认为这还不够。 从原始视觉input到目标导向行为的抽象层次太多,以至于这种有限的反馈,在我的有生之年就要训练一个networking。 所以,我的问题:你还有什么其他的方式可以用来培养一个networking来完成这个任务的至less一部分? 最好不要制造数千个标记的例子… 只是稍微指出一点:我正在寻找一些其他的强化学习来源和/或任何无监督的方法来提取有用的信息在这个设置。 或者是一个监督algorithm,如果你可以想办法从游戏世界中获取标签数据而不需要手动标记它。 UPDATE(04/27/12): 奇怪的是,我仍然在努力,似乎正在取得进展。 让neural network控制器工作的最大秘诀就是使用适合于这个任务的最先进的neural network架构。 因此,我一直在使用深度信念networking组成的条件限制玻尔兹曼机器 ,我已经在一个无监督的方式(在我玩游戏的video)训练之前微调与时间差异向后传播 (即强化学习与标准前馈人工neural network)。 仍然在寻找更有价值的input,特别是在实时动作select的问题上,以及如何为ANN处理编码彩色图像:-) UPDATE(15年10月21日): 只记得我今天回答了这个问题,我想我应该提一下,这不再是一个疯狂的想法。 自从我上次更新以来,DeepMind发布了他们关于让neural network从视觉input中玩atari游戏的自然论文 。 事实上,阻止我使用他们的体系结构玩“暗黑破坏神2”的一个有限子集的唯一原因是缺乏对底层游戏引擎的访问。 渲染到屏幕然后redirect到networking太慢,无法在合理的时间内进行训练。 因此,我们很可能不会在近期看到这种机器人玩“暗黑破坏神2”,但只是因为它会播放开源或API访问渲染目标的东西。 (地震也许?)
是否可以使用scikit-learn K-Means Clustering来指定自己的距离函数?
在iOS电子邮件客户端中,当电子邮件包含date,时间或地点时,文本将成为超链接,只需点击链接即可创build约会或查看地图。 它不仅适用于英文的电子邮件,还适用于其他语言的电子邮件。 我喜欢这个function,并想了解他们是如何做到的。 这样做的天真的方法是有许多正则expression式,并运行它们。 但是,我不能很好地扩展,只能用于特定的语言或date格式等。我认为,苹果必须使用一些机器学习的概念来提取实体(8:00 PM,8 PM,8:00, 08:00,20:00,20:00,20:00,2000等)。 任何想法如何苹果能够在其电子邮件客户端如此迅速地提取实体? 你会用什么机器学习algorithm来完成这样的任务?
我注意到LSH似乎是一种很好的方法来find具有高维属性的相似项目。 阅读完这篇论文后,我仍然对这些公式感到困惑。 有没有人知道一个博客或文章,解释这个简单的方法?
有人可以说数据挖掘中的分类和聚类有什么区别吗? 如果可以的话,请举两个例子来理解主要思想。
假设我正在处理一些分类问题。 (欺诈检测和评论垃圾邮件是我现在正在处理的两个问题,但我对任何分类任务都很好奇。) 我怎么知道我应该使用哪个分类器? 决策树 SVM 贝叶斯 neural network K-最近的邻居 Q学习 遗传algorithm 马尔可夫决策过程 卷积neural network 线性回归或逻辑回归 提升,装袋,封锁 随机爬山或模拟退火 … 在哪些情况下是其中一种“自然”的首选,select哪一种呢? 我正在寻找的答案types的示例(来自Manning等人的“信息检索简介”一书): 一个。 如果您的数据被标记,但只有有限的数量,您应该使用高偏见的分类器(例如,朴素贝叶斯) 。 我猜测这是因为偏向较高的分类器将具有较低的方差,这是因为less量的数据。 湾 如果你有大量的数据,那么分类器并不是那么重要,所以你应该select一个具有良好可扩展性的分类器。 什么是其他指导方针? 即使答案是“如果你必须向高层pipe理者解释你的模型,那么也许你应该使用决策树,因为决策规则是相当透明的”是好的。 不过,我并不关心实现/库问题。 此外,对于一个有点独立的问题,除了标准的贝叶斯分类器之外,是否有标准的最先进的评论垃圾邮件检测方法(而不是电子邮件垃圾邮件)呢?
我正在通过tensorflow api文档在这里 。 在张量stream文档中,他们使用了一个名为logits的关键字。 它是什么? api文档中的很多方法都是这样写的, tf.nn.softmax(logits, name=None) 现在写的是logits只是logits 。 那么为什么要保留一个不同的名字像logits ? 我几乎认为这是logics 。 😀 。 另一件事是有两种方法我不能区分。 他们是 tf.nn.softmax(logits, name=None) tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None) 他们之间有什么区别? 文件不清楚。 我知道什么是tf.nn.softmax 。 但不是其他。 一个例子将是非常有帮助的。
在人工智能和机器学习方面。 你能用一个例子来提供一个基本的,简单的解释吗?
ANN(人工neural network)和SVM(支持向量机)是监督机器学习和分类的两种常用策略。 对于一个特定的项目来说,哪种方法更好是不常见的,我确定答案总是“取决于”。 通常,使用两者的组合以及贝叶斯分类。 这些关于Stackoverflow的问题已经被问及关于ANN和SVM: ANN和SVM分类 ANN,SVM和KNN在我的分类问题上有什么区别 支持向量机还是人工neural network进行文本处理? 在这个问题中,我想具体了解一个ANN(特别是一个多层感知器)的哪些方面可能使它适用于SVM? 我问的原因是因为很容易回答相反的问题:支持向量机通常比ANN更好,因为它避免了ANN的两个主要弱点: (1)人工neural network常常是局部最小值而不是全球最小值,这意味着它们有时会“缺失大局”(或者错过了森林) (2)如果训练时间过长,人工neural network往往会过度适应 ,这意味着对于任何给定的模式,人工neural network可能会开始将噪声视为模式的一部分。 SVM不受这两个问题的影响。 然而,支持向量机(SVMs)是人工neural network的完全替代品并不是显而易见的。 那么,人工neural network对SVM有什么特别的优势可以使它适用于某些情况呢? 我已经列举了一个支持向量机的特定优点,现在我想看看人工neural network优点列表(如果有的话)。
请帮助我理解生成式algorithm和区分algorithm之间的区别,牢记我只是一个初学者。