有没有一个推荐的软件包在Python机器学习?

有没有一个推荐的软件包在Python机器学习?

我有以前在C ++和MATLAB中实现各种机器学习和统计algorithm的经验,但是在Python中做了一些工作,我对Python的可用包感到好奇。

AFAIK, Orange可能是目前最好的select。
PyML也不错。
PyMC用于贝叶斯估计。
还有一本书“机器学习:一个algorithm的视angular”, 书中有很多Python代码的例子 ,可能值得一读。
还有一篇博客文章: Python的语用分类 。
只是我的两分钱。

还有scikit学习 (BSD,只依赖于numpy和scipy)。 它包括各种监督学习algorithm,如:

  • 基于libsvm的SVM和线性scipy.sparse绑定广泛的function数据集
  • 贝叶斯方法
  • HMM模型
  • L1和L1 + L2正则化回归方法,即用LARS和坐标下降algorithm实现的Lasso和Elastic Net模型

它还具有无监督的聚类algorithm,如:

  • k均值++
  • 均值漂移
  • 亲和力传播
  • 谱聚类

还有其他工具,如:

  • 用于文本内容的特征提取器(标记和字符+散列vector化器)
  • 单variables特征select
  • 一个简单的pipe道工具
  • 交叉validation策略的许多实现
  • 绩效指标评估和绘图(ROC曲线,AUC,混淆matrix,…)
  • 网格search实用程序使用并行交叉validation来执行超参数调整
  • 与joblib集成,以便在交互式环境中工作时caching部分结果(例如,使用ipython)

每个algorithm实现都附带示例程序,演示其在玩具数据或实际生活数据集上的使用情况。

此外,官方的源代码仓库托pipe在github上,所以请随时用交互式代码审查的常规拉取请求function来贡献错误修正和改进。

一个普通的用户友好的软件包是橙色 – 如Weka或RapidMiner,如果你熟悉这些。

除此之外,还有各种各样的包和工具包用于各种任务。 您应该参考mloss上列出的Python包作为起点。

你可能想看看:

http://www.shogun-toolbox.org/ ,它有多种语言的接口,包括python。 也有http://www.pybrain.org/ ,这是(我相信)MLalgorithm的本地实现。 希望有所帮助。

对于支持向量机,看看其中包含Python接口的LibSVM 。

深度学习教程描述如何开发和训练深度neural network。 使用的库甚至使用Nvidia GPU(如果可用)。

在堆栈溢出可能相关的问题:

python中的人工智能库 。

什么是最好的Python人工智能库?

我给了Orange一个尝试。

它很强大,但是如果你仔细阅读文档,你会发现作者有他自己疯狂的Python编写风格。 如果你对Python比较陌生,那么他的代码就会变得非常神秘,所以除非你熟悉Python,否则我不会推荐Orange。

我不确定你是否确切地称这个机器学习,但nltk包做贝叶斯风格的文本分类。 您可以使用学习数据和testing数据来查看它是推断有关数据的规则。

这是SciPy完成的一个很好的清单,包括许多着名的Python软件包,其中包括机器学习相关的内容: 人工智能和机器学习

看看用于数据处理(MDP)的模块化工具包 。 它从机器学习和统计实现了几个algorithm,它是成熟的和有据可查的。

如果你正在寻找neural network,python绑定fann是很容易使用,并与工具来训练你的networking

SVMlight有时是LibSVM的替代scheme! 不过,LibSVM也是太棒了。