扩展python – swig,而不是swig或Cython

我发现我的Python代码中的瓶颈,与心理等玩过。然后决定编写ac / c + +扩展的性能。




当然,你将永远有一个手动的性能增益,但收益将是非常小的工作要做到这一点。 我没有任何数字给你,但我不build议这样做,因为你需要手工维护界面,如果你的模块很大,这不是一个选项!

你做了正确的select使用脚本语言,因为你想快速发展。 这样你就避免了早期的优化综合症,现在你想优化瓶颈部分,太好了! 但是,如果你手动执行C / python接口,肯定会陷入早期的优化综合症。


如果你只想在你的程序中使用python代码,还可以考虑使用Cython 。


如果你有很多的函数和类绑定, Py ++是一个很好的工具,可以自动生成所需的代码来创build绑定。




  • 痛饮:


    缺点:我不喜欢parsing器的工作方式。 我不知道是否取得了一些进展,但两年前,C ++parsing器是相当有限的。 大多数情况下,我不得不复制/过去我的.h头添加一些%字符,并给予swig分析器额外的提示。

    我还需要不时地处理Python C-API(不是那么)复杂的types转换。


  • Boost.Python的:

    亲:这是一个非常完整的图书馆。 它允许你用C-API来做几乎所有可能的事情,但是在C ++中。 我从来没有用这个库编写C-API代码。 我也从来没有遇到由于图书馆的错误。 绑定的代码或者像魅力或拒绝编译。

    如果您已经有一些C ++库可以绑定,那么这可能是目前最好的解决scheme之一。 但是如果你只有一个小的C函数来重写,我可能会尝试使用Cython。

    缺点:如果你没有一个预编译的Boost.Python库,你将使用Bjam(typesreplace)。 我真的讨厌Bjam和它的语法。

    用BP创build的Python库往往变得肥胖。 编译它们也需要很多时间。

  • Py ++(停产):Boost.Python变得简单。 Py ++使用C ++parsing器来读取您的代码,然后自动生成Boost.Python代码。 你也得到了作者的大力支持(不,不是我;-))。

    缺点:只有由于Boost.Python本身的问题。 更新:截至2014年,这个项目现在看起来停止。

  • Pybindgen:

    它生成处理C-API的代码。 您可以在Python文件中描述函数和类,或者让Pybindgen自动读取您的头文件并自动生成绑定(为此,它使用pygccxml,由Py ++的作者编写的python库)。

    缺点:这是一个年轻的项目,比Boost.Python小一点。 还有一些限制:你不能使用C ++类的多重inheritance,Callbacks(不是自动的,尽pipe如此,自定义的callback处理代码也可以被编写)。 将Pythonexception转换为C.


  • 一个新的:在2009年1月20日,Py ++的作者宣布了一个新的用于连接C / C ++代码和python的包。 它基于ctypes。 我没有尝试过,但我会! 注意:这个项目看起来令人不快,就像Py ++一样。

  • CFFI :直到最近我才知道这个的存在,所以现在我不能给出我的意见。 看起来您可以在Pythonstring中定义C函数,并直接从相同的Python模块中调用它们。

  • Cython :这是我目前在我的项目中使用的方法。 基本上你可以在特殊的.pyx文件中编写代码。 这些文件被编译(翻译)成C代码,然后被编译到CPython模块。 Cython代码看起来像普通的Python(实际上纯Python是有效的.pyx Cython文件),但是你也可以获得更多的信息,比如variablestypes。 这个可选的types允许Cython生成更快的C代码。 Cython文件中的代码既可以调用纯Python函数,也可以调用C和C ++函数(以及C ++方法)。

    我花了一些时间思考在Cython中,在相同的代码中调用C和C ++函数,混合使用Python和Cvariables,等等。 但这是一个非常强大的语言,有一个活跃的(2014年)和友好的社区。

SWIG 2.0.4引入了一个新的内置选项来提高性能。 我使用了一个快速调用C ++扩展的示例程序做了一些基准testing。 我使用boost.python,PyBindGen,SIP和SWIG构build了扩展,带有和不带-builtin选项。 以下是结果(平均100次):

 SWIG with -builtin 2.67s SIP 2.70s PyBindGen 2.74s boost.python 3.07s SWIG without -builtin 4.65s 

SWIG曾经是最慢的。 随着新的select,SWIG似乎是最快的。

使用Cython是相当不错的。 你可以用一个类似Python的语法来编写你的C扩展,并让它生成C代码。 包括锅板。 既然你的代码已经在python中了,你只需要对瓶颈代码进行一些修改,就可以从中生成C代码。

例。 hello.pyx

 cdef int hello(int a, int b): return a + b 


一个观察:基于pybindgen开发人员进行的基准testing,boost.python和swig之间没有显着差异。 我没有做我自己的基准testing,以validation这有多依赖于正确使用boost.pythonfunction。

还要注意,pybindgen似乎总体上比swig和boost.python快得多:它可能不会像其他两个那样产生多function的绑定。 例如,exception传播,调用参数types检查等。我还没有机会使用pybindgen,但我打算。

Boost一般是相当大的包安装的,最后我看到你不能只安装boost python你几乎需要整个Boost库。 正如其他人所提到的那样,由于大量使用模板编程,编译将会很慢,这也意味着编译时通常会出现相当模糊的错误信息。

总结:鉴于SWIG的安装和使用是多么容易,它生成的体面的绑定是健壮的和多function的,而且一个接口文件允许你的C ++ DLL可以从LUA,C#和Java等几种其他语言中获得。它超过boost.python。 但除非你真的需要多语言支持,否则我会仔细研究一下PyBindGen,因为它的速度很快,并且要密切关注它所产生的绑定的稳健性和多function性。

既然你关心速度和开销,我build议考虑PyBindGen 。

我有经验使用它来包装一个大的内部C ++库。 在尝试了SWIG,SIP和Boost.Python后,我更喜欢PyBindGen,原因如下:

  1. PyBindGen包装器是纯Python,不需要学习另一种文件格式
  2. PyBindGen直接生成Python C API调用,没有像SWIG这样的速度掠夺间接层。
  3. 生成的C代码干净,简单易懂。 我也喜欢Cython,但是尝试读取它的C输出可能有时很困难。
  4. 支持STL序列容器(我们使用了很多std :: vector)

这里有龙。 不要大嚼,不要提高。 对于任何复杂的项目,您必须填写自己的代码以使其工作变得难以pipe理。 如果它是一个简单的C API到你的库(没有类),你可以使用ctypes。 这将是容易和无痛的,你将不必花费数小时拖网通过这些迷宫的包装项目的文档,试图find关于你需要的function的一个小logging。

如果它不是一个很大的扩展,boost :: python也可能是一个选项,它比swig执行得更快,因为你可以控制发生了什么,但是开发需要更长的时间。

无论如何,如果一次通话中的工作量足够大,那么swig的开销是可以接受的。 例如,如果你发出的是你有一些中等大小的逻辑块,你想转移到C / C ++,但是这个块在一个紧密的循环中被调用,经常,你可能不得不避免swig,但我真的不能想象除了脚本化的graphics着色器之外的任何实际示例。

放弃你的python代码之前,看看ShedSkin 。 他们声称在某些代码上比Psyco有更好的性能(并且声明它仍然是实验性的)。

否则,将C / C ++代码绑定到python有几种select。



下一个select是Pyrex 。 它允许编写作为C扩展编译的伪python代码。