什么是Python的缓冲区types?

在Python中有一个buffertypes,但我不知道如何使用它。

在Python文档中的描述是:

buffer(object[, offset[, size]])

对象参数必须是支持缓冲区调用接口(如string,数组和缓冲区)的对象。 将会创build一个引用对象参数的新缓冲区对象。 缓冲区对象将是从对象的开始(或从指定的偏移量)的切片。 切片将延伸到对象的末尾(或将有一个由大小参数给定的长度)。

一个示例用法:

 >>> s = 'Hello world' >>> t = buffer(s, 6, 5) >>> t <read-only buffer for 0x10064a4b0, size 5, offset 6 at 0x100634ab0> >>> print t world 

在这种情况下,缓冲区是一个子string,从长度为5的位置6开始,并且不占用额外的存储空间 – 它引用string的一个片段。

对于这样的短string来说这不是非常有用,但是在使用大量数据时可能是必须的。 这个例子使用了一个可变的bytearray

 >>> s = bytearray(1000000) # a million zeroed bytes >>> t = buffer(s, 1) # slice cuts off the first byte >>> s[1] = 5 # set the second element in s >>> t[0] # which is now also the first element in t! '\x05' 

如果您希望对数据有多个视图并且不想(或不能)在内存中保存多个副本,这可能非常有用。

请注意, buffer已被Python 3中更好的命名memoryview取代,尽pipe您可以在Python 2.7中使用。

还要注意的是,如果不深入研究C API,就不能实现自己的对象的缓冲接口,也就是说,你不能用纯Python来实现。

当将python连接到本地库时,我认为缓冲区是非常有用的。 (Guido van Rossum解释了这个邮件列表中的 buffer )。

例如,numpy似乎使用缓冲区进行高效的数据存储:

 import numpy a = numpy.ndarray(1000000) 

a.data是一个:

 <read-write buffer for 0x1d7b410, size 8000000, offset 0 at 0x1e353b0>