itertools产品加速

我使用itertools.product来生成长度为13的4个元素的所有可能的变化。4和13可以是任意的，但是，实际上，我得到4 ^ 13个结果，这是很多的。我需要结果作为一个Numpy数组，目前做到以下几点：

c = it.product([1,-1,np.complex(0,1), np.complex(0,-1)], repeat=length) sendbuf = np.array(list(c))

有了一些简单的剖析代码，它看起来像第一行几乎是瞬间的，而转换到列表然后Numpy数组需要大约3个小时。有没有办法让这个更快？这很可能是我忽视的一些事情。

谢谢！

itertools.product()的NumPy相当于numpy.indices() ，但它只会得到0，…，k-1forms范围的乘积：

 numpy.rollaxis(numpy.indices((2, 3, 3)), 0, 4) array([[[[0, 0, 0], [0, 0, 1], [0, 0, 2]], [[0, 1, 0], [0, 1, 1], [0, 1, 2]], [[0, 2, 0], [0, 2, 1], [0, 2, 2]]], [[[1, 0, 0], [1, 0, 1], [1, 0, 2]], [[1, 1, 0], [1, 1, 1], [1, 1, 2]], [[1, 2, 0], [1, 2, 1], [1, 2, 2]]]])

对于你的特殊情况，你可以使用

 a = numpy.indices((4,)*13) b = 1j ** numpy.rollaxis(a, 0, 14)

（这不会在一个32位的系统上运行，因为这个数组太大了，从我可以testing的大小推断，它应该在不到一分钟的时间内运行）。

EIDT：只要提一下：调用numpy.rollaxis()或多或less都是numpy.rollaxis() ，以获得与itertools.product()相同的输出。如果你不关心索引的顺序，你可以忽略它（但是，只要你没有任何后续操作将你的数组转换成连续的数组，那么它就很便宜）。

编辑2：得到确切的模拟

 numpy.array(list(itertools.product(some_list, repeat=some_length)))

您可以使用

 numpy.array(some_list)[numpy.rollaxis( numpy.indices((len(some_list),) * some_length), 0, some_length + 1) .reshape(-1, some_length)]

这完全是不可读的 – 只是告诉我，我是否应该进一步解释:)

第一行似乎是即时的，因为没有实际的操作发生。一个生成器对象只是被构造出来的，只有当你在迭代操作时才会发生。正如你所说，你得到4^13 = 67108864号码，所有这些都是计算，并在list调用。我看到，np.array只接受列表或元组，所以你可以尝试从你的迭代器中创build一个元组，并将它传递给np.array，以查看是否有任何性能差异，并且不会影响程序的整体性能。这只能通过尝试你的用例来确定，尽pipe有一些说tuple稍快的点。

尝试一个元组，而不是列表只是做

 sendbuf = np.array(tuple(c))

你可以通过跳转到列表来加快速度：

 numpy.fromiter(c, count=…) # Using count also speeds things up, but it's optional

有了这个函数，NumPy数组首先被分配，然后逐个元素地被初始化，而不需要经过列表构造的附加步骤。

PS ： fromiter()不处理由product()返回的元组，所以现在可能不是解决scheme。如果fromiter()确实处理了fromiter() dtype=object ，这应该可以工作。

PPS ：正如乔·金顿（Joe Kington）指出的那样，可以通过将元组放在一个结构化数组中来实现。但是，这似乎并不总是加快速度。

您可能想尝试一种完全不同的方法：首先创build一个所需大小的空数组：

 result = np.empty((4**length, length), dtype=complex)

然后使用NumPy的切片function来自己填充arrays：

 # Set up of the last "digit": result[::4, length-1] = 1 result[1::4, length-1] = -1 result[2::4, length-1] = 1j result[3::4, length-1] = -1j

您可以为其他“数字”（即结果[：，2]，结果[：，1]和结果[：，0]）的元素做类似的事情。整个事情当然可以放在循环遍历每个数字。

转移整个操作（ np.empty((length, 4**length)…) ）是值得尝试的，因为它可能会带来速度增益（通过更好地使用内存caching）。

可能不是优化，但更less依赖pythontypes转换：

 ints = [1,2,3,4] repeat = 3 def prod(ints, repeat): w = repeat l = len(ints) h = l**repeat ints = np.array(ints) A = np.empty((h,w), dtype=int) rng = np.arange(h) for i in range(w): x = l**i idx = np.mod(rng,l*x)/x A[:,i] = ints[idx] return A

让numpy.meshgrid做所有的工作：

 length = 13 x = [1, -1, 1j, -1j] mesh = numpy.meshgrid(*([x] * length)) result = numpy.vstack([y.flat for y in mesh]).T

在我的笔记本上需要〜2分钟

itertools产品加速

让numpy.meshgrid做所有的工作：

什么时候使用zip而不是izip更好？

具有独特价值的排列

itertools中的chain和chain.from_iterable有什么区别？

Python如何一次读取N行

Windows许可证密钥的所有排列组合