以正整数计算非零位的快速方法

我需要一个快速的方法来计算Python中的整数位数。我目前的解决scheme是

bin(n).count("1")

但我想知道是否有更快的方式做到这一点？

PS：（我代表一个大的2D二进制数组作为数字的单子列表，并进行按位操作，并将时间从几小时缩短到几分钟，现在我想摆脱那些额外的分钟。

编辑：1.它必须在Python 2.7或2.6

对于小数字的优化并不重要，因为这不是一个明确的瓶颈，但是在某些地方我确实有10000个数字的数字

例如这是一个2000位的情况：

12448057941136394342297748548545082997815840357634948550739612798732309975923280685245876950055614362283769710705811182976142803324242407017104841062064840113262840137625582646683068904149296501029754654149991842951570880471230098259905004533869130509989042199261339990315125973721454059973605358766253998615919997174542922163484086066438120268185904663422979603026066685824578356173882166747093246377302371176167843247359636030248569148734824287739046916641832890744168385253915508446422276378715722482359321205673933317512861336054835392844676749610712462818600179225635467147870208L

对于任意长度的整数， bin(n).count("1")是我能够在纯Python中find的最快速度。

我试着调整Óscar和Adam的解决scheme来分别处理64位和32位的整数。两者至less比bin(n).count("1")慢十倍（32位版本花费了大约一半的时间）。

另一方面， gmpy popcount()花费了bin(n).count("1")大约1/20的时间。所以，如果你可以安装gmpy，使用。

您可以调整以下algorithm：

 def CountBits(n): n = (n & 0x5555555555555555) + ((n & 0xAAAAAAAAAAAAAAAA) >> 1) n = (n & 0x3333333333333333) + ((n & 0xCCCCCCCCCCCCCCCC) >> 2) n = (n & 0x0F0F0F0F0F0F0F0F) + ((n & 0xF0F0F0F0F0F0F0F0) >> 4) n = (n & 0x00FF00FF00FF00FF) + ((n & 0xFF00FF00FF00FF00) >> 8) n = (n & 0x0000FFFF0000FFFF) + ((n & 0xFFFF0000FFFF0000) >> 16) n = (n & 0x00000000FFFFFFFF) + ((n & 0xFFFFFFFF00000000) >> 32) # This last & isn't strictly necessary. return n

这适用于64位正数，但它很容易扩展，操作的数量随着参数的对数（即与参数的位长度成线性关系）而增长。

为了理解这个工作原理，可以想象将整个64位string分成64个1位的桶。每个桶的值等于桶中设置的比特数（如果没有比特被设置则为0，如果设置了一个比特则为1）。第一次转换的结果是一个类似的状态，但有32个桶，每个长度为2位。这是通过适当地移动桶并添加它们的值来实现的（由于在桶之间不会发生进位，因此一个添加处理所有桶，n位数总是足够长以编码数n）。进一步的转换导致状态呈指数级增长的桶的数量呈指数级递减，直到我们到达一个64位长的桶为止。这给出了在原始参数中设置的位数。

下面是人口数algorithm的Python实现，正如本文中所解释的：

 def numberOfSetBits(i): i = i - ((i >> 1) & 0x55555555) i = (i & 0x33333333) + ((i >> 2) & 0x33333333) return (((i + (i >> 4) & 0xF0F0F0F) * 0x1010101) & 0xffffffff) >> 24

它将工作于0 <= i < 0x100000000 。

根据这篇文章，这似乎是最快的执行海明重量（如果你不介意使用大约64KB的内存）。

 #http://graphics.stanford.edu/~seander/bithacks.html#CountBitsSetTable POPCOUNT_TABLE16 = [0] * 2**16 for index in range(len(POPCOUNT_TABLE16)): POPCOUNT_TABLE16[index] = (index & 1) + POPCOUNT_TABLE16[index >> 1] def popcount32_table16(v): return (POPCOUNT_TABLE16[ v & 0xffff] + POPCOUNT_TABLE16[(v >> 16) & 0xffff])

在Python 2.x中，您应该使用xrangereplacerange 。

编辑

如果你需要更好的performance（和你的数字是大整数），看看GMP库。它包含许多不同体系结构的手写汇编实现。

gmpy是一个C编码的Python扩展模块，它包装了GMP库。

 >>> import gmpy >>> gmpy.popcount(2**1024-1) 1024

你说Numpy太慢了。你用它来存储个人位？为什么不扩展使用int作为位数组的想法，但使用Numpy来存储这些？

将n位存储为一个32位整数的数组ceil(n/32.) 。然后，您可以使用numpy数组与您使用整数（包括使用它们索引另一个数组）相同的方式（以及相似的方式）。

该algorithm基本上是并行地计算每个单元中设置的比特数，并且它们总计每个单元的比特数。

 setup = """ import numpy as np #Using Paolo Moretti's answer http://stackoverflow.com/a/9829855/2963903 POPCOUNT_TABLE16 = np.zeros(2**16, dtype=int) #has to be an array for index in range(len(POPCOUNT_TABLE16)): POPCOUNT_TABLE16[index] = (index & 1) + POPCOUNT_TABLE16[index >> 1] def popcount32_table16(v): return (POPCOUNT_TABLE16[ v & 0xffff] + POPCOUNT_TABLE16[(v >> 16) & 0xffff]) def count1s(v): return popcount32_table16(v).sum() v1 = np.arange(1000)*1234567 #numpy array v2 = sum(int(x)<<(32*i) for i, x in enumerate(v1)) #single int """ from timeit import timeit timeit("count1s(v1)", setup=setup) #49.55184188873349 timeit("bin(v2).count('1')", setup=setup) #225.1857464598633

虽然我很惊讶没有人build议你写一个C模块。

您可以使用该algorithm来获取整数的二进制string[1]，而不是连接string，计算一个string的数量：

 def count_ones(a): s = 0 t = {'0':0, '1':1, '2':1, '3':2, '4':1, '5':2, '6':2, '7':3} for c in oct(a)[1:]: s += t[c] return s

[1] https://wiki.python.org/moin/BitManipulation

事实certificate，你的开始表示是一个列表，它是1或0的列表。只需在表示中对它们进行计数。

在Python中，整数中的位数是常量。

但是，如果要计算所设置的位数，最快的方法是创build一个符合以下伪代码的列表： [numberofsetbits(n) for n in range(MAXINT)]

这将为您提供一个恒定的时间查询生成列表后。查看@ PaoloMoretti的答案是为了很好地实现这一点。当然，你不需要将这一切都保存在内存中 – 你可以使用某种持久化的键值存储，甚至是MySql。（另一个select是实现你自己的简单的基于磁盘的存储）。

以正整数计算非零位的快速方法

编辑

如果只需要结果的低部分，那么哪个2的补码整数运算可以在input中不调零高位的情况下使用？

在Windows中比较2个二进制文件的工具

如何编译一个Linux shell脚本成为一个独立的可执行文件二进制（即不只是如chmod 755）？

如何打印（使用cout）数字的方式存储在内存中？

如何将二进制string转换为Java中的基数为10的整数

C ++ – 十进制到二进制转换

如何将整数转换为二进制向量？

在Java中，我可以用二进制格式定义一个整数常量吗？

什么是应用程序二进制接口（ABI）？

如何在Ruby中将string或整数转换为二进制文件？

以正整数计算非零位的快速方法

编辑

如果只需要结果的低部分，那么哪个2的补码整数运算可以在input中不调零高位的情况下使用？

在Windows中比较2个二进制文件的工具

如何编译一个Linux shell脚本成为一个独立的可执行文件*二进制*（即不只是如chmod 755）？

如何打印（使用cout）数字的方式存储在内存中？

如何将二进制string转换为Java中的基数为10的整数

C ++ – 十进制到二进制转换

如何将整数转换为二进制向量？

在Java中，我可以用二进制格式定义一个整数常量吗？

什么是应用程序二进制接口（ABI）？

如何在Ruby中将string或整数转换为二进制文件？

如何编译一个Linux shell脚本成为一个独立的可执行文件二进制（即不只是如chmod 755）？