如何对浮点数执行按位运算

我试过这个：

float a = 1.4123; a = a & (1 << 3);

我得到一个编译器错误，说&的操作数不能是floattypes。

当我这样做时：

 float a = 1.4123; a = (int)a & (1 << 3);

我正在运行程序。唯一的事情就是按四舍五入后得到的数字的整数表示进行按位运算。

以下也是不允许的。

 float a = 1.4123; a = (void*)a & (1 << 3);

我不明白为什么int可以被抛出void*但不能float 。

我正在这样做来解决在Stack Overflow问题中描述的问题如何使用遗传algorithm求解线性方程组？ 。

在语言层面上，不存在“浮点数的按位操作”这样的事情。 C / C ++中的位运算用于数值的表示。在C / C ++中没有定义浮点数值的表示。浮点数在值表示的层次上没有位，这就是为什么你不能对它们应用按位操作。

你所能做的就是分析浮点数占用的原始内存的位内容。为此，您需要使用下面build议的联合或者（等同地，并且只在C ++中）将浮点对象重新解释为一个unsigned char对象数组，如

 float f = 5; unsigned char *c = reinterpret_cast<unsigned char *>(&f); // inspect memory from c[0] to c[sizeof f - 1]

另外，请不要尝试像其他答案所build议的那样将float对象重新解释为int对象。这是没有什么意义的，这是非法的，这不能保证在优化中遵循严格别名规则的编译器工作。在C ++中检查内存内容的唯一合法方法是将其重新解释为[signed/unsigned] char的数组。

另外请注意，在技术上不能保证你的系统上的浮点表示是IEEE754（尽pipe在实践中它是除非你明确地允许它不是，然后只针对-0.0，±无穷大和NaN）。

如果您试图更改浮点表示中的位，可以这样做：

 union fp_bit_twiddler { float f; int i; } q; qf = a; qi &= (1 << 3); a = qf;

正如AndreyT所指出的那样，访问像这样的联合会调用未定义的行为，而编译器可能会伸长arm并扼杀你。做他的build议。

 float a = 1.4123; unsigned int* inta = reinterpret_cast<unsigned int*>(&a); *inta = *inta & (1 << 3);

看看下面的内容。受快速平方根的启发：

 #include <iostream> using namespace std; int main() { float x, td = 2.0; int ti = *(int*) &td; cout << "Cast int: " << ti << endl; ti = ti>>4; x = *(float*) &ti; cout << "Recast float: " << x << endl; return 0; }

@mobrule：

更好：

 #include <stdint.h> ... union fp_bit_twiddler { float f; uint32_t u; } q; /* mutatis mutandis ... */

对于这些值 int可能是好的，但一般来说，你应该使用无符号整型进行位移以避免算术移位的影响。 uint32_t甚至可以在int不是32位的系统上工作。

浮点运算的浮点运算（Python配方）中的Python实现通过表示二进制数字的方式工作，二进制数字无限地向左和向右延伸。由于浮点数在大多数架构上都有一个有符号的零，所以它使用补码来表示负数（实际上它只是假装这样做并使用一些技巧来实现外观）。

我相信它可以适应在C ++中工作，但是必须小心谨慎，以便在均衡指数时不会让右移溢出。

按位运算符不应该在浮点数上使用，因为浮点数是硬件特定的，无论您使用什么硬件都是相似的。你想冒什么风险？“在我的机器上运行好了”？相反，对于C ++，您可以通过在“对象”包装器上重载stream操作符来获得与位移操作符类似的“感觉”：float：

 // Simple object wrapper for float type as templates want classes. class Float { float m_f; public: Float( const float & f ) : m_f( f ) { } operator float() const { return m_f; } }; float operator>>( const Float & left, int right ) { float temp = left; for( right; right > 0; --right ) { temp /= 2.0f; } return temp; } float operator<<( const Float & left, int right ) { float temp = left; for( right; right > 0; --right ) { temp *= 2.0f; } return temp; } int main( int argc, char ** argv ) { int a1 = 40 >> 2; int a2 = 40 << 2; int a3 = 13 >> 2; int a4 = 256 >> 2; int a5 = 255 >> 2; float f1 = Float( 40.0f ) >> 2; float f2 = Float( 40.0f ) << 2; float f3 = Float( 13.0f ) >> 2; float f4 = Float( 256.0f ) >> 2; float f5 = Float( 255.0f ) >> 2; }

你将有一个剩余的，你可以根据你想要的实现扔掉。

 float a = 1.4123; int *b = (int *)&a; *b = *b & (1 << 3); // a is now the IEEE floating-point value caused by the manipulation of *b // equals 1.121039e-44 (tested on my system)

这与Justin的回应相似，除了它只创build一个相同寄存器中位的视图。所以当你操作*b ， a值会相应地改变。

FWIW，在浮点运算上有一个真实的用例（我刚刚碰到它） – 为仅支持GLSL的老版本的GPU编写的着色器（1.2及更早版本不支持按位运算符），如果浮点数转换为整数，那么精度会有所下降。

按位操作可以使用余数（模）和不等式检查在浮点数上实现。例如：

 float A = 0.625; //value to check; ie, 160/256 float mask = 0.25; //bit to check; ie, 1/4 bool result = (mod(A, 2.0 * mask) >= mask); //non-zero if bit 0.25 is on in A

上面假定A在[0..1]之间，掩码中只有一个“位”来检查，但是可以推广到更复杂的情况。

这个想法是基于在它是可能实现位运算符使用整数algorithm中find的一些信息

如果甚至没有内置的mod函数，那么也可以相当容易地实现。例如：

 float mod(float num, float den) { return num - den * floor(num / den); }

如何对浮点数执行按位运算

为什么asm.js性能恶化？

在Java中使用XOR（^）运算符进行布尔检查是不是很好？

为什么-3 ==〜2在C＃

在C ++中使用按位运算符来进行布尔运算

C＃中两个左括号“<<”是什么意思？

了解PHP＆（＆符号，按位和）运算符

去<<和>>运营商

什么使用单pipe'|' 在函数参数中呢？

+运算符如何在C中工作？

转换为二进制文件并保持Python中前导零