Java JIT在运行JDK代码时是否作弊?

我正在对一些代码进行基准testing,即使使用完全相同的algorithm,我也无法使它像java.math.BigInteger一样快速运行。 所以我复制java.math.BigInteger源到我自己的包,并试图这样做:

 //import java.math.BigInteger; public class MultiplyTest { public static void main(String[] args) { Random r = new Random(1); long tm = 0, count = 0,result=0; for (int i = 0; i < 400000; i++) { int s1 = 400, s2 = 400; BigInteger a = new BigInteger(s1 * 8, r), b = new BigInteger(s2 * 8, r); long tm1 = System.nanoTime(); BigInteger c = a.multiply(b); if (i > 100000) { tm += System.nanoTime() - tm1; count++; } result+=c.bitLength(); } System.out.println((tm / count) + "nsec/mul"); System.out.println(result); } } 

当我运行这个(在MacOS上的jdk 1.8.0_144-b01)它输出:

 12089nsec/mul 2559044166 

当我运行它与导入行未注释:

 4098nsec/mul 2559044166 

使用JDK版本的BigInteger与我的版本相比差不多快三倍,即使它使用完全相同的代码。

我已经用javap检查了字节码,并且在使用选项运行时比较了编译器输出:

 -Xbatch -XX:-TieredCompilation -XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions -XX:+PrintInlining -XX:CICompilerCount=1 

而且这两个版本似乎都会生成相同的代码。 那么,热点使用一些预先计算的优化,我不能在我的代码中使用? 我总是明白,他们不。 什么解释这种差异?

是的,HotSpot JVM是一种“作弊”,因为它有一些在Java代码中找不到的BigInteger方法的特殊版本。 这些方法被称为JVM内在函数 。

特别是, BigInteger.multiplyToLen是HotSpot中的内在方法。 JVM源代码中有一个特殊的手工编译的程序集实现 ,但只适用于x86-64体系结构。

您可以使用-XX:-UseMultiplyToLenIntrinsic选项禁用此内在选项以强制JVM使用纯Java实现。 在这种情况下,性能将类似于复制代码的性能。

PS这里是其他HotSpot内在方法的列表 。

Java 8中,这确实是一个内在的,稍微修改过的方法:

  private static BigInteger test() { Random r = new Random(1); BigInteger c = null; for (int i = 0; i < 400000; i++) { int s1 = 400, s2 = 400; BigInteger a = new BigInteger(s1 * 8, r), b = new BigInteger(s2 * 8, r); c = a.multiply(b); } return c; } 

运行这个:

  java -XX:+UnlockDiagnosticVMOptions -XX:+PrintInlining -XX:+PrintIntrinsics -XX:CICompilerCount=2 -XX:+PrintCompilation <YourClassName> 

这将打印大量的线,其中之一将是:

  java.math.BigInteger::multiplyToLen (216 bytes) (intrinsic) 

另一方面,在Java 9中 ,该方法似乎不再是一个内在的东西,而是反过来又调用一个内在的方法:

  @HotSpotIntrinsicCandidate private static int[] implMultiplyToLen 

因此,在Java 9下运行相同的代码(使用相同的参数)将会显示:

 java.math.BigInteger::implMultiplyToLen (216 bytes) (intrinsic) 

在它下面的方法相同的代码 – 只是一个稍微不同的命名。