在Java中获取文件的MD5校验和

我正在寻找使用Java获取文件的MD5校验和。 我真的很惊讶,但我一直没能find任何显示如何获得文件的MD5校验和的东西。

它是如何完成的?

还有一个inputstream装饰器java.security.DigestInputStream ,以便您可以像平常一样使用inputstream来计算摘要,而不必额外传递数据。

 MessageDigest md = MessageDigest.getInstance("MD5"); try (InputStream is = Files.newInputStream(Paths.get("file.txt")); DigestInputStream dis = new DigestInputStream(is, md)) { /* Read decorated stream (dis) to EOF as normal... */ } byte[] digest = md.digest(); 

使用Apache Commons Codec库中的DigestUtils :

 FileInputStream fis = new FileInputStream(new File("foo")); String md5 = org.apache.commons.codec.digest.DigestUtils.md5Hex(fis); fis.close(); 

Real的Java-How-to使用MessageDigest类有一个例子。

请检查该页面是否使用了CRC32和SHA-1。

 import java.io.*; import java.security.MessageDigest; public class MD5Checksum { public static byte[] createChecksum(String filename) throws Exception { InputStream fis = new FileInputStream(filename); byte[] buffer = new byte[1024]; MessageDigest complete = MessageDigest.getInstance("MD5"); int numRead; do { numRead = fis.read(buffer); if (numRead > 0) { complete.update(buffer, 0, numRead); } } while (numRead != -1); fis.close(); return complete.digest(); } // see this How-to for a faster way to convert // a byte array to a HEX string public static String getMD5Checksum(String filename) throws Exception { byte[] b = createChecksum(filename); String result = ""; for (int i=0; i < b.length; i++) { result += Integer.toString( ( b[i] & 0xff ) + 0x100, 16).substring( 1 ); } return result; } public static void main(String args[]) { try { System.out.println(getMD5Checksum("apache-tomcat-5.5.17.exe")); // output : // 0bb2827c5eacf570b6064e24e0e6653b // ref : // http://www.apache.org/dist/ // tomcat/tomcat-5/v5.5.17/bin // /apache-tomcat-5.5.17.exe.MD5 // 0bb2827c5eacf570b6064e24e0e6653b *apache-tomcat-5.5.17.exe } catch (Exception e) { e.printStackTrace(); } } } 

com.google.common.hash API提供:

  • 用于所有散列函数的统一的用户友好API
  • 种子32和128位murmur3的实现
  • md5(),sha1(),sha256(),sha512()适配器,只改变一行代码在这些之间切换,并且低语。
  • goodFastHash(int bits),当你不关心你使用什么algorithm
  • HashCode实例的一般实用程序,如combineOrdered / combineUnordered

阅读用户指南( IO说明 , 哈希解释 )。

对于您的用例Files.hash()计算并返回文件的摘要值。

例如sha-1摘要计算(将SHA-1更改为MD5以获取MD5摘要)

 HashCode hc = Files.hash(file, Hashing.sha1()); "SHA-1: " + hc.toString(); 

请注意, crc32比md5快得多,所以如果不需要密码安全的校验和,请使用crc32 。 另外请注意, md5不应该用来存储密码等,因为它很容易暴力,密码使用bcrypt , scrypt或sha-256 。

为了长期保护散列, Merkle签名scheme增加了安全性,欧洲委员会资助的Post Quantum密码学研究组build议使用这种密码术来对抗量子计算机( ref )的长期保护。

请注意, crc32比其他的碰撞率更高。

使用nio2(Java 7+)和没有外部库:

 byte[] b = Files.readAllBytes(Paths.get("/path/to/file")); byte[] hash = MessageDigest.getInstance("MD5").digest(b); 

将结果与预期的校验和进行比较:

 String expected = "2252290BC44BEAD16AA1BF89948472E8"; String actual = DatatypeConverter.printHexBinary(hash); System.out.println(expected.equalsIgnoreCase(actual) ? "MATCH" : "NO MATCH"); 

Guava现在提供了一个新的,一致的哈希API,它比JDK提供的各种哈希API更加用户友好。 见散列解释 。 对于一个文件,你可以很容易得到MD5总和,CRC32(14.0+版本)或许多其他哈希值:

 HashCode md5 = Files.hash(file, Hashing.md5()); byte[] md5Bytes = md5.asBytes(); String md5Hex = md5.toString(); HashCode crc32 = Files.hash(file, Hashing.crc32()); int crc32Int = crc32.asInt(); // the Checksum API returns a long, but it's padded with 0s for 32-bit CRC // this is the value you would get if using that API directly long checksumResult = crc32.padToLong(); 

好。 我不得不补充。 对于已经拥有Spring和Apache Commons依赖项的用户,或者正在计划添加它的用户可以使用一行代码:

 DigestUtils.md5DigestAsHex(FileUtils.readFileToByteArray(file)) 

对于和Apache的公共选项(credit @duleshi):

 DigestUtils.md5Hex(FileUtils.readFileToByteArray(file)) 

希望这有助于某人。

没有使用Java 7的第三方库的简单方法

 String path = "your complete file path"; MessageDigest md = MessageDigest.getInstance("MD5"); md.update(Files.readAllBytes(Paths.get(path))); byte[] digest = md.digest(); 

如果你需要打印这个字节数组。 使用如下

 System.out.println(Arrays.toString(digest)); 

如果你需要hexstring出这个摘要。 使用如下

 String digestInHex = DatatypeConverter.printHexBinary(digest).toUpperCase(); System.out.println(digestInHex); 

DatatypeConverter是javax.xml.bind.DatatypeConverter

我最近不得不这样做只是一个dynamic的string, MessageDigest可以以多种方式表示哈希。 为了得到像md5sum命令一样的文件签名,我不得不这样做:

 try { String s = "TEST STRING"; MessageDigest md5 = MessageDigest.getInstance("MD5"); md5.update(s.getBytes(),0,s.length()); String signature = new BigInteger(1,md5.digest()).toString(16); System.out.println("Signature: "+signature); } catch (final NoSuchAlgorithmException e) { e.printStackTrace(); } 

这显然不能回答你的问题,关于如何做一个特定的文件,上面的答案很好地处理这个安静。 我花了很多时间把它看成是大多数应用程序显示它,并认为你可能遇到同样的麻烦。

 public static void main(String[] args) throws Exception { MessageDigest md = MessageDigest.getInstance("MD5"); FileInputStream fis = new FileInputStream("c:\\apache\\cxf.jar"); byte[] dataBytes = new byte[1024]; int nread = 0; while ((nread = fis.read(dataBytes)) != -1) { md.update(dataBytes, 0, nread); }; byte[] mdbytes = md.digest(); StringBuffer sb = new StringBuffer(); for (int i = 0; i < mdbytes.length; i++) { sb.append(Integer.toString((mdbytes[i] & 0xff) + 0x100, 16).substring(1)); } System.out.println("Digest(in hex format):: " + sb.toString()); } 

或者你可能会得到更多的信息http://www.asjava.com/core-java/java-md5-example/

我们使用的代码类似上面的代码在以前的post使用

 ... String signature = new BigInteger(1,md5.digest()).toString(16); ... 

但是,请注意在这里使用BigInteger.toString() ,因为它会截断前导零(例如,尝试s = "27" ,校验和应该是"02e74f10e0327ad868d138f2b4fdd6f0"

我第二个build议使用Apache Commons Codec,我用这个代替了我们自己的代码。

 public static String MD5Hash(String toHash) throws RuntimeException { try{ return String.format("%032x", // produces lower case 32 char wide hexa left-padded with 0 new BigInteger(1, // handles large POSITIVE numbers MessageDigest.getInstance("MD5").digest(toHash.getBytes()))); } catch (NoSuchAlgorithmException e) { // do whatever seems relevant } } 

标准的Java Runtime Environment方式 :

 public String checksum(File file) { try { InputStream fin = new FileInputStream(file); java.security.MessageDigest md5er = MessageDigest.getInstance("MD5"); byte[] buffer = new byte[1024]; int read; do { read = fin.read(buffer); if (read > 0) md5er.update(buffer, 0, read); } while (read != -1); fin.close(); byte[] digest = md5er.digest(); if (digest == null) return null; String strDigest = "0x"; for (int i = 0; i < digest.length; i++) { strDigest += Integer.toString((digest[i] & 0xff) + 0x100, 16).substring(1).toUpperCase(); } return strDigest; } catch (Exception e) { return null; } } 

结果是相等的Linux md5sum实用程序。

非常快速和干净的Java方法,不依赖于外部库:

(如果需要的话,只需用SHA-1,SHA-256,SHA-384或SHA-512replaceMD5)

 public String calcMD5() throws Exception{ byte[] buffer = new byte[8192]; MessageDigest md = MessageDigest.getInstance("MD5"); DigestInputStream dis = new DigestInputStream(new FileInputStream(new File("Path to file")), md); try { while (dis.read(buffer) != -1); }finally{ dis.close(); } byte[] bytes = md.digest(); // bytesToHex-method char[] hexChars = new char[bytes.length * 2]; for ( int j = 0; j < bytes.length; j++ ) { int v = bytes[j] & 0xFF; hexChars[j * 2] = hexArray[v >>> 4]; hexChars[j * 2 + 1] = hexArray[v & 0x0F]; } return new String(hexChars); } 

另一个实现: Java中的快速MD5实现

 String hash = MD5.asHex(MD5.getHash(new File(filename))); 
 String checksum = DigestUtils.md5Hex(new FileInputStream(filePath)); 

下面是一个简单的函数,它包含Sunil的代码,以便将File作为参数。 该函数不需要任何外部库,但它确实需要Java 7。

 import java.io.File; import java.io.IOException; import java.nio.file.Files; import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; import javax.xml.bind.DatatypeConverter; public class Checksum { /** * Generates an MD5 checksum as a String. * @param file The file that is being checksummed. * @return Hex string of the checksum value. * @throws NoSuchAlgorithmException * @throws IOException */ public static String generate(File file) throws NoSuchAlgorithmException,IOException { MessageDigest messageDigest = MessageDigest.getInstance("MD5"); messageDigest.update(Files.readAllBytes(file.toPath())); byte[] hash = messageDigest.digest(); return DatatypeConverter.printHexBinary(hash).toUpperCase(); } public static void main(String argv[]) throws NoSuchAlgorithmException, IOException { File file = new File("/Users/foo.bar/Documents/file.jar"); String hex = Checksum.generate(file); System.out.printf("hex=%s\n", hex); } } 

示例输出:

 hex=B117DD0C3CBBD009AC4EF65B6D75C97B 

如果你使用ANT来构build,这是非常简单的。 将以下内容添加到您的build.xml中:

 <checksum file="${jarFile}" todir="${toDir}"/> 

jarFile是要生成MD5的JAR,而toDir是要放置MD5文件的目录。

更多信息在这里。

Google guava提供了一个新的API。 find下面的一个:

 public static HashCode hash(File file, HashFunction hashFunction) throws IOException Computes the hash code of the file using hashFunction. Parameters: file - the file to read hashFunction - the hash function to use to hash the data Returns: the HashCode of all of the bytes in the file Throws: IOException - if an I/O error occurs Since: 12.0 
 public static String getMd5OfFile(String filePath) { String returnVal = ""; try { InputStream input = new FileInputStream(filePath); byte[] buffer = new byte[1024]; MessageDigest md5Hash = MessageDigest.getInstance("MD5"); int numRead = 0; while (numRead != -1) { numRead = input.read(buffer); if (numRead > 0) { md5Hash.update(buffer, 0, numRead); } } input.close(); byte [] md5Bytes = md5Hash.digest(); for (int i=0; i < md5Bytes.length; i++) { returnVal += Integer.toString( ( md5Bytes[i] & 0xff ) + 0x100, 16).substring( 1 ); } } catch(Throwable t) {t.printStackTrace();} return returnVal.toUpperCase(); }