使用如下python代碼計算文件的md5值
import hashlib
# 獲取文件的md5值
def getmd5(file):
m = hashlib.md5()
with open(file,'rb') as f:
for line in f:
m.update(line)
md5code = m.hexdigest()
return md5code
在java中使用如下方法獲取md5值
/**
* 獲取文件的md5值
* @param file
* @return
*/
public static String getFileMD5(File file) {
if (!file.isFile()) {
return null;
}
MessageDigest digest = null;
FileInputStream in = null;
byte buffer[] = new byte[1024];
int len;
try {
digest = MessageDigest.getInstance("MD5");
in = new FileInputStream(file);
while ((len = in.read(buffer, 0, 1024)) != -1) {
digest.update(buffer, 0, len);
}
in.close();
} catch (Exception e) {
Log.i(InstallPkgUtil.TAG, "get md5 error: " + Log.getStackTraceString(e));
return null;
}
// 這裏的處理可能會丟失開頭的0
BigInteger bigInt = new BigInteger(1, digest.digest());
return bigInt.toString(16);
}
在某些情況下,使用java計算出來的md5值如果開頭是0的情況下,會被丟失。導致與python計算出來的不一致。 具體原因是BigInteger處理0開頭的數據時會丟失。
BigInteger的相關知識參見這篇博客。
所以修改java端的代碼如下:
/**
* 獲取文件的md5值
* @param file
* @return
*/
public static String getFileMD5(File file) {
if (!file.isFile()) {
return null;
}
char hexDigits[] = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
'a', 'b', 'c', 'd', 'e', 'f' };
MessageDigest digest = null;
FileInputStream in = null;
byte buffer[] = new byte[1024];
int len;
try {
digest = MessageDigest.getInstance("MD5");
in = new FileInputStream(file);
while ((len = in.read(buffer, 0, 1024)) != -1) {
digest.update(buffer, 0, len);
}
in.close();
} catch (Exception e) {
Log.i(InstallPkgUtil.TAG, "get md5 error: " + Log.getStackTraceString(e));
return null;
}
byte[] md = digest.digest();
// 把密文轉換成十六進制的字符串形式
int j = md.length;
char str[] = new char[j * 2];
int k = 0;
for (int i = 0; i < j; i++) {
byte byte0 = md[i];
str[k++] = hexDigits[byte0 >>> 4 & 0xf];
str[k++] = hexDigits[byte0 & 0xf];
}
return new String(str);
}