md5sum命令用于生成文件的md5数字摘要,并可以验证文件内容是否发生了改变,间接地还可以检验两个文件内容是否完全相同。因为md5sum是读取文件内容来计算校验码的,因此只能验证文件内容,而无法验证文件属性。
[root@xuexi ~]# cp -a /etc/fstab /tmp/fstab
[root@xuexi ~]# cp -a /etc/fstab /tmp/fstab1
生成文件的md5值。
[root@xuexi ~]# md5sum /tmp/fstab /tmp/fstab1
a612cd5d162e4620b442b0ff3474bf98 /tmp/fstab
a612cd5d162e4620b442b0ff3474bf98 /tmp/fstab1
发现这两个文件md5值完全一样,也就说明这两个文件完全相同。
由于生成的md5信息中,每个md5值后都紧跟着对应的文件的路径(可能是相对路径),于是将生成的md5保存到某个文件中,以后可以使用该文件来检查md5值对应文件内容是否发生了修改。
例如,将上述两个文件的md5信息保存到fs.md5sum中,然后使用"md5sum -c"可以检查源文件是否完整或是否被修改过。这个检查是内容上的,权限和属性等的改变不会影响md5值,所以不会检测出问题。
[root@xuexi ~]# md5sum /tmp/fstab /tmp/fstab1 >/tmp/fs.md5sum
[root@xuexi ~]# md5sum -c /tmp/fs.md5sum /tmp/fstab: OK /tmp/fstab1: OK
修改/tmp/fstab1的内容,然后再检测。
[root@xuexi tmp]# echo aaa >>/tmp/fstab1
[root@xuexi tmp]# md5sum -c /tmp/fs.md5sum /tmp/fstab: OK /tmp/fstab1: FAILED
md5sum: WARNING: 1 of 2 computed checksums did NOT match
当使用了"-c"选项时,还支持以下选项:
--quiet:不显示验证结果为OK的记录
--status:完全不显示任何信息,只能通过命令的退出状态码判断验证结果是否有failed。只要有一条failed记录,则状态码为1,否则为0。
[root@xuexi tmp]# md5sum --status -c /tmp/fs.md5sum
[root@xuexi tmp]# echo $? 1
通过比较md5sum的值,可以判断出多个文件的内容是否完全一致,但肉眼判断并不方便,所以写出脚本批量判断。脚本见:shell脚本示例:批量比较多个文件的内容是否相同。
获取字符串的MD5值:
字符串“hello”的MD5:
- $ echo -n 'hello'|md5sum|cut -d ' ' -f1
-
得到的MD5值:
- 5d41402abc4b2a76b9719d911017c592
-
命令解释:
md5sum: 显示或检查 MD5(128-bit) 校验和,若没有文件选项,或者文件处为"-",则从标准输入读取。
echo -n : 不打印换行符。
cut: cut用来从标准输入或文本文件中剪切列或域。剪切文本可以将之粘贴到一个文本文件。
-d 指定与空格和tab键不同的域分隔符。-f1 表示第一个域。参考这里。
获取文件的MD5值: - $ md5sum linuxmint-12-gnome-dvd-32bit.iso|cut -d ' ' -f1
得到的MD5值:
ee3d6e2ca498bc7685b7f17cdb5f2eea
- $ md5sum linuxmint-12-gnome-dvd-32bit.iso >linuxmint-12-gnome-dvd-32bit.md5
-
注意linuxmint-12-gnome-dvd-32bit.md5的内容是:
- ef3d6e2ca498bc7685b7f17cdb5f2eea linuxmint-12-gnome-dvd-32bit.iso
-
把linuxmint-12-gnome-dvd-32bit和其验证文件
linuxmint-12-gnome-dvd-32bit.md5放到同一目录下用下面的命令:
- $ md5sum -c linuxmint-12-gnome-dvd-32bit.md5
-
如果校验正确则输出:
- linuxmint-12-gnome-dvd-32bit.iso: 确定
-
如果校验错误则输出:
- linuxmint-12-gnome-dvd-32bit.iso: 失败
- md5sum: 警告:1/1 生成的校验和不匹配
命令解释:
md5 -c: 从文件中读取MD5 的校验值并予以检查
Message Digest Algorithm MD5为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。该算法的文件号为RFC 1321(R.Rivest,MIT Laboratory for Computer Science and RSA Data Security Inc. April 1992)
keywords:Hash,SHA,Ronald L. Rivest,MD5,IETF(Internet Engineering Task Force)
前言
在网络传输、设备之间转存、复制大文件等时,可能会出现传输前后数据不一致的情况。这种情况在网络这种相对更不稳定的环境中,容易出现。那么校验文件的完整性,也是势在必行的。
使用说明
md5sum命令用于生成和校验文件的md5值。它会逐位对文件的内容进行校验。是文件的内容,与文件名无关,也就是文件内容相同,其md5值相同。md5值是一个128位的二进制数据,转换成16进制则是32(128/4)位的进制值。
md5校验,有很小的概率不同的文件生成的md5可能相同。比md5更安全的校验算法还有SHA*系列的。
在网络传输时,我们校验源文件获得其md5sum,传输完毕后,校验其目标文件,并对比如果源文件和目标文件md5 一致的话,则表示文件传输无异常。否则说明文件在传输过程中未正确传输。
重要的选项:
-b 以二进制模式读入文件内容
-t 以文本模式读入文件内容
-c 根据已生成的md5值,对现存文件进行校验
--status 校验完成后,不生成错误或正确的提示信息,可以通过命令的返回值来判断。
使用举例
生成文件md5值
md5sum file
1: [root@master lianxi]# md5sum data
2: 0a6de444981b68d6a049053296491e49 data
使用通配对多个文件进行md5
1: [root@master lianxi]# md5sum *
2: 0a6de444981b68d6a049053296491e49 data
3: 13df384c47dd2638fd923f60c40224c6 data2
md5sum校验的是文件内容,与文件名无关
相同内容的文件的md5一样。如下我先对文件进行复制,然后对同内容不同名的文件进行md5,md5值一样
1: [root@master lianxi]# cp data data.bak
2: [root@master lianxi]# ls
3: data data.bak
4: [root@master lianxi]# md5sum *
5: 0a6de444981b68d6a049053296491e49 data
6: 0a6de444981b68d6a049053296491e49 data.bak
以文本模式或二进制模式读入文件并对其进行校验
-b 以二进制模式读入内容
-t 以文本模式读入文件内容进行校验
虽然是不同的读入模式,但是在进行求md5的时候,是一样的,因为是逐位校验的。
如下文本文件,无论通过哪种模式读取md5都一致。
1: [root@master lianxi]# file data
2: data: ASCII text
3: [root@master lianxi]# md5sum data
4: 0a6de444981b68d6a049053296491e49 data
5: [root@master lianxi]# md5sum -b data
6: 0a6de444981b68d6a049053296491e49 *data
7: [root@master lianxi]# md5sum -t data
8: 0a6de444981b68d6a049053296491e49 data
md5值重定向
将生成md5值重定向到指定的文件,通常文件的扩展名我们会命为.md5
1: [root@master lianxi]# md5sum data > data.md5
2: [root@master lianxi]# md5sum data
3: 0a6de444981b68d6a049053296491e49 data
4: [root@master lianxi]# cat data.md5
5: 0a6de444981b68d6a049053296491e49 data
将多个文件的md5重定向到指定的文件
每个文件的md5生成为一行
1: [root@master lianxi]# ls
2: data data.bak data.md5 d.md5
3: [root@master lianxi]# md5sum data* > d.md5
4: [root@master lianxi]# cat d.md5
5: 0a6de444981b68d6a049053296491e49 data
6: 0a6de444981b68d6a049053296491e49 data.bak
7: 0bd94658869c53cdcdf35a0f7de93e01 data.md5
重定向追加
这里新增文件ls,单独求其md5,将其md5追加到文件中
1: [root@master lianxi]# cp /bin/ls .
2: [root@master lianxi]# ls
3: data data.bak data.md5 d.md5 ls
4: [root@master lianxi]# md5sum ls >> d.md5
5: [root@master lianxi]# cat d.md5
6: 0a6de444981b68d6a049053296491e49 data
7: 0a6de444981b68d6a049053296491e49 data.bak
8: 0bd94658869c53cdcdf35a0f7de93e01 data.md5
9: c6337b20f3c159544bff5cf622391f9e ls
md5校验
-c选项来对文件md5进行校验。校验时,根据已生成的md5来进行校验。生成当前文件的md5,并和之前已经生成的md5进行对比,如果一致,则返回OK,否则返回错误信息
md5sum –c d.md5
1: [root@master lianxi]# md5sum -c d.md5
2: data: OK
3: data.bak: OK
4: data.md5: OK
5: ls: OK
修改文件后,文件md5变化
1: [root@master lianxi]# ls
2: data
3: [root@master lianxi]# md5sum data
4: 2360752c3368ca4f89169f5ecc06e383 data
5: [root@master lianxi]# md5sum data > data.md5
6: [root@master lianxi]# echo "lwg" >> data
7: [root@master lianxi]# md5sum data
8: 287d237083a42f09785daa46a5fa3afe data
9: [root@master lianxi]# md5sum -c data.md5
10: data: FAILED
11: md5sum: WARNING: 1 of 1 computed checksum did NOT match
--status,不显示校验信息,以命令返回值来判断
校验一致返回0,不一致返回1
1: [root@master lianxi]# md5sum -c data.md5
2: data: FAILED
3: md5sum: WARNING: 1 of 1 computed checksum did NOT match
4: [root@master lianxi]# md5sum -c --status data.md5
5: [root@master lianxi]# echo $?
6: 1
多个文件文件校验和grep连用
通过grep将正确的信息过滤掉
1: [root@master lianxi]# md5sum -c ../value.md5
2: acpid: OK
3: acpid.1: OK
4: anaconda.log: OK
5: anaconda.syslog: OK
6: anaconda.xlog: OK
7: boot.log: OK
8: boot.log.1: OK
9: ...
10: ...
11: 省略中间部分
12: ...
13: ...
14: yum.log.2: OK
15: md5sum: WARNING: 1 of 56 computed checksums did NOT match
1: [root@master lianxi]# md5sum -c ../value.md5 | grep -v OK
2: md5sum: WARNING: 1 of 56 computed checksums did NOT match
3: cron.1: FAILED
特殊说明
1)md5sum 是校验文件内容,与文件名是否相同无关
2)md5sum值逐位校验,所以文件越大,校验时间越长。
总结
通过md5sum来校验生成文件校验码,来发现文件传输(网络传输、复制、本地不同设备间的传输)异常造成的文件内容不一致的情况。