关于MD5算法的分析及其性能优化

来源：帮我找美食网

理　研究　柬工案捷术　２２４　关于ＭＤ５算法的分析及其性能优化　崔永辉’，徐鹏　，阳征鹏　（１．国防信息学院，武汉４３００１Ｏ；２．中国人民解放军６６２６７部队，石家庄０５００８１）　摘要：本文主要介绍了ＭＤ５算法的实现原理和对源数据信息的加密流程，然后从算法实现的角度，依据当前ＣＰＵ计算机制，对ＭＤ５算法的计　算时间的消耗进行分析，并提出了相应的性能优化建议，从而提升Ｍｏ５算法的计算速度。　关键词：ＭＤ５；优化；性能优化　ＤＯＩ：１０．１６６４０／ｊ．ｃｎｋｉ．３７—１２２２／ｔ．２０１５．２１．２００　１概述　随着科学技术的发展以及互联网络的不断应用，信息安全的重要　性已经成为继大数据、云计算之后的ＩＴ行业热门发展方向。在信息　安全体系中，信息加密是其中非常重要的部分，也是应对各种网络攻　击或者暴力破解工具很好的应对手段。ＭＤ５算法是目前应用较为广泛　的一种算法，它允许应用系统将不同数据信息加密成固定ｔ２８位的加　密字符串，从而有效地保证了数据信息的保密性、完整性和可用性。　然而ＭＤ５算法过程繁琐、算法复杂，在具体实现时必须考虑其计算　性能，如果加密时间过长，将会为实际应用带来非常差的用户体验。　所以对于ＭＤ５算法的研究以及对其计算性能的优化分析，对于ＭＤ５　算法实现来说，具有非常大的现实意义。　２　ＭＤ５算法　ＭＤ５是Ｒｉｖｅｒｓｔ在之前ＭＤ２，ＭＤ３，ＭＤ４的基础上，经过升级　优化开发而来。采用ＭＤ５算法，可以让任意长度的数据信息，变成　一个１２８位固定长度的大整数的加密形式，从而实现了数据信息的加　密，而ＭＤ５算法的加密过程是一个不可逆的过程，在一定程度上保　证了数据信息的安全性，对于一些暴力破解、密码嗅探的工具来说，　对ＭＤ５算法加密的数据解密将是一个工作量非常大的过程。　ＭＤ５算法的处理过程需要经过以下几个阶段：字符填充，长度加　长，块分解，变量初始化，块处理。　其中，ＭＤ５算法的字符填充，因为ＭＤ５算法最终是对５１２位的　数据块进行处理，所以对于整体数据源长度不是５１２倍数的，需要将　其字符填充，是最终的长度为５１２位长度的倍数减去６４位。然后信　息源长度加长，即用６４位长度表示字符填充之前原信息源长度，填　充到最后６４位，最终使得到的字符串长度为５１２位的倍数。第三步，　块分解，将最终得到的字符串以５１２位长度为单位，对其进行划分，　形成最终的数据块，第四步，生成变量，即生成四个３２位长的十六　进制变量。得到这四个初始化变量之后，就可以对生成的数据块进行　ＭＤ５算法处理。　块处理的过程，是使用ＭＤ５算法的过程，假如有四个变量Ａ，Ｂ，　Ｃ，Ｄ，其值与上述四个初始化值一一对应，然后将ＡＢＣＤ组合成一　个１２８为长度的数值放到一个寄存器中。将第一个５１２位长度的数据　块，以３２位长度为单位，平均分成１６个小块，从而得到了从０到１５　的字块。假如存在一个常量数组，其元素个数为６４，每个元素为３２　位长度的常量数值。　首先使用第一个非线性函数对变量Ｂ，Ｃ，Ｄ进行计算，将结果　到存储１２８位数据的寄存器中，然后将Ａ加入到该寄存器，将第０个　消息加入到１２８位寄存器中，将常量数组的第０个常量元素加入到寄　存器中，然后将寄存器左移某个值（该值是不断变化的）位，然后将　变量Ｂ加入到１２８位寄存器中。然后从头开始，循环１６次，将５１２　位长度的１６个子块都进行相同处理。　然后依次使用第二个、第三个、第四个非线性函数开始，按照上　面的方法，对该数据块进行处理，最终将得到１２８位寄存器的值。最　后，将Ａ，Ｂ，Ｃ，Ｄ变量的值分别自加，按照上述算法，依次对一下　组５１２位的数据进行相同的算法处理，最终得到的１２８位寄存器的值　即为源信息数据的ＭＤ５算法加密的最终结果。　３　ＭＤ５算法的性能优化　３．１　展开ＭＤ５算法的循环过程　由于ＭＤ５算法需要很多循环，而且很多时候采用多层循环嵌套　来实现。对于计算机体系来说，多次的循环与多层次的循环嵌套，加　上变量的地址寻址，自身在ＣＰＵ执行时，会浪费大量的时间，加上　多次循环和多层循环嵌套，与变量地址寻址使得ＣＰＵ指令流水线的　预取与阻断的机制失效，从而增加了大量的计算时间。对于大数量级　和多层循环嵌套的ＭＤ５算法来说，可以通过展开循环过程来提升其　计算时间。所以在编程实现ＭＤ５算法时，尽量将每个循环体采用５　到１ｏ次的循环次数，通过多个循环程序块来完成整个ＭＤ５算法。同时，　为了减少内存寻址的时间浪费，能够采用常量的变量，尽量在预定义　时采用常量的形式定义。　３．２避免指令跳转　在当前ＣＰＵ的计算机制中，执行固定内存块的指令速度是最块的，　如果发生程序地址指针改变，则ＣＰＵ将会浪费一部分时间去内存寻　址或从虚拟交换空间或磁盘中读取数据，而这将会浪费大量的计算时　间。对于常见的编程语言，ｉｆ…ｅｌｓｅ或者ｆｏｒ、ｗｈｉｌｅ循环，甚至是ｇｏｍ　语句，都是常见的指令跳转语句，在实现ＭＤ５算法时，尽量避免使　用产生指令跳转的语句，从而减少ＣＰＵ执行代码时的寻址时间。　３．３变量长度ＣＰＵ寄存器匹配　不同计算机的ＣＰＵ寄存器大小是不一样的。对于长度大于ＣＰＵ　寄存器长度的变量，ＣＰＵ将会分多次进行计算，最后将结果进行整合　来完成计算。如果变量长度小于ＣＰＵ寄存器长度，那么ＣＰＵ将会在　寄存器后附加其他的数据或者执行来完成计算。对于一个３２位寄存　器的ＣＰＵ来说，对一个３２位变量的计算时间将比对一个１６位变量的　计算时间块近一倍，所以在复杂繁琐的ＭＤ５算法实现过程中，定义　变量或常量时，尽量与当前执行算法的ＣＰＵ寄存器长度一致，从而　增加整个代码中数值的计算速度。　３．４减少变量个数　由于操作系统对于变量的存放机制，使得ＣＰＵ在对某个变量进　行计算时，需要按照变量指针从内存中寻址读取，存放到寄存器中进　行计算。整个计算机框架ＣＰＵ从内存读取和写入的时间对于ＣＰＵ计　算来说慢很多，所以在ＭＤ５算法实现时，尽量减少变量的个数。此外，　常量与变量的存放机制也有所不同，所以对于固定不变的数据尽量使　用常量类型代替。　４总结　ＭＤ５算法是对按照固定的循环和计算对源数据信息进行加密，最　终生成１２８位的加密数据。由于整个过程计算量非常大，而且过程非　常繁琐，所以在算法实现时，会耗费大量的时间。对于ＭＤ５算法实　现的性能优化的机制非常多，主要是考虑当前系统的ＣＰＵ计算机制，　采用最匹配的方式，最终减少加密运算的时间，更块地得到１２８位加　密数据。　参考文献：　［１】毛熠，陈娜．ＭＤ５算法的研究与改进【Ｄ】．计算机工程，２０１２（２４）．　［２】么丽颖．ＭＤ５算法的分析和改进［Ｊ］．哈尔滨师范大学自然科学学　报，２　０１１（０５）．　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文