首页 > 范文大全 > 正文

忽悠人的压缩神话

开篇:润墨网以专业的文秘视角,为您筛选了一篇忽悠人的压缩神话范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

在论坛里看到一个帖子说有个外国变态用KGB Archiver这款压缩软件把439.6MB大小的Of-fice2007安装包压缩成了1.43MB大小,并到了网上。很多人的第一反应就是不可能,但东西就在这儿,是真是假解压出来就知道了,于是不少人就抱着将信将疑的态度,下载了这个1.43MB 的Office2007。然而解压的时候却让众人又大吃一惊,有人说用P4 630的CPU、1GB内存的电脑解压要花6个小时,配置差些的电脑甚至要花10~20 小时不等。如此漫长的解压时间,把众人的胃口吊得更高了,于是在等待结果那段时间里,众人就展开了激烈的讨论。

首先说说KGB Archiver 这款压缩软件吧,它是一款压缩率高得不可思议的压缩工具。它超越了如7zip和UHARC等以高压缩率而著称的压缩工具,但是它对硬件的需求也较高,使用它的最大压缩模式居然需要4GB内存!软件作者推荐的最低配置为1.5GHz CPU和256MB 的内存,推荐最佳配置为3.0GHz的64位CPU和1.5GB 的内存。

接着回到众人的讨论中,有人说Maximum Compression网站有对各种压缩软件的变态测试,那里的测试结果是KGBArchiver可以把500MB 的数据压缩到70多MB,即使是现在最强的WinRK 或者PAQ8G 也只能压缩到60 几MB,以此证明这个1.43MB 的Office2007 是忽悠人的(网址:www /data/summary_mf.php)。但又有人提出了“微观压缩理论”,说任何的数字数据都可以用一个小于1 大于0 的有理数序列表表示,而这样的数字都可以在数轴上表示出来,因此只要一个字节就可以表示出最大地址值的数据量,最理想的情况下我们可以用1M B的空间存储1 TB 的内容。顿时就有人对这个在Google上都搜索不到的理论表示置疑,有的人就一步步分析此人的理论,说经压缩后的1TB 数据依然属于“任何”数据,那么它就应该能继续重复压缩,那就证明世界上所有数据的全集可以压缩为容量1MB ,这显然就很荒谬了。还有的人就把信息论之父C.E.Shannon 的理论搬出来,说信息编码是有极限的,在一定的概率模型下,无损压缩的编码长度不可能小于信息熵公式给出的结果。而提出微观压缩理论的人又说这个理论是颠覆信息学的,不能用信息学来解释,限制它实现的只有物理极限和技术水平。如此一番唇枪舌剑,让论坛里多了一丝学术气氛。

经过6 个多小时的等待,终于有人把它解压完了,然而安装的时候却提示OSETUP.DLL 文件的数字签名无效,无法进行安装。难道等待了6 个小时就是这么个结果?所幸这个Office2007 的鬼佬后来又提供了单独的OSETUP.DLL文件下载,但是替换掉这个文件后,仍然无法安装。不甘心者本着实事求是的态度,用UltraEdit打开了里面的几个CAB文件,发现内容竟然全部是FF,就连E XE 文件也有一大部分内容是00,估计整个压缩文件中可能就那么一两个小文件是真实的。还有的人用Win R AR 的最大压缩方式把解压后的Office2007 又重新压缩了一遍,最后得到的压缩文件竟然只有3.73MB,由此更加证明Office2007安装包里面绝大多数都是些空文件,根本就不是有效的安装程序。如果是空文件,那么这么大的压缩比就很好解释了。所谓空文件,就是文件的16进制内容全是00的文件(也可以是FF),这样的文件不管它的体积有多大,压缩后的体积也会很小。熟悉数据库操作的人就知道,随便建一个1GB的数据库,这个空数据库文件压缩后可能就只有几KB 大小。

最后终于可以得出结论:我们被这个鬼佬忽悠了一把。但是这件事也让更多的人认识到了K G B Archiver这款压缩软件。其实,压缩软件一味地追求高压缩率并不明智,因为高压缩率往往对硬件的依赖程度也很高,像解压这个1.43MB的Office2007要花6个小时,有这么多时间,都足够通过网络传输一份未经压缩的Office2007安装程序了。随着存储技术和网络技术的迅猛发展,个人用户将会在未来几年体验到更大容量的存储器和更快的网速。当我们只要花1 分钟就可以下载一部HDTV影片的时候,谁还愿意去下载一部要花10 个小时解压后才能观看的影片呢?所以压缩软件不用一味地追求高压缩率的神话,把握好压缩率与时间以及硬件配置之间的平衡关系,才能让大家用得满意,这也就是为什么WinZIP 和WinRAR 能占有压缩软件市场绝大份额的原因之一吧。

本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。