当前位置:首页 » 文件管理 » c语言可以打开压缩文件吗
扩展阅读
可以变声的钢铁侠图片 2025-05-15 10:24:04

c语言可以打开压缩文件吗

发布时间: 2023-04-14 09:38:33

1. 如何用C语言编写暴力破解压缩文件解压密码的程序

由于有一个重要的Rar文件,极需解开,首先试用了ARPC,但是解压的速度极慢,每秒只有30个左右,所以断了穷举破解的念头,却仍不死心,因为我从不崇尚穷举破解的方法,除非每秒可以跑几千万次的,我或许可以一试,所以决定研究一下Winrar3.x密码算法,以期是否可以破解该密码。查看了网络上的资料,包括看雪FAQ里的回答,都声称只能用穷举法破解,起先并不理解,但通过研究,我理解了看雪前辈们在FAQ里所说的原因,不禁让我佩服

Winrar加密思路的成熟。虽然研究的结果没有什么新意,但我还是决定把我的研究结果与大家一起分享,为那些仍然以为winrar密码可以象破解注册码一样的,通过修改winrar弹出框之类的更改文件流程指向可以达到跳过密码检验的朋友,做一个简要的说明。

一、Rar文件生成的流程。
Winrar加密文件时,总的分两个步骤:
1:先把源文件压缩,压成一段数据段。
册山丛2:再将压缩完的数据段加密。
对于同一个源文件来说,不进行加密,压缩完,其rar文件中的数据段是一模一样的。但是如果对同一个源文件来说,即使使用同一个密码,加密完rar文件中的数据段是不一样的,这是由于加密的密钥是依赖于一个Salt(8个字节的密钥,用来加密时使用,存放在rar文件头中里)
所以要解密rar加密文件关键在于数据解密这一步,那我们接下来研究一下如何加密的。
二、加密“压缩完的数据段”的流程
1、获取州樱密钥:
将明文的密码与Salt一起,通过HASH算法,生成两个16字节的密钥。(一个是KEY(AES算法的参数),一个是initVector)
2、以Key和initVector来加密压缩数据:
这里,是一个循环加密的结构,每16字节作为一个块,进行加密(这可能正是为什么加密完的文件长度总为16倍数的原因)。加密采用AES算法(RAR采用的是AES的rijndael的标准应用)。这里注意:AES加密前,有一个异或运算,是先将每16字节块与上一个16字节块加密结果进行异或,然后再进行AES算法的。我用一个简单的示意代码看说明唯誉:
;===============================================
packblock[0]=packblock[i]^initVector
encryptBlock[0]=AES(packblock[0]) ;(KEY为AES的密钥)
for i=1to 块数量-1
packblock[i]=packblock[i]^encryptBlock[i-1]
encryptBlock[i]=AES(packblock[i]);(KEY为AES的密钥)
next
;packblock[i]表示压缩完的每16字节数据
;encryptBlock[i]表示加密完的每16字节数据
;===============================================
三、解密的过程
由于AES算法是对称的,所以解密的过程,是加密过程的逆运算。但解密时AES算法过程与加密所用的不一样(是因为解密过程中由KEY生成的子密钥表不一样)。仍然需要我们将密码输入,与salt一起生成两个16字节密钥,KEY和initVector。

;===============================================
packblock[0]=AES1(encryptBlock[0]) ;(KEY为AES的密钥)
packblock[0]=packblock[i]^initVector
for i=1to 块数量-1
packblock[i]=AES1(encryptBlock[i]) ;(KEY为AES的密钥)
packblock[i]=packblock[i]^encryptBlock[i-1]

next
;===============================================
那判断密码是否正确的在什么地方呢?
解密的过程是解密后的数据块进行解压缩,然后解成源文件,对该文件进行CRC校验,存在RAR文件中的源文件CRC校验码比较,相同则密码正确,不相同则密码错误。

四、无法秒破的原因
从上面,我们了解了RAR文件的整体思路。地球人都知道,解密时,肯定有个步骤是来判断密码的正确与否。而且,依据以往的经验,我们也许可以将某些判断的点移动,那样可以缩减破解的流程思路。那RAR的这一步在哪里?它把校验放在了最后的一步。如果要秒破,我们该怎么做泥?至少我认为目前是不可能的。
我们从解密过程逆反过来看看:
1、CRC检验这一块修改跳转?根本毫无意义,因为它已经是最后一步了。你可以修改RAR文件头的CRC值,你可以将它改得和你用任意密码解压出来的文件CRC值一样,但你的文件根本就不是原来的文件了。可能已经完全面目全非了。所以,对这一过程不可行。CRC校验本身是不可逆的
2、那么把判断提前到压缩完的数据?
解压的时候,有没有什么来判断压缩数据是否正确?压缩完的数据,有没有固定的特征,是否可以做为解压的判断,在这一步里,我们也无法找到有效的可用的固定特征。因为这一步涉及到RAR的压缩算法。即使一个源文件,即使你的文件前一部分是完全相同的,只对后面的部分进行改过,那么压缩完,数据也是完全一样的。因为压缩完的数据首先是一个压缩表,后面是编码。文件不一样,扫描完的压缩表也不一样,编码又是依赖于压缩表,所以,这里头找不到压缩完的数据有任何的固定特征可以用来判断的。
不管压缩数据是什么样的,Winrar都一如既往地进行解压,没有进行压缩数据是否有效的判断。
3、那假如我们破解了AES了泥?
由于AES只依赖于KEY,如果AES算法被破解了,我们知道了KEY,我们可以解出压缩完的数据,但是这里有一个问题,还有一个initVector密钥,用来第一个16字节块的异或,你没有initVector参数,你第一个16字节块的数据便无法解得出来。
4、那就只能从第一步Hash的算法入手
即使你能破解hash,但hash后的结果泥?没有结果,你怎么返推密码。

所以综上,我发现rar的加密是由hash和AES两种算法互相牵制,而两种算法当前都无法破解,至少目前还没有办法秒破,也理解了看雪高手讲的道理。
五、对穷举提高算法效率的一些设想。
我用汇编写完了RAR穷举解密的算法模块,但是如何提高效率,优化穷举的速度泥?我有如下的想法:
1、从压缩数据里找寻特征,省掉解压缩、CRC检验代码和生成initVector生成代码。目前,通过多次实验,我找到的一个特征(不知道这个是否正确),即解密完的最后一个16字节块的最后一个字节必须为0。因为经过多次的试验,我发现有加密的数据段长度都会比未加密前的数据长,那么,最后一个

16个字节的数据块解密完,多出的部分就都为0,但多出几个字节泥?多次实验,长度不一,我试想着从加密数据段最后一个16个字节块着手,只解这一块,看是否一个字节为0,这样,只解密16个字节的数据,来大大提高效率?如果能进行到这一步了,再通过解全部数据,进行CRC校验的判断。
2、如果第一个特征不成立的话,针对特定格式的压缩文件,比如doc、jpg等,部分数据固定,压缩完的数据是否存在相互牵制的数据?从而把判断提前,这一步,我不知道如何找到压缩完的数据是否存在相互牵制的数据。

2. c语言怎么解ZIP压缩格式呀!

为什么一定要用C语橡茄言.直接用解压软梁雀察件也可以呀.
网上岁猜下载地址:
http://www.winrar.com.cn/download.htm

3. 如何用c语言压缩解压文件夹

压缩是一种有效的减小数据量的方法,目前已经被广泛应用于各种类型的信息系统之中。

一种压缩文本文件的方法如下:

1. 原始文本文件中的非字母的字符,直接拷贝到压缩文件中;

2.
原始文件中的词(全部由字母组成),消闭如果是第一次出现,则将该词加清敏入到一个词的列表中,并拷贝到压缩文件中;否则该词不拷贝到压缩文件中,而是将该词在词的列表中的位置拷贝到压缩文件中。

3. 词的列表的起始位置为 1 。 词的定义为文本中由大小写字母组成的最大序列。大写字母和小写字母认为是不同的字母,即 abc 和 Abc
是不同的词。词的例子如下: * x-ray 包括两个词 x 和 ray * mary's 包括两个词 mary 和 s * a c-Dec 包括三个词 a 和
c 和 Dec 编写一个程序,输入为一组字符串,输出为压缩后的文本。

输入:

输入为一段文本,你可以假设输入中不会出现数字、每行的长度不会超过 80 个字符,并且输入文本的大小不会超过 10M。

输出:

压缩后的文本。

输入:
Please, please do it--it would please Mary very,
very much.

Thanks

输出:
Please, please do it--4 would 2 Mary very,
7 much.

Thanks

#include<stdlib.h>
#include<stdio.h>
#include<string.h>
#defineLEN1<<20
intisArabic(charc){
return('a'<=c&&c<='z')||('A'<=c&&c<='Z');
}
intmain()
{
chardict[LEN];
char*index[100000];
charbuf[82];
intnWord=0;
inti,j;
charc;
char*inFile="G:\in.txt",*outFile="G:\out.txt";
FILE*inp,*outp;

if((inp=fopen(inFile,"r"))==NULL){
printf("cannotopen ");
exit(1);
}
if((outp=fopen(outFile,"w"))==NULL){
printf("outfail ");
}
index[0]=dict;
do{
/*getaword*/
i=0;
do{
c=fgetc(inp);
buf[i++]=c;
}while(isArabic(c));

buf[i-1]=0;
/*putittodict*/
if(i>1){
for(j=0;j<nWord;j++){
if(strcmp(index[j],buf)==0){
break;
}
}
if(j==nWord){
strcpy(index[nWord],buf);
index[nWord+1]=index[nWord]+strlen(buf)+1;
nWord++;
/*printf("new:%s ",buf);*/
}else{
sprintf(buf,"%d",j+1);
/*printf("found:%s ",buf);*/
}
}
/*putittooutputfile*/
if(c!=EOF)
fprintf(outp,"%s%c",buf,c);
答桥枝else
fprintf(outp,"%s",buf);
}while(c!=EOF);

fclose(inp);
fclose(outp);
/*system("PAUSE");*/
returnEXIT_SUCCESS;
}

4. C++如何读取压缩文件数据

首先指出你提问的一个错误这个不是C++实现, 这个是纯C实现的
你说的BZ2_开头,这些只是变量名字而已,没什么特别的意思。
给你解释一句吧:
BZ2_bzlibVersion=GetProcAddress(hLib,"BZ2_bzlibVersion");
要解释这句话首先你要明白这个c程序本身是不能解镇悄瞎压的,他是调用了一个动态库libbz2-1.0.2.DLL里的函数,你可以从
#define BZ2_LIBNAME "libbz2-1.0.2.DLL"
hLib=LoadLibrary(BZ2_LIBNAME);
这两句看出来他加载了上面说的那个库,然后回到刚才那句,BZ2_bzlibVersion是定义的一个函数指针,定义语句他省略了。这里用了C语言的defalut-int定义。
GetProcAddress用来获得库函数的入口地址,hLib是前面打开的库函数文件句柄(hLib=LoadLibrary(BZ2_LIBNAME);),"BZ2_bzlibVersion"是库函数的需要调用的函数名。
这句话最终的功能就是把原来库函数的,"BZ2_bzlibVersion"函数地址赋值给函数指针BZ2_bzlibVersion,以后调用BZ2_bzlibVersion就可以实现库函数,"BZ2_bzlibVersion"的功能。
后面几句话都是一样的,fwrite是写文件,stdout是输出流,这些都可以网络到。
说实话你一个新手看这个真的没什么意义。你问的也是些细枝末节的问题,运宴这个程序其实核心功能只有两句话:
while((len=BZ2_bzread(BZ2fp_r,buff,0x1000))>0){
fwrite(buff,1,len,fp_w);
}

while((len=fread(buff,1,0x1000,fp_r))>0){
BZ2_bzwrite(BZ2fp_w,buff,len);
}

而这两句话调用的是调用库函数BZ2_bzread和BZ2_bzwrite来进行解压fwrite和fread是写文件和读文件。即使你都看懂了,你就会解压了吗?即使看懂你还是什么都不会,你只是会调用一个库函数御空而已。如果你要研究这个库函数,那就更不是一两个问题能说清的了。建议你还是从基础,一步一个脚印地学习C/C++

祝好运

5. 如何用C语言解压缩文件

如果你自己设计算法弊搭,就另当别论,如果想利陪前用第3方的算法,我推荐用zlib,生成的压缩包是流行的zip格式.源代芦卜清码很好找(www.zlib.net)

6. C语言如何直接读取压缩文件

c语言中没有直接读取压缩文件的函数包。

7. C语言如何读取zip文件内容

zip是压缩后的,你直接读取就是乱码,没有能直接读取的,想读取真实内容,必须先按解压算法解压出来。

8. 怎么用c语言将.zip文件解压成文件夹

简单一点的 直接调用系拿没枣统命令
比如system("unzip ___filename___ -d target_path");
这样做 实察山际就相当于在命令行下敲了这样的一个命令
不过 这个要求系统内 必须安装了unzip这个软件 即支持这个命令

复杂一些的 你可以再网上找一个开源的gzip 很多很好消拆找的 然后看懂代码 调用对应的接口函数
这样做的好处不需要依赖系统环境