实验四 文件系统 实验报告.docx
- 文档编号:8609734
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:29
- 大小:27.34KB
实验四 文件系统 实验报告.docx
《实验四 文件系统 实验报告.docx》由会员分享,可在线阅读,更多相关《实验四 文件系统 实验报告.docx(29页珍藏版)》请在冰豆网上搜索。
实验四文件系统实验报告
文件系统实验报告
一、实验目的
了解操作系统中文件系统的原理以及实现方法。
二、实验方法
通过FAT12文件系统的解读,了解文件系统的原理和实现。
三、实验任务
通过对FAT12文件系统的了解,编写程序,读取并列出一个虚拟软盘中文件信息(文件名、属性、修改时间等),以及读取其中的文件内容
四、实验要点
FAT12文件系统的了解,Linux系统下文件读写相关系统调用。
五、实验过程
1.FAT12文件系统分析
簇是操作系统分配文件空间的基本单位,簇由若干个扇区组成。
在FAT12文件系统中,簇号的有效位是12位,所以这种文件系统就被称为FAT12。
FAT12文件系统中大致可以分成五个区,这五个区为:
起始扇区
占用扇区
起始地址
结束地址
分区
0
1
0x00000000
0x000001FF
引导区
1
9
0x00000200
0x000013FF
FAT区
10
9
0x00001400
0x000025FF
FAT备份区
19
12
0x00002600
0x00003DFF
根目录区
31
-
0x00003E00
-
文件数据区
其中,引导区中储存着一些基本的信息。
例如,0x0000000B和0x0000000C两个字节保存着每个扇区的大小,0x0000000D保存着每个簇占用多少个扇区。
FAT区中储存着簇号。
在0x00000200开始的三个字节,分别储存设备类型标记(0xF0为软盘);第二个第三个字节均为0xFF,是FAT标识符。
在FAT12文件系统中,每个簇占用12位,即1.5个字节。
簇号与地址的对应关系如下表:
地址偏移
000
001
002
003
004
005
簇序号
000
001
002
003
一个簇号跨越两个字节,每次读取簇号时读取两个字节,然后对读出的两个字节进行位运算处理,得到下一簇的簇序号。
注意,这里同样需要对高低位进行处理,即使用位计算的方式提取相应的簇号信息。
根据上述的原理,可以得出一个函数,以一个簇号为参数,返回值为文件下一个簇号。
代码如下:
intgetNextClutserId(FILE*fp,shortclusterId)
{
unsignedshorttmp,low=0,high=0;;
intaddress=(clusterId*3/2)+0x0000200;
fseek(fp,address,SEEK_SET);
fread((void*)(&tmp),1,sizeof(unsignedshort),fp);
low=((tmp&0xFFF0)>>4);
high=tmp&0x0FFF;
return(clusterId%2==0?
high:
low);
}
其中,fp是用于读取文件系统的文件流,clusterID是当前簇号,返回值是下一个簇号。
函数体的第二句代码,计算出当前簇号对应的地址,用于文件指针的定位。
第三句代码是根据第二句计算得到的地址对文件指针进行定位,定位到当前簇号所对应的信息处。
第四句代码是从文件指针的位置为起始位置读入两个字节的内容(fread会自动对高低字节位进行处理)。
并把这两个字节的信息储存到tmp变量之中。
例如,读取002簇号的下一个簇号,根据公式,计算得到的address是0x00000203,读取到0x00000203和0x00000204两个字节的内容。
我们需要的是0x00000203整个字节的内容和0x00000204的高四位,所以需要跟0xFFF0进行位与运算,并向右移四位,得到下一个簇号。
同样地,读取003簇号的下一个簇号,根据公式,计算得到的address是0x00000204,读取到0x00000204和0x00000205两个字节的内容,我们需要的是0x00000205整个字节的内容和0x00000204第四位的内容,所以需要跟0x0FFF进行位与运算,得到下一个簇号。
所以代码中需要对簇号的奇偶性进行判断,跟根据奇偶性的不同返回不同的值。
在根目录中,保存着根目录下面的文件或文件夹的信息。
每个文件或者文件夹的信息使用32个字节保存。
这些内容的含义如下表:
地址
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
内容
文件名
扩展名
属性
保留位
地址
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
内容
保留位
时间
日期
首簇号
文件大小
这里可以看出点问题,FAT中采用4个字节保存文件的大小,也就是说,文件的大小不能超过232字节,也就是4G;文件名和扩展名采用了固定长度,分别为8和3,太长的文件名在FAT中是不允许的。
其中,文件名的第一个字节还有其他的意义,例如,当文件名的第一个字节为0x00时,表示这一项没有文件;为0xE5时,则表示这个文件已经被删除,在编码时应该忽略这个文件。
文件的属性采用一个字节,也就是8个位来表示文件的6种属性,最高两位是保留位,没有实际意义。
这个字节的定义为:
位
7
6
5
4
3
2
1
0
属性
保留
保留
归档
卷标
系统
隐藏
只读
在列出文件列表时,对各个位进行位与运算以后,对结果进行判断,从而得出相应的属性值,根据上表,可以得出一个函数,参数是表示文件属性的那个字节,返回值是一个以字符方式显示文件属性的一个字符串
char*formatAttribute(charattribute)
{
char*result=(char*)malloc(sizeof(char)*7);
result[0]=((attribute&0x01)==0x01)?
'r':
'-';
result[1]=((attribute&0x02)==0x02)?
'h':
'-';
result[2]=((attribute&0x04)==0x04)?
's':
'-';
result[3]=((attribute&0x08)==0x08)?
'l':
'-';
result[4]=((attribute&0x10)==0x10)?
'd':
'-';
result[5]=((attribute&0x20)==0x20)?
'f':
'-';
result[6]='\0';
returnresult;
}
因为文件属性有6种,需要6个字符分别存放六种属性,第7位则用于储存字符串的结束标记’\0’,确保输出的时候不会产生乱码。
这个函数代码是通过位与运算对文件的各个属性进行判断,并在相应的字符位用字符或者’-’填充,最后把字符串返回。
时间和日期都采用的是压缩储存,储存时间两个字节的各位含义如下:
位
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
时(0-23)
分(0-59)
两秒(0-29)
储存日期两个字节的各位含义如下:
位
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
距离1980年的年数(0-119)
月(1-12)
日(1-31)
注:
日期和时间都需要对高低字节进行交换然后再读取。
实验中使用fread方法会自动进行交换。
根据上面的原理,可以得出这样的一个函数,这个函数以表示日期和时间的两个原始值作为参数输入,返回的是一个格式形如”xxxx-xx-xxxx:
xx:
xx”的字符串,这个函数的代码如下:
char*formatDatetime(shortdate,shorttime)
{
intyear,month,day,hour,minute,second;
char*result=(char*)malloc(sizeof(char)*20);
year=1980+((date&0xE000)>>9);
month=((date&0x01E0)>>5);
day=(date&0x001F);
hour=((time&0xF800)>>11);
minute=((time&0x07E0)>>5);
second=((time&0x001F)<<1);
sprintf(result,"%d-%d%d-%d%d%d%d:
%d%d:
%d%d",
year,month/10,month%10,day/10,day%10,
hour/10,hour%10,minute/10,minute%10,
second/10,second%10);
returnresult;
}
函数的第一句,第二句是为函数运行过程中需要临时储存的数据分配储存空间,随后就是根据上述的原理,进行位与运算和移位操作,得到各项的时间属性。
最后通过sprintf函数对各个属性按照固定的格式输出到字符串之中并返回。
首簇号,指的是这个文件储存在磁盘的第一个簇的簇号,也就是文件存放的具体地址。
同样地,需要对簇号的两个字节进行高低位交换。
最后一个是文件大小,需要对四个字节进行高低字节交换,得到文件大小。
在实验中,会通过read函数每次读入32个字节,即读取FAT表中的每一项,在输出文件信息时予以分析。
另外,每个目录中都包含两个虚拟目录,文件名分别为’.’和’..’,分别表示当前目录和上一级目录。
在目录的处理时需要对其进行判断,避免在进行子目录迭代显示时进入死循环。
综上所述,可以得出从文件段中读出文件信息的源码。
下面的是一些在读取过程中所使用的一些数据结构:
structfile_info{
charfilename[8];
charextname[3];
charattributes;
charreserved[10];
shorttime;
shortdate;
shortpos;
intsize;
};
上面是表示文件信息原始信息的结构体,每个成员变量对应一个属性。
structfile_info_node{
intid;
structfile_info*info;
structfile_info_node*next;
};
这个文件信息链表的结点,相应地,在实验中定义了file_list_new_info方法,将文件信息添加到链表之中。
同时,为了避免递归调用,在实验中,通过一个队列的方式实现列出所有子目录文件的功能。
在下面代码中,content_char是一个指向储存上述文件结构的指针,content->size是file_content中表示文件大小的一个整型变量,用于计算文件夹中最大文件数量,newInfo是一个file_info结构体的指针,用于储存读取到的文件信息原始值。
先把一个文件信息的原始信息从文件内容中提取出来,为此,可以实现内存复制的函数,代码如下:
intcopyTo(void*desc,void*src,intsize)
{
intcounter=0,i;
for(i=0;i *(char*)(((char*)desc)+i)=*(char*)(((char*)src)+i); returncounter; } 通过这个函数把文件信息的原始信息复制到newInfo之中。 上述的文件夹结构不仅仅适用于根目录,所有的目录的遵循这种格式,所以这里可以得出一个初步的结论: 文件夹是一种特殊的文件。 if(newInfo->filename[0]! =(char)0xE5&&newInfo->filename[0]! =(char)0x00){ file_list_new_info(newInfo,&newId,&newInfoNode); if((newInfo->attributes&0x10)==0x10) { if(newInfo->filename[0]=='.')continue; char*buffer=(char*)malloc(sizeof(char)*9); intj; for(j=0;j<8&&newInfo->filename[j]! =(char)0x20;j++) { buffer[j]=newInfo->filename[j]; } buffer[j]='\0'; queue_new_task(buffer,0,0,newInfo->pos); } 这是放在一个for循环中的代码,先通过文件名判断这个文件是否存在,如果存在,则把文件信息添加到程序的文件信息链表之中。 再则判断是否是目录,如果是目录,则把这个目录添加到队列之中。 2.文件储存方式 FAT文件系统对空间的分配和管理是以簇为基本单位的。 所以,一个逻辑上连续的文件可能会被分散地储存在磁盘的各个位置。 操作系统输出文件时,遵循下面的步骤: 1.会先通过文件夹信息找到文件首簇号。 2.根据文件的首簇号,定位到FAT区相应位置;读出下一个簇的簇号。 3.如果下一个簇的簇号不是结束标记(0xFFF),则会根据读出的下一个簇号定位,读出簇里面的内容。 如果读出的是结束标记,则表示文件已经读取完成。 假如一个文件被分散储存在0x012,0x022,0x302三个簇里。 从目录的信息中读出首簇号0x012,读出0x012簇里的内容;然后再通过0x012这个簇号在FAT区中找到下一个簇号0x022,读出0x022的内容;再通过0x022这个簇号找到下一个簇号0x302,读出0x302中的内容;再通过0x302读出下一个簇号的内容,此时,读出的簇号为0xFFF,即表示这个文件已经结束。 本实验中,读取文件的具体实现方法如下: 1.通过一个链表,将这个文件的所有簇号储存起来。 2.遍历储存簇号的链表,逐个逐个簇读取出来并储存到内存之中,返回之。 下面是读取文件的实现所需要的一些数据结构: structint_linked_list{ intdata; structint_linked_list*next; }; structfile_content{ structint_linked_list*curList; void*content; intsize; char*filename; }; 其中,int_linked_list是一个储存整型的链表,file_content是一个用于保存读出文件内容和文件信息的结构体。 遍历链表的过程中,通过一个while循环实现,把读取到簇号添加到链表之中。 具体实现代码如下,tail为保存簇号链表的末尾结点指针,fp是用于读取文件的文件指针,curConnt是一个用于统计文件簇数的变量,便于后续步骤分配内存空间使用,下文同: while((clusterId=getNextClutserId(fp,clusterId))! =0x00000FFF) { curCount++; tail->next=(structint_linked_list*)malloc(sizeof(structint_linked_list)); tail->next->data=clusterId; tail->next->next=NULL; tail=tail->next; } 把簇号读取完毕以后,开始对文件内容进行读取,下面是文件内容读取的具体实现代码,下面代码中的content是一个指向用于存放文件内容的内存空间的指针变量: content->size=curCount*512; content->content=malloc(content->size); structint_linked_list*ptr=head; inti=0,address=0xFFFFFFF; for(ptr=head;ptr! =NULL;ptr=ptr->next,i++) { address=0x00003E00+(512*ptr->data); fseek(fp,address,SEEK_SET); fread((void*)(((char*)(content->content))+(512*i)),512,1,fp); } 在for循环的第一句代码之中,通过簇号对簇所在的地址进行计算,把地址值储存到address变量之中;第二句代码则是通过上一步计算得到的address变量对文件指针进行定位,第三句是通过fread方法把文件内容读入到内存之中。 六、实验结论 1.FAT12文件系统中,把磁盘划分成引导区、FAT区、FAT备份区、根目录区和文件数据区。 2.除了根目录以外,文件系统把每个文件夹都当成是一个特殊的文件进行处理。 3.FAT12文件系统通过簇进行空间的管理和分配。 七、完整实验代码 /* *操作系统课程实验 *FAT12文件系统实验代码 * *虽然这个程序在Windows和Linux环境下都能运行。 *不过,在Windows环境下运行的话,显示文件内容的时候,内容的末尾会有几个奇怪的字符。 *Linux环境下完全没问题 *暂时推测是Windows控制台的原因,Windows控制台会把一些非字符的ASCII显示为奇怪的字符, *例如,0x0A会显示成一个笑脸,Linux的控制台下不会对这些非字符的ASCII进行处理 * *我是今天早上才发现这个问题的阿(╯‵□′)╯︵┻━┻ * *注意: 编译前,需要把IMAGE_FILE那个宏定义改成公邮上面的那个IMG文件; *Linux下打开这个源码文件注释会变成乱码 * */ //这个定义只是为了程序能在VS2013下面正常编译而已 #ifdef_WIN32 #define_CRT_SECURE_NO_WARNINGS #endif #include #include #include #ifdef_WIN32 #include #endif #defineOK0x00000000 #defineMESSAGE_FILE_NOT_FOUND0xE0000404 #defineERROR_MALLOC_FAILED0xF0000001 #defineERROR_IO_ERROR0xF0000002 //↓这里改路径↓ #defineIMAGE_FILE"/home/user/DOS622.IMG" //↑这里改路径↑ /********************这里是结构体的定义**************************/ //这里是文件信息 structfile_info{ charfilename[8]; charextname[3]; charattributes; charreserved[10]; shorttime; shortdate; shortpos; intsize; }; structfile_info_node{ intid; structfile_info*info; structfile_info_node*next; }; //这里是储存文件夹信息 structfolder_info{ char*filename; intfileBeginIndex,fileEndIndex; structfile_info_node*beginFile,*endFile; structfolder_info*next; }; //这里是一个队列,用于迭代方式遍历文件系统的一个中间变量 structqueue_info{ char*filename; intoffset,size,cluster; structqueue_info*next; }; //一个整数链表结构 structint_linked_list{ intdata; structint_linked_list*next; }; //这里是一个文件结构,表示内容,可以读取文件的其中一段,也可以通过簇的方式完整读入整个文件 structfile_content{ structint_linked_list*curList; void*content; intsize; char*filename; }; /********************这里是全局变量的定义**************************/ structfile_info_node*file_list_head,*file_list_tail; structfolder_info*folder_info_head,*folder_info_tail; structqueue_info*queue_head,*queue_tail; chardecToHex[16]={'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'}; /********************这里是函数的定义**************************/ intfile_list_init(); intfile_list_new_info(structfile_info*info,int*id,structfile_info_node**newInfoNode); intfolder_info_init(); intfolder_info_new_info(structfolder_info*info); intqueue_init(); intqueue_new_task(cha
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验四 文件系统 实验报告 实验 报告
![提示](https://static.bdocx.com/images/bang_tan.gif)