实验四 文件系统 实验报告文档格式.docx
- 文档编号:21745947
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:29
- 大小:27.34KB
实验四 文件系统 实验报告文档格式.docx
《实验四 文件系统 实验报告文档格式.docx》由会员分享,可在线阅读,更多相关《实验四 文件系统 实验报告文档格式.docx(29页珍藏版)》请在冰豆网上搜索。
其中,引导区中储存着一些基本的信息。
例如,0x0000000B和0x0000000C两个字节保存着每个扇区的大小,0x0000000D保存着每个簇占用多少个扇区。
FAT区中储存着簇号。
在0x00000200开始的三个字节,分别储存设备类型标记(0xF0为软盘);
第二个第三个字节均为0xFF,是FAT标识符。
在FAT12文件系统中,每个簇占用12位,即1.5个字节。
簇号与地址的对应关系如下表:
地址偏移
000
001
002
003
004
005
簇序号
一个簇号跨越两个字节,每次读取簇号时读取两个字节,然后对读出的两个字节进行位运算处理,得到下一簇的簇序号。
注意,这里同样需要对高低位进行处理,即使用位计算的方式提取相应的簇号信息。
根据上述的原理,可以得出一个函数,以一个簇号为参数,返回值为文件下一个簇号。
代码如下:
intgetNextClutserId(FILE*fp,shortclusterId)
{
unsignedshorttmp,low=0,high=0;
;
intaddress=(clusterId*3/2)+0x0000200;
fseek(fp,address,SEEK_SET);
fread((void*)(&
tmp),1,sizeof(unsignedshort),fp);
low=((tmp&
0xFFF0)>
>
4);
high=tmp&
0x0FFF;
return(clusterId%2==0?
high:
low);
}
其中,fp是用于读取文件系统的文件流,clusterID是当前簇号,返回值是下一个簇号。
函数体的第二句代码,计算出当前簇号对应的地址,用于文件指针的定位。
第三句代码是根据第二句计算得到的地址对文件指针进行定位,定位到当前簇号所对应的信息处。
第四句代码是从文件指针的位置为起始位置读入两个字节的内容(fread会自动对高低字节位进行处理)。
并把这两个字节的信息储存到tmp变量之中。
例如,读取002簇号的下一个簇号,根据公式,计算得到的address是0x00000203,读取到0x00000203和0x00000204两个字节的内容。
我们需要的是0x00000203整个字节的内容和0x00000204的高四位,所以需要跟0xFFF0进行位与运算,并向右移四位,得到下一个簇号。
同样地,读取003簇号的下一个簇号,根据公式,计算得到的address是0x00000204,读取到0x00000204和0x00000205两个字节的内容,我们需要的是0x00000205整个字节的内容和0x00000204第四位的内容,所以需要跟0x0FFF进行位与运算,得到下一个簇号。
所以代码中需要对簇号的奇偶性进行判断,跟根据奇偶性的不同返回不同的值。
在根目录中,保存着根目录下面的文件或文件夹的信息。
每个文件或者文件夹的信息使用32个字节保存。
这些内容的含义如下表:
地址
2
3
4
5
6
7
8
A
B
C
D
E
F
内容
文件名
扩展名
属性
保留位
时间
日期
首簇号
文件大小
这里可以看出点问题,FAT中采用4个字节保存文件的大小,也就是说,文件的大小不能超过232字节,也就是4G;
文件名和扩展名采用了固定长度,分别为8和3,太长的文件名在FAT中是不允许的。
其中,文件名的第一个字节还有其他的意义,例如,当文件名的第一个字节为0x00时,表示这一项没有文件;
为0xE5时,则表示这个文件已经被删除,在编码时应该忽略这个文件。
文件的属性采用一个字节,也就是8个位来表示文件的6种属性,最高两位是保留位,没有实际意义。
这个字节的定义为:
位
保留
归档
卷标
系统
隐藏
只读
在列出文件列表时,对各个位进行位与运算以后,对结果进行判断,从而得出相应的属性值,根据上表,可以得出一个函数,参数是表示文件属性的那个字节,返回值是一个以字符方式显示文件属性的一个字符串
char*formatAttribute(charattribute)
char*result=(char*)malloc(sizeof(char)*7);
result[0]=((attribute&
0x01)==0x01)?
'
r'
:
-'
result[1]=((attribute&
0x02)==0x02)?
h'
result[2]=((attribute&
0x04)==0x04)?
s'
result[3]=((attribute&
0x08)==0x08)?
l'
result[4]=((attribute&
0x10)==0x10)?
d'
result[5]=((attribute&
0x20)==0x20)?
f'
result[6]='
\0'
returnresult;
因为文件属性有6种,需要6个字符分别存放六种属性,第7位则用于储存字符串的结束标记’\0’,确保输出的时候不会产生乱码。
这个函数代码是通过位与运算对文件的各个属性进行判断,并在相应的字符位用字符或者’-’填充,最后把字符串返回。
时间和日期都采用的是压缩储存,储存时间两个字节的各位含义如下:
15
14
13
11
时(0-23)
分(0-59)
两秒(0-29)
储存日期两个字节的各位含义如下:
距离1980年的年数(0-119)
月(1-12)
日(1-31)
注:
日期和时间都需要对高低字节进行交换然后再读取。
实验中使用fread方法会自动进行交换。
根据上面的原理,可以得出这样的一个函数,这个函数以表示日期和时间的两个原始值作为参数输入,返回的是一个格式形如”xxxx-xx-xxxx:
xx:
xx”的字符串,这个函数的代码如下:
char*formatDatetime(shortdate,shorttime)
intyear,month,day,hour,minute,second;
char*result=(char*)malloc(sizeof(char)*20);
year=1980+((date&
0xE000)>
9);
month=((date&
0x01E0)>
5);
day=(date&
0x001F);
hour=((time&
0xF800)>
11);
minute=((time&
0x07E0)>
second=((time&
0x001F)<
<
1);
sprintf(result,"
%d-%d%d-%d%d%d%d:
%d%d:
%d%d"
year,month/10,month%10,day/10,day%10,
hour/10,hour%10,minute/10,minute%10,
second/10,second%10);
函数的第一句,第二句是为函数运行过程中需要临时储存的数据分配储存空间,随后就是根据上述的原理,进行位与运算和移位操作,得到各项的时间属性。
最后通过sprintf函数对各个属性按照固定的格式输出到字符串之中并返回。
首簇号,指的是这个文件储存在磁盘的第一个簇的簇号,也就是文件存放的具体地址。
同样地,需要对簇号的两个字节进行高低位交换。
最后一个是文件大小,需要对四个字节进行高低字节交换,得到文件大小。
在实验中,会通过read函数每次读入32个字节,即读取FAT表中的每一项,在输出文件信息时予以分析。
另外,每个目录中都包含两个虚拟目录,文件名分别为’.’和’..’,分别表示当前目录和上一级目录。
在目录的处理时需要对其进行判断,避免在进行子目录迭代显示时进入死循环。
综上所述,可以得出从文件段中读出文件信息的源码。
下面的是一些在读取过程中所使用的一些数据结构:
structfile_info{
charfilename[8];
charextname[3];
charattributes;
charreserved[10];
shorttime;
shortdate;
shortpos;
intsize;
};
上面是表示文件信息原始信息的结构体,每个成员变量对应一个属性。
structfile_info_node{
intid;
structfile_info*info;
structfile_info_node*next;
这个文件信息链表的结点,相应地,在实验中定义了file_list_new_info方法,将文件信息添加到链表之中。
同时,为了避免递归调用,在实验中,通过一个队列的方式实现列出所有子目录文件的功能。
在下面代码中,content_char是一个指向储存上述文件结构的指针,content->
size是file_content中表示文件大小的一个整型变量,用于计算文件夹中最大文件数量,newInfo是一个file_info结构体的指针,用于储存读取到的文件信息原始值。
先把一个文件信息的原始信息从文件内容中提取出来,为此,可以实现内存复制的函数,代码如下:
intcopyTo(void*desc,void*src,intsize)
intcounter=0,i;
for(i=0;
i<
size;
i++,counter++)
*(char*)(((char*)desc)+i)=*(char*)(((char*)src)+i);
returncounter;
通过这个函数把文件信息的原始信息复制到newInfo之中。
上述的文件夹结构不仅仅适用于根目录,所有的目录的遵循这种格式,所以这里可以得出一个初步的结论:
文件夹是一种特殊的文件。
if(newInfo->
filename[0]!
=(char)0xE5&
&
newInfo->
=(char)0x00){
file_list_new_info(newInfo,&
newId,&
newInfoNode);
if((newInfo->
attributes&
0x10)==0x10)
if(newInfo->
filename[0]=='
.'
)continue;
char*buffer=(char*)malloc(sizeof(char)*9);
intj;
for(j=0;
j<
8&
filename[j]!
=(char)0x20;
j++)
{
buffer[j]=newInfo->
filename[j];
}
buffer[j]='
queue_new_task(buffer,0,0,newInfo->
pos);
}
这是放在一个for循环中的代码,先通过文件名判断这个文件是否存在,如果存在,则把文件信息添加到程序的文件信息链表之中。
再则判断是否是目录,如果是目录,则把这个目录添加到队列之中。
2.文件储存方式
FAT文件系统对空间的分配和管理是以簇为基本单位的。
所以,一个逻辑上连续的文件可能会被分散地储存在磁盘的各个位置。
操作系统输出文件时,遵循下面的步骤:
1.会先通过文件夹信息找到文件首簇号。
2.根据文件的首簇号,定位到FAT区相应位置;
读出下一个簇的簇号。
3.如果下一个簇的簇号不是结束标记(0xFFF),则会根据读出的下一个簇号定位,读出簇里面的内容。
如果读出的是结束标记,则表示文件已经读取完成。
假如一个文件被分散储存在0x012,0x022,0x302三个簇里。
从目录的信息中读出首簇号0x012,读出0x012簇里的内容;
然后再通过0x012这个簇号在FAT区中找到下一个簇号0x022,读出0x022的内容;
再通过0x022这个簇号找到下一个簇号0x302,读出0x302中的内容;
再通过0x302读出下一个簇号的内容,此时,读出的簇号为0xFFF,即表示这个文件已经结束。
本实验中,读取文件的具体实现方法如下:
1.通过一个链表,将这个文件的所有簇号储存起来。
2.遍历储存簇号的链表,逐个逐个簇读取出来并储存到内存之中,返回之。
下面是读取文件的实现所需要的一些数据结构:
structint_linked_list{
intdata;
structint_linked_list*next;
structfile_content{
structint_linked_list*curList;
void*content;
intsize;
char*filename;
其中,int_linked_list是一个储存整型的链表,file_content是一个用于保存读出文件内容和文件信息的结构体。
遍历链表的过程中,通过一个while循环实现,把读取到簇号添加到链表之中。
具体实现代码如下,tail为保存簇号链表的末尾结点指针,fp是用于读取文件的文件指针,curConnt是一个用于统计文件簇数的变量,便于后续步骤分配内存空间使用,下文同:
while((clusterId=getNextClutserId(fp,clusterId))!
=0x00000FFF)
{
curCount++;
tail->
next=(structint_linked_list*)malloc(sizeof(structint_linked_list));
next->
data=clusterId;
next=NULL;
tail=tail->
next;
把簇号读取完毕以后,开始对文件内容进行读取,下面是文件内容读取的具体实现代码,下面代码中的content是一个指向用于存放文件内容的内存空间的指针变量:
content->
size=curCount*512;
content=malloc(content->
size);
structint_linked_list*ptr=head;
inti=0,address=0xFFFFFFF;
for(ptr=head;
ptr!
=NULL;
ptr=ptr->
next,i++)
address=0x00003E00+(512*ptr->
data);
fseek(fp,address,SEEK_SET);
fread((void*)(((char*)(content->
content))+(512*i)),512,1,fp);
在for循环的第一句代码之中,通过簇号对簇所在的地址进行计算,把地址值储存到address变量之中;
第二句代码则是通过上一步计算得到的address变量对文件指针进行定位,第三句是通过fread方法把文件内容读入到内存之中。
六、实验结论
1.FAT12文件系统中,把磁盘划分成引导区、FAT区、FAT备份区、根目录区和文件数据区。
2.除了根目录以外,文件系统把每个文件夹都当成是一个特殊的文件进行处理。
3.FAT12文件系统通过簇进行空间的管理和分配。
七、完整实验代码
/*
*操作系统课程实验
*FAT12文件系统实验代码
*
*虽然这个程序在Windows和Linux环境下都能运行。
*不过,在Windows环境下运行的话,显示文件内容的时候,内容的末尾会有几个奇怪的字符。
*Linux环境下完全没问题
*暂时推测是Windows控制台的原因,Windows控制台会把一些非字符的ASCII显示为奇怪的字符,
*例如,0x0A会显示成一个笑脸,Linux的控制台下不会对这些非字符的ASCII进行处理
*我是今天早上才发现这个问题的阿(╯‵□′)╯︵┻━┻
*注意:
编译前,需要把IMAGE_FILE那个宏定义改成公邮上面的那个IMG文件;
*Linux下打开这个源码文件注释会变成乱码
*/
//这个定义只是为了程序能在VS2013下面正常编译而已
#ifdef_WIN32
#define_CRT_SECURE_NO_WARNINGS
#endif
#include<
stdio.h>
stdlib.h>
string.h>
windows.h>
#defineOK0x00000000
#defineMESSAGE_FILE_NOT_FOUND0xE0000404
#defineERROR_MALLOC_FAILED0xF0000001
#defineERROR_IO_ERROR0xF0000002
//↓这里改路径↓
#defineIMAGE_FILE"
/home/user/DOS622.IMG"
//↑这里改路径↑
/********************这里是结构体的定义**************************/
//这里是文件信息
//这里是储存文件夹信息
structfolder_info{
char*filename;
intfileBeginIndex,fileEndIndex;
structfile_info_node*beginFile,*endFile;
structfolder_info*next;
//这里是一个队列,用于迭代方式遍历文件系统的一个中间变量
structqueue_info{
intoffset,size,cluster;
structqueue_info*next;
//一个整数链表结构
intdata;
structint_linked_list*next;
//这里是一个文件结构,表示内容,可以读取文件的其中一段,也可以通过簇的方式完整读入整个文件
structint_linked_list*curList;
void*content;
/********************这里是全局变量的定义**************************/
structfile_info_node*file_list_head,*file_list_tail;
structfolder_info*folder_info_head,*folder_info_tail;
structqueue_info*queue_head,*queue_tail;
chardecToHex[16]={'
0'
'
1'
2'
3'
4'
5'
6'
7'
8'
9'
A'
B'
C'
D'
E'
F'
};
/********************这里是函数的定义**************************/
intfile_list_init();
intfile_list_new_info(structfile_info*info,int*id,structfile_info_node**newInfoNode);
intfolder_info_init();
intfolder_info_new_info(structfolder_info*info);
intqueue_init();
intqueue_new_task(cha
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验四 文件系统 实验报告 实验 报告
![提示](https://static.bdocx.com/images/bang_tan.gif)