第三章分布式数据库的设计.ppt
- 文档编号:2734030
- 上传时间:2022-11-10
- 格式:PPT
- 页数:71
- 大小:885KB
第三章分布式数据库的设计.ppt
《第三章分布式数据库的设计.ppt》由会员分享,可在线阅读,更多相关《第三章分布式数据库的设计.ppt(71页珍藏版)》请在冰豆网上搜索。
第三章分布式数据库的设计第三章分布式数据库的设计分布式数据库系统原理与应用内内容容简简介介p在在系系统统设设计计中中,最最基基本本问问题题就就是是分分布布式式数数据据库库的的分分布布问问题题,即即如如何何对对分分布布式式数数据据库库进进行行逻逻辑辑划划分分和和实实际际物物理理分分配配。
数数据据的的逻逻辑辑划划分分称称数数据据分分片片。
本本章章主主要要针针对对数数据据分分布布进进行行介介绍绍,以以关关系系数数据据库库为例来说明。
为例来说明。
n两种设计策略(两种设计策略(Top-down和和Bottom-up)n分片的定义分片的定义n水平分片水平分片n水平分片的设计水平分片的设计n垂直分片的设计垂直分片的设计n分片的表示方法分片的表示方法n分配设计分配设计分布式数据库系统原理与应用pTop_Down和和Bottom-UP应用用场合合nTop_Down:
适适于于新新设计一一个个数数据据库系系统。
(designedfromscratch)nBottom-UP:
已已存存在在许多多数数据据库系系统,并并将将它它们集集成成为一一个个数数据据库。
典典型型的的数数据据集集成成的的研研究。
究。
本本课程程侧重重top-down设计中中存存在在的的关关键技技术。
两种设计策略两种设计策略分布式数据库系统原理与应用两种设计策略两种设计策略pTop-down设计过程设计过程基于五步递归实现基于五步递归实现:
1.需求分析(需求分析(Requirementanalysis)2.概念设计、视图集成、概念设计、视图集成、E-R表示、转换到关表示、转换到关系模式系模式3.分布设计、数据分片和分配分布设计、数据分片和分配4.物理设计物理设计5.性能调优(性能调优(Tuning)分布式数据库系统原理与应用两种设计策略两种设计策略-Top-down需求分析系统需求说明书调优概念设计外部模式定义全局概念模式视图设计分布设计局部概念模式物理设计局部物理模式分布式数据库系统原理与应用p源于多数据源于多数据库应用用Database1Database2DatabasenTranslator1Translator2TranslatornInS1InS2InSnIntegratorGCS两种设计策略两种设计策略-Bottom-up分布式数据库系统原理与应用分片的定义分片的定义p例例:
某某集集团团公公司司分分地地理理位位置置分分别别在在不不同同城城市市的的总总公公司司和和下下属属两两个个分分公公司司组组成成,彼彼此此之之间间靠靠网网络络相相连连接接,业业务务管管理由分布式数据库系统完成。
其网络结构图如下所示理由分布式数据库系统完成。
其网络结构图如下所示总公司分公司1分公司2网络假设:
人事系统中,有职工关系,定义为:
EMPENO,EName,Salary,DNO。
场地定义:
总公司为场地0,职工关系为EMP0分公司1为场地1,职工关系为EMP1分公司2为场地2,职工关系为EMP2EMP=EMP0+EMP1+EMP2为全局数据分布式数据库系统原理与应用分片的定义分片的定义p数据分布要求数据分布要求方案方案1:
公司总部保留全部数据。
:
公司总部保留全部数据。
方案方案2:
各单位只保留自己的数据。
:
各单位只保留自己的数据。
方案方案3:
公司总部保留全部数据,各分公司只保留自己单位的数据。
:
公司总部保留全部数据,各分公司只保留自己单位的数据。
系统采用以上不同方案,对应需求不同的数据分配方案。
如系统采用以上不同方案,对应需求不同的数据分配方案。
如:
p上面三种方案中,除方案1外,均须进行分片定义。
方案3中,分公司的数据信息除本场地存储外,总部场地也存储一份相同信息,存在在不同场地上互称副本。
总部(EMP)分公司1(无)分公司2(无)总部(EMP0)分公司1(EMP1)分公司2(EMP2)总部(EMP)分公司1(EMP1)分公司2(EMP2)场地场地0场地场地1场地场地2方案方案1方案方案2方案方案3分布式数据库系统原理与应用分片的定义分片的定义p定义定义n片段(片段(Fragment):
):
是分布式数据库中数据的存储单位。
是分布式数据库中数据的存储单位。
n分片(分片(Fragmentation):
对全局数据的划分。
对全局数据的划分。
n片段片段:
划分的结果称为划分的结果称为片段片段。
n分分配配(Allocation):
对对片片段段的的存存储储场场地地的的指指定定,称称为为分分配配。
当当片片段段存存储储在在一一个个以以上上场场地地时时,称称为为数数据据复复制制(Replication)。
如如果果每每个个片片段段只只存存储储在在一一个个场场地地,称称为为数数据分割(据分割(Partition)存储存储。
分布式数据库系统原理与应用分片的定义分片的定义p分片的作用分片的作用n减减少少网网络络传传输输量量。
如如:
采采用用数数据据复复制制,可可就就近近访访问问所所需需信信息息。
需需频频繁访问的信息分片存储在本地场地上。
繁访问的信息分片存储在本地场地上。
n增增大大事事务务处处理理的的局局部部性性。
局局部部场场地地上上所所须须数数据据分分片片分分配配在在各各自自的的场地上,减少数据访问的时间,增强局部事务效率。
场地上,减少数据访问的时间,增强局部事务效率。
n提提高高数数据据的的可可用用性性和和查查询询效效率率。
就就近近访访问问数数据据分分片片或或副副本本,可可提提高高访访问问效效率率。
同同时时当当某某一一场场地地出出故故障障,若若存存在在副副本本,非非故故障障场场地地上上的的数数据据副副本本均均是是可可用用的的。
保保证证了了数数据据的的可可用用性性、数数据据的的完完整整性性和和系系统统的的可靠性。
可靠性。
n使负载均衡。
使负载均衡。
减少数据访问瓶颈,提高整个系统效率。
减少数据访问瓶颈,提高整个系统效率。
分布式数据库系统原理与应用分片的定义分片的定义p分片设计过程分片设计过程分分片片过过程程是是将将全全局局数数据据进进行行逻逻辑辑划划分分和和实实际际物物理理分分配配的的过过程程。
全全局局数数据据由由分分片片模模式式定定义义分分成成各各个个片片段段数数据据,各各个个片片段段数数据据由由分分配配模模式式定定义义存储在各场地上。
分片过程如下图所示。
存储在各场地上。
分片过程如下图所示。
GDBFDBPDB分片模式分配模式GDB:
全局数据库(GlobalDB)FDB:
片段数据库(FragmentationDB)PDB:
物理数据库(PhysicalDB)分布式数据库系统原理与应用分片的定义分片的定义p分片模式:
分片模式:
定义从全局模式到片段模式的映射关系。
定义从全局模式到片段模式的映射关系。
p分配模式:
分配模式:
定义从片段模式到物理模式的映射关系。
定义从片段模式到物理模式的映射关系。
1:
N时为复制;时为复制;1:
1时为分割时为分割。
RR1R2R3R3R2R1R2R3场地1场地2场地3全局关系片段副本分布式数据库系统原理与应用分片的定义分片的定义p分片设计过程分片设计过程说明说明GDB=FDBi表表示示全全局局数数据据库库是是划划分分的的多多个个片片段段数数据据库库的的集合。
集合。
F(GDB)=FDBF-1(FDB)=GDBF():
表表示示分分片片模模式式映映射射函函数数,F-1()表表示示分分片片模模式式的的反反映映射射函函数数。
即即全全局局数数据据库库经经分分片片模模式式映映射射函函数数得得到到全全局局数数据据的的各各个个片片段段,相相反反,所有片段经分片模式反映射函数得到全局数据。
所有片段经分片模式反映射函数得到全局数据。
P(FDB)=PDBP-1(PDB)=FDBP():
表表示示分分配配模模式式映映射射函函数数,P-1()表表示示分分配配模模式式的的反反映映射射函函数数。
即即片片段段数数据据库库经经分分配配模模式式映映射射函函数数得得到到物物理理数数据据库库,相相反反,物物理理数数据库经分配模式反映射函数得到片段数据库。
据库经分配模式反映射函数得到片段数据库。
分布式数据库系统原理与应用分片的定义分片的定义p分片的原则分片的原则在在构构成成分分布布式式数数据据库库系系统统时时,设设计计者者必必须须考考虑虑数数据据如如何何分分布布在在各各个个场场地地上上,即即全全局局数数据据如如何何进进行行逻逻辑辑划划分分和和物物理理分分配配问问题题。
哪哪些些数数据据须须分分布布存存放放、哪哪些些数数据据不不需需要要分分布布存存放放、哪哪些些数数据据需需要要复复制制等等,对对系系统统进进行行全全盘盘考考虑虑,使使系系统统性性能能最最优优。
但无论如何进行分片,必须遵循下面原则:
但无论如何进行分片,必须遵循下面原则:
n完备性:
完备性:
所有全局数据必须映射到某个片段上。
所有全局数据必须映射到某个片段上。
n可重构性:
可重构性:
所有片段必须可以重新构成全局数据。
所有片段必须可以重新构成全局数据。
n不相交性:
不相交性:
划分的各片段所包含的数据不允许相同。
划分的各片段所包含的数据不允许相同。
分布式数据库系统原理与应用分片的定义分片的定义p分片的原则分片的原则n完备性完备性如果全局关系R划分的片段为R1,R2,Rn,则对于R中任意数据项d(dR),一定存在dRi(1in)。
n可重构性可重构性如果全局关系R划分的片段为R1,R2,Rn,则存在关系运算,使得R=R1R2Rn。
n不相交性不相交性如果全局关系R水平划分的片段为R1,R2,Rn,则任意两个不同的片段的交集为空,即RiRj=(ij,1in,1jn)。
分布式数据库系统原理与应用分片的定义分片的定义p分片的种类分片的种类分分布布式式系系统统按按系系统统实实际际需需求求对对全全局局数数据据进进行行分分片和物理分配。
分片的种类有三种。
片和物理分配。
分片的种类有三种。
n水平分片水平分片:
按元组进行划分,由分片条件决定。
:
按元组进行划分,由分片条件决定。
n垂垂直直分分片片:
按按关关系系属属性性划划分分,除除关关键键字字外外,同同一一关关系系的的某某一一属属性性不不允允许许出出现现在在一一个个关关系系的的多多个个分分片中。
片中。
n混合分片混合分片:
即包括水平分片也包括垂直分片。
:
即包括水平分片也包括垂直分片。
属性或元组关系根据需要进行相应的分片分布式数据库系统原理与应用分片的定义分片的定义p分布透明性分布透明性n透透明明性性:
指指对对用用户户和和高高层层系系统统隐隐蔽蔽具具体体实实现现细细节。
节。
n分分布布透透明明性性指指分分片片透透明明性性、分分配配透透明明性性和和局局部部映射透明性。
映射透明性。
n分分片片透透明明性性:
指指用用户户不不必必考考虑虑数数据据属属于于哪哪个个片片段。
段。
n分分配配透透明明性性:
指指用用户户不不必必考考虑虑各各个个片片段段的的存存储储场地。
场地。
n局局部部映映射射透透明明性性:
用用户户不不必必考考虑虑数数据据的的局局部部存存储形式。
储形式。
分布式数据库系统原理与应用水平分片的设计水平分片的设计p水平分片的定义水平分片的定义水水平平分分片片是是将将关关系系的的元元组组集集划划分分成成若若干干不不相相交交的的子子集集。
每每个个水水平平片片段段由由关关系系中中的的某某个个属属性性上上的的条条件件来来定定义义,该该属属性性称称为为分分片片属属性性,该该条条件件称为称为分片条件分片条件。
n定义定义设设有有一一个个关关系系R,R1,R2,Rn为为R的的子子关关系系的的集集合合,如如果果R1,R2,Rn满满足足以以下下条条件件,则则称称其其为为关关系系R的的水水平平分分片片,Ri称称为为R的的一个水平片段。
一个水平片段。
(1)R1,R2,Rn与与R具有相同的关系模式具有相同的关系模式
(2)R1R2Rn=R(3)RiRj=(ij,1in)分布式数据库系统原理与应用水平分片的设计水平分片的设计按下面分片条件进行分段:
按下面分片条件进行分段:
E1:
满足(满足(Dno=201)的所有分组;的所有分组;E2:
满足满足(Dno=202)的所有分组;的所有分组;E3:
满满足足(Dno201ANDDno202)的所有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 分布式 数据库 设计