数据存储方案.docx
- 文档编号:2299356
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:9
- 大小:23.96KB
数据存储方案.docx
《数据存储方案.docx》由会员分享,可在线阅读,更多相关《数据存储方案.docx(9页珍藏版)》请在冰豆网上搜索。
数据存储方案
引言
文献是由RickCattell撰写的论文,论文讨论了可扩展的结构化数据的、非结构化的(包括基于键值对的、基于文档的和面向列的)数据存储方案(注:
NOSQL是支撑大数据应用的关键所在。
事实上,将NOSQL翻译为“非结构化”不甚准确,因为NOSQL更为常见的解释是:
NotOnlySQL(不仅仅是结构化),换句话说,NOSQL并不是站在结构化SQL的对立面,而是既可包括结构化数据,也可包括非结构化数据)。
论文信息
ScalableSQLandNoSQLDataStores
RickCattellOriginallypublishedin2010,lastrevisedDecember2011
摘要
ABSTRACT
Inthispaper,weexamineanumberofSQLandso-called“NoSQL”datastoresdesignedtoscalesimpleOLTP-styleapplicationloadsovermanyservers.
OriginallymotivatedbyWeb2.0applications,thesesystemsaredesignedtoscaletothousandsormillionsofusersdoingupdatesaswellasreads,incontrasttotraditionalDBMSsanddatawarehouses.
Wecontrastthenewsystemsontheirdatamodel,consistencymechanisms,storagemechanisms,durabilityguarantees,availability,querysupport,andotherdimensions.Thesesystemstypicallysacrificesomeofthesedimensions,e.g.database-widetransactionconsistency,inordertoachieveothers,e.g.higheravailabilityandscalability.
在这篇文献中,我们验证了许多SQL和所谓的‘NoSQL’数据存储(它设计于支持简单的OLTP风格的应用,能够用于扩展在很多服务器上)
它最先由Web2.0应用引起,与传统的数据库管理系统和数据仓库对比,这些系统设计为可扩展到数以千计或数以百万计的用户做更新,同时读取。
我们对比了新系统上的数据模型,一致性机制,存储机制,持久性保证,可用性,支持的查询以及其它属性,这些系统典型的牺牲(为了实现其它属性而去掉)了一些属性。
如数据库常有的事务一致性,牺牲了这个是为了其它的属性,如高可用,可扩展。
Note:
Bibliographicreferencesforsystemsarenotlisted,butURLsformoreinformationcanbefoundintheSystemReferencestableattheendofthispaper.
注:
参考书没列出来(翻译省)
Caveat:
Statementsinthispaperarebasedonsourcesanddocumentationthatmaynotbereliable,andthesystemsdescribedare“movingtargets,”sosomestatementsmaybeincorrect.Verifythroughothersourcesbeforedependingoninformationhere.Nevertheless,wehopethiscomprehensivesurveyisuseful!
Checkforfuturecorrectionsontheauthor’swebsite
警告:
一些提及的书可能不可用。
尽管如此,我们还是希望这篇综合的文献对大家有帮助,我们网站:
Disclosure:
TheauthorisonthetechnicaladvisoryboardofSchoonerTechnologiesandhasaconsultingbusinessadvisingonscalabledatabases.
透漏:
作者是可扩展数据库商业顾问。
1.OVERVIEW
Inrecentyearsanumberofnewsystemshavebeendesignedtoprovidegoodhorizontalscalabilityforsimpleread/writedatabaseoperationsdistributedovermanyservers.Incontrast,traditionaldatabaseproductshavecomparativelylittleornoabilitytoscalehorizontallyontheseapplications.Thispaperexaminesandcomparesthevariousnewsystems.
近年,很多系统的设计提供良好水平扩展,支持在多服务器上分布式读写。
相比较传统的系统,一般为无扩展,规模小。
本篇文献研究与对比很多不同的新系统(Yol注,其实就是各种NOSQL设计进行对比,比如Mongo与Hbase分类,简介)
Manyofthenewsystemsarereferredtoas“NoSQL”datastores.ThedefinitionofNoSQL,whichstandsfor“NotOnlySQL”or“NotRelational”,isnotentirelyagreedupon.Forthepurposesofthispaper,NoSQLsystemsgenerallyhavesixkeyfeatures:
NoSQL等于NotOnlySQL,或者NotRelational(弱关系型数据库,与mysql比较起来),NoSQL的systems一般有6重要特征:
1.theabilitytohorizontallyscale“simpleoperation”throughputovermanyservers,
通过简单操作在多服务器上水平扩展的能力
2.theabilitytoreplicateandtodistribute(partition)dataovermanyservers,
复制和分发(分区)数据在多个服务器的能力
3.asimplecalllevelinterfaceorprotocol(incontrasttoaSQLbinding),
一种简单的调用级接口或协议(相比较于SQL绑定)
4.aweakerconcurrency(并发性,并行性)modelthantheACIDtransactionsofmostrelational(SQL)databasesystems,
对比大多数关系数据库(SQL)数据库管理系统ACID事务,它是一种较弱的并发模型
5.efficientuseofdistributedindexesandRAMfordatastorage,
有效地利用分布式的索引和RAM的数据存储
6.andtheabilitytodynamicallyaddnewattributestodatarecords.
动态地在数据记录中添加新的属性
Thesystemsdifferinotherways,andinthispaperwecontrastthosedifferences.Theyrangeinfunctionalityfromthesimplestdistributedhashing,assupportedbythepopularmemcachedopensourcecache,tohighlyscalablepartitionedtables,assupportedbyGoogle’sBigTable[1].Infact,BigTable,memcached,andAmazon’sDynamo[2]provideda“proofofconcept”thatinspiredmanyofthedatastoreswedescribehere:
这些系统在其他方面也有不同,在本文中我们对比了这些差异。
它们的范围从简单的分布式哈希算法,如流行的开源memcached缓存,到高度可扩展的已分区表,如谷歌的BigTable[1]。
事实上,BigTable,memcached和亚马逊的Dynamo[2]提供”概念证明”,催动了许多我们在这儿描述的数据存储:
Memcacheddemonstrated(论证,证明)thatin-memoryindexescanbehighlyscalable,distributingandreplicatingobjectsovermultiplenodes.
Memcached表明内存中索引可以是高度可伸缩、分布式和在多个节点上复制对象。
Dynamopioneeredtheideaofeventualconsistencyasawaytoachievehigheravailabilityandscalability:
datafetchedarenotguaranteedtobeup-to-date,butupdatesareguaranteedtobepropagatedtoallnodeseventually.
Dynamo的先驱想了一个idea,以实现更高的可用性和可伸缩性的最终一致性,那就是:
获取数据不能保证是最新的,但保证这个最新能最终传播到所有节点。
BigTabledemonstratedthatpersistentrecordstoragecouldbescaledtothousandsofnodes,afeatthatmostoftheothersystemsaspireto.
BigTable表明,持续的记录存储可以缩放到数千个节点,是其他系统最向往的。
AkeyfeatureofNoSQLsystemsis“sharednothing”horizontalscaling–replicatingandpartitioningdataovermanyservers.Thisallowsthemtosupportala
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 存储 方案
![提示](https://static.bdocx.com/images/bang_tan.gif)