书签分享收藏举报版权申诉 / 9

立即下载加入VIP,免费下载

当前位置：首页 > 自然科学 > 生物学 > 大数据下高并发的处理详解Word文档格式.docx

大数据下高并发的处理详解Word文档格式.docx

文档编号：22167438
上传时间：2023-02-02
格式：DOCX
页数：9
大小：23.63KB

《大数据下高并发的处理详解Word文档格式.docx》由会员分享，可在线阅读，更多相关《大数据下高并发的处理详解Word文档格式.docx（9页珍藏版）》请在冰豆网上搜索。

大数据下高并发的处理详解Word文档格式.docx

不可重复读ﻫ在第一个事务读取数据后，第二个事务对数据进行了修改,导致第一个事务结束前再访问这个数据的时候，会发现两次读取到的数据是不一样的，因此称为不可重复读。

如何处理并发和同步

ﻫ今天讲的如何处理并发和同同步问题主要是通过锁机制。

ﻫ我们需要明白,锁机制有两个层面。

一种是代码层次上的，如果Ｊava中的同步锁Synchｒonized，另一种是数据库层次上的，比较典型的就是悲观锁（传统的物理锁）和乐观锁

悲观锁

悲观锁，正如其名，它指的是对数据被外界（包括本系统当前的其他事务，以及来自外部系统的事务处理）修改持保守态度。

因此,在这个数据处理过程中,将数据处于锁定状态。

悲观锁的实现,往往依靠数据库提供的锁机制（也只有数据库层提供的锁机制才能真正保证数据访问的排他性,否则,即使在本系统中实现了加锁机制,也无法保证外部系统不会修改数据）。

一个典型的倚赖数据库的悲观锁调用:

sｅｌect*fｒoｍａｃｃｏｕntwｈerｅnamｅ=”Eｒica”ｆorupdａｔe

这条ｓqｌ语句锁定了account表中所有符合检索条件（namｅ=”Ｅricａ”）的记录。

本次事务提交之前（事务提交时会释放事务过程中的锁）,外界无法修改这些记录。

ﻫHibernate的悲观锁,也是基于数据库的锁机制实现。

ﻫ下面的代码实现了对查询记录的加锁:

1ﻫ2

3

4

Strｉng　hqlＳｔr=＂fromTＵseras　useｒwhereusｅr．nａｍe='

Erica＇＂；

ﻫQｕery　ｑuery＝ｓesｓion．cｒeateQuｅry（hｑlStｒ）；

quｅry.setLｏckＭode（＂uｓｅｒ"

，LockMode.UPGRＡDE）;

／／加锁ﻫList　userLiｓt=ｑuerｙ.list（）;

//执行查询,获取数据

观察运行期Hibｅrｎate生成的　SQL语句：

１

ｓelecttuser０＿．idaｓiｄ,　tusｅr0＿．name　ａs　name，tｕser0_.group_id　asgrｏup_iｄ，tｕseｒ0＿.ｕser_typeａｓ　user_ｔype,tusｅｒ0_.ｓexasseｘｆｒomt_usｅrtｕsｅr0_ｗheｒe　（tuser0＿.ｎame＝'

Eriｃａ'

）　fｏｒupdatｅ

这里Hibernaｔｅ通过使用数据库的ｆor　updａte子句实现了悲观锁机制。

Hｉbｅrnａｔe的加锁模式有:

2ﻫ3

5

６ﻫ7

８ﻫ９

10

11ﻫ1２

LoｃkMoｄe.NＯNE：

无锁机制。

ﻫLｏckMoｄe.WRIＴE：

Hibｅrnaｔｅ在　Insｅrt　和Updａte记录的时候会自动获取ﻫLｏckＭodｅ．READ：

Hｉbeｒｎate在读取记录的时候会自动获取。

ﻫ以上这三种锁机制一般由Ｈibｅrnate内部使用，如Hｉbｅrnate为了保证Upｄate过程中对象不会被外界修改，会在　sａｖe方法实现中自动为目标对象加上　WRIＴＥ锁。

LockModｅ．ＵＰGRAＤＥ：

利用数据库的forupdate子句加锁。

LｏckＭｏdｅ.UPGRADE_NOWＡＩT:

Ｏracle的特定实现，利用Oracｌe的　forupdateｎowait　子句实现加锁。

上面这两种锁机制是我们在应用层较为常用的，加锁一般通过以下方法实现：

ﻫCritｅｒia.seｔLockModeﻫＱuｅrｙ.setLockMｏde

Sｅssｉoｎ.ｌｏcｋ

注意,只有在查询开始之前（也就是Hｉbeｒatｅ生成SQL　之前）设定加锁,才会真正通过数据库的锁机制进行加锁处理,否则,数据已经通过不包含forｕpdate子句的SelｅctSQL加载进来，所谓数据库加锁也就无从谈起。

为了更好的理解seｌｅct…ｆｏｒupdate的锁表的过程，本人将要以mｙsｑl为例,进行相应的讲解ﻫ开启两个测试窗口，其中一个窗口Ａ执行命令:

2

3ﻫ4

5ﻫ6

7

8

9ﻫ10

11

mysql>

　beｇin；

QｕeryOＫ，0　rowｓaｆｆｅcｔeｄ（0.００sec）

myｓql>

select*fromeｍpinfofｏｒupdaｔｅ;

+－--－-－--+---－-－-－--+－---－－+--－--－---+

|1233　｜sdfs　　|NUＬＬ　|　NUＬL|ﻫ｜　324234|ｓdf　｜　３８|1２1２1|ﻫ＋－－-－----+----－---－-+----－－+-－－-－----＋

2rｏｗsiｎset（0.０0　sec）

这个时候打开窗口B执行更新或插入操作：

1

myｓqｌ＞updaｔeempｉnfoseｔ　Faｇｅ=12where　Fempｎo=１23３；

这个时候窗口B的更新或插入操作不会执行，会一直在等待，直到A窗口的事务提交了:

ｍysqｌ>

coｍｍiｔ；

ﻫQueryOＫ,0rｏｗsaffected（0.00sec）

B窗口的更新才开始执行。

ﻫ那么forupdate到底锁定表还是行呢?

由于IｎnoDB预设是Ｒｏw-Level　Lock，所以只有「明确」的指定主键，MyＳQL才会执行Rowlｏck（只锁住被选取的资料例）　，否则MｙSQL将会执行Tablｅ　Ｌｏck（将整个资料表单给锁住）。

例1：

（明确指定主键，并且有此笔资料，rｏwlｏｃk）

１ﻫ2ﻫ3

SEＬECT*ＦROＭ　produｃts　WHERＥid=＇3'

FORＵPＤAＴＥ;

ﻫ

SELECT*　ＦRＯMproduｃｔsＷＨＥＲEid='

3＇and　type=１FORUPDAＴＥ;

例2:

（明确指定主键,若查无此笔资料，无ｌoｃk）

SEＬＥCT　*FROMpｒｏdｕctsWＨERＥ　id='

-1'

FOＲUPDATE;

例３:

　（无主键,tablｅｌｏｃk）

ＳELEＣT　＊ＦROMproducｔsWＨERＥname='

Mouse'

ＦOR　UPＤATE;

例４:

（主键不明确,tabｌｅ　lock）

SEＬEＣT　*FROM　pｒoduｃtsWHEＲEｉd<

＞'

3'

　FORUＰDAＴE；

例5：

（主键不明确，tableloｃk）

SELECT*FRＯMprｏductsWHＥREidLIKE　'

3＇　FＯRUPＤATE；

注１:

　FＯRUＰDＡＴE仅适用于ＩnnoDＢ,且必须在交易区块（BEＧＩN/ＣOMMIT）中才能生效。

ﻫ注2:

要测试锁定的状况，可以利用MｙＳQＬ的ＣｏmｍandMode　,开二个视窗来做测试。

在MySqｌ5.0中测试确实是这样的

另外：

ＭｙＡｓｉm只支持表级锁,InnerDB支持行级锁添加了（行级锁/表级锁）锁的数据不能被其它事务再锁定,也不被其它事务修改（修改、删除）。

是表级锁时,不管是否查询到记录,都会锁定表。

到这里,悲观锁机制你应该了解一些了吧~

乐观锁

相对悲观锁而言，乐观锁机制采取了更加宽松的加锁机制。

悲观锁大多数情况下依靠数据库的锁机制实现，以保证操作最大程度的独占性。

但随之而来的就是数据库性能的大量开销，特别是对长事务而言,这样的开销往往无法承受。

如一个金融系统，当某个操作员读取用户的数据，并在读出的用户数据的基础上进行修改时（如更改用户帐户余额），如果采用悲观锁机制,也就意味着整个操作过　程中（从操作员读出数据、开始修改直至提交修改结果的全过程,甚至还包括操作员中途去煮咖啡的时间）,数据库记录始终处于加锁状态，可以想见,如果面对几百上千个并发,这样的情况将导致怎样的后果。

乐观锁机制在一定程度上解决了这个问题。

乐观锁,大多是基于数据版本Verｓｉoｎ）记录机制实现。

何谓数据版本?

即为数据增加一个版本标识,在基于数据库表的版本解决方案中,一般是通过为数据库表增加一个“veｒsion”字段来　实现。

读取出数据时，将此版本号一同读出，之后更新时,对此版本号加一。

此时，将提交数据的版本数据与数据库表对应记录的当前版本信息进行比对,如果提交的数据版本号大于数据库表当前版本号，则予以更新,否则认为是过期数据。

ﻫ假如数据库中账户余额为１0０,versｉoｎ为１,操作员A读出余额,并修改为5０，而在Ａ操作的同时操作员B也读出了账户余额１00，并修改为80,Ａ完成了操作录入系统,vｅrsion从1加上１变为2,余额修改为５0,操作员B也提交了记录，vｅrsion也变为2，余额则是8０，但是此时数据库发现，Ｂ提交的verｓion为2，当前版本也是２，不满足“提交版本必须大于记录当前版本才能执行更新“　的乐观锁策略。

因此，操作员　Ｂ的提交被驳回。

　这样，就避免了操作员B用基于veｒsion＝１的旧数据修改的结果覆盖操作员Ａ的操作结果的可能。

从上面的例子可以看出,乐观锁机制避免了长事务中的数据库加锁开销（操作员　A和操作员B操作过程中，都没有对数据库数据加锁）,大大提升了大并发量下的系统整体性能表现。

　需要注意的是,乐观锁机制往往基于系统中的数据存储逻辑，因此也具备一定的局　限性，如在上例中，由于乐观锁机制是在我们的系统中实现,来自外部系统的用户余额更新操作不受我们系统的控制,因此可能会造成脏数据被更新到数据库中。

在系统设计阶段,我们应该充分考虑到这些情况出现的可能性,并进行相应调整（如将乐观锁策略在数据库存储过程中实现,对外只开放基于此存储过程的数据更新途径,而不是将数据库表直接对外公开）。

Ｈｉｂerｎate在其数据访问引擎中内置了乐观锁实现。

如果不用考虑外部系统对数据库的更新操作，利用Hiberｎatｅ　提供的透明化乐观锁实现，将大大提升我们的生产力。

Hibernate使用乐观锁我只说一下注解的方式：

在Entiｔy中加入以下代码

1ﻫ２

4ﻫ５ﻫ6

7ﻫ8ﻫ9ﻫ10

pｒivaｔeintveｒｓioｎ;

＠Verｓion

@Ｃolumn（naｍe　=　"

versｉｏn"

lengｔh=11）ﻫpublｉc　iｎtgｅｔVerｓion（）{

retuｒnｖeｒsｉｏn;

｝ﻫpubｌｉcvoidsetVeｒsion（inｔversioｎ）{ﻫ　ｔhiｓ．versiｏn＝ｖｅｒsion；

｝

这样就可以轻松实现hiｂeｒnaｔe乐观锁方式。

常见并发同步案例分析

ﻫ案例一:

订票系统案例ﻫ某航班只有一张机票,假定有1w个人打开你的网站来订票,问你如何解决并发问题（可扩展到任何高并发网站要考虑的并发读写问题）ﻫ问题,1w个人来访问，票没出去前要保证大家都能看到有票,不可能一个人在看到票的时候别人就不能看了。

到底谁能抢到,那得看这个人的“运气”（网络快慢等）

其次考虑的问题，并发，1ｗ个人同时点击购买,到底谁能成交?

总共只有一张票。

ﻫ首先我们容易想到和并发相关的几个方案：

ﻫ锁同步同步更多指的是应用程序的层面，多个线程进来,只能一个一个的访问，java中指的是ｓｙnｃrinizｅd关键字。

锁也有2个层面,一个是jaｖa中谈到的对象锁，用于线程同步；

另外一个层面是数据库的锁;

如果是分布式的系统，显然只能利用数据库端的锁来实现。

假定我们采用了同步机制或者数据库物理锁机制，如何保证１ｗ个人还能同时看到有票，显然会牺牲性能,在高并发网站中是不可取的。

使用hibｅrnaｔe后我们提出了另外一个概念:

乐观锁、悲观锁（即传统的物理锁）;

采用乐观锁即可解决此问题。

乐观锁意思是不锁定表的情况下,利用业务的控制来解决并发问题,这样即保证数据的并发可读性又保证保存数据的排他性，保证性能的同时解决了并发带来的脏数据问题。

ﻫhｉbｅrnatｅ中如何实现乐观锁:

前提：

在现有表当中增加一个冗余字段,ｖerｓiｏn版本号，lｏnｇ类型

原理：

ﻫ1）只有当前版本号》=数据库表版本号,才能提交ﻫ２）提交成功后,版本号ｖeｒsｉoｎ＋+

案例一：

案例二、股票交易系统、银行系统,大数据量你是如何考虑的ﻫ首先,股票交易系统的行情表,每几秒钟就有一个行情记录产生，一天下来就有（假定行情3秒一个）股票数量×

20×

６０＊6条记录,一月下来这个表记录数量多大？

ｏraｃle中一张表的记录数超过１００ｗ后　查询性能就很差了，如何保证系统性能?

ﻫ再比如，中国移动有上亿的用户量，表如何设计？

把所有用于存在于一个表么?

ﻫ所以,大数量的系统,必须考虑表拆分－（表名字不一样，但是结构完全一样），通用的几种方式：

（视情况而定）

1）按业务分，比如手机号的表，我们可以考虑13０开头的作为一个表，131开头的另外一张表以此类推

2）利用oraｃle的表拆分机制做分表

3）如果是交易系统，我们可以考虑按时间轴拆分，当日数据一个表,历史数据弄到其它表。

这里历史数据的报表和查询不会影响当日交易。

ﻫ此外,我们还得考虑缓存

这里的缓存,指的不仅仅是hibｅrnａte，hiｂernａｔｅ本身提供了一级二级缓存。

这里的缓存独立于应用，依然是内存的读取,假如我们能减少数据库频繁的访问,那对系统肯定大大有利的。

比如一个电子商务系统的商品搜索,如果某个关键字的商品经常被搜,那就可以考虑这部分商品列表存放到缓存（内存中去），这样不用每次访问数据库,性能大大增加。

简单的缓存大家可以理解为自己做一个hashmap,把常访问的数据做一个key，ｖalｕｅ是第一次从数据库搜索出来的值,下次访问就可以从ｍap里读取,而不读数据库;

专业些的目前有独立的缓存框架比如ｍeｍcached等，可独立部署成一个缓存服务器。

常见的提高高并发下访问的效率的手段

ﻫ首先要了解高并发的的瓶颈在哪里?

ﻫ１、可能是服务器网络带宽不够

2.可能weｂ线程连接数不够ﻫ3.可能数据库连接查询上不去。

根据不同的情况，解决思路也不同。

１、像第一种情况可以增加网络带宽，DＮS域名解析分发多台服务器。

ﻫ2、负载均衡,前置代理服务器nginx、ａpache等等

３、数据库查询优化，读写分离，分表等等

最后复制一些在高并发下面需要常常需要处理的内容:

尽量使用缓存，包括用户缓存，信息缓存等，多花点内存来做缓存,可以大量减少与数据库的交互,提高性能。

ﻫ用ｊprofｉler等工具找出性能瓶颈，减少额外的开销。

ﻫ优化数据库查询语句,减少直接使用hibernate等工具的直接生成语句（仅耗时较长的查询做优化）。

ﻫ优化数据库结构，多做索引,提高查询效率。

ﻫ统计的功能尽量做缓存，或按每天一统计或定时统计相关报表,避免需要时进行统计的功能。

能使用静态页面的地方尽量使用，减少容器的解析（尽量将动态内容生成静态html来显示）。

ﻫ解决以上问题后,使用服务器集群来解决单台的瓶颈问题。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 数据并发处理详解

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：大数据下高并发的处理详解Word文档格式.docx
链接地址：https://www.bdocx.com/doc/22167438.html

大数据下高并发的处理详解Word文档格式.docx

热门标签