大数据下高并发的处理详解Word文档格式.docx
- 文档编号:22167438
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:9
- 大小:23.63KB
大数据下高并发的处理详解Word文档格式.docx
《大数据下高并发的处理详解Word文档格式.docx》由会员分享,可在线阅读,更多相关《大数据下高并发的处理详解Word文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
不可重复读ﻫ在第一个事务读取数据后,第二个事务对数据进行了修改,导致第一个事务结束前再访问这个数据的时候,会发现两次读取到的数据是不一样的,因此称为不可重复读。
如何处理并发和同步
ﻫ今天讲的如何处理并发和同同步问题主要是通过锁机制。
ﻫ我们需要明白,锁机制有两个层面。
一种是代码层次上的,如果Java中的同步锁Synchronized,另一种是数据库层次上的,比较典型的就是悲观锁(传统的物理锁)和乐观锁
悲观锁
悲观锁,正如其名,它指的是对数据被外界(包括本系统当前的其他事务,以及来自外部系统的事务处理)修改持保守态度。
因此,在这个数据处理过程中,将数据处于锁定状态。
悲观锁的实现,往往依靠数据库提供的锁机制(也只有数据库层提供的锁机制才能真正保证数据访问的排他性,否则,即使在本系统中实现了加锁机制,也无法保证外部系统不会修改数据)。
一个典型的倚赖数据库的悲观锁调用:
select*fromaccountwherename=”Erica”forupdate
这条sql语句锁定了account表中所有符合检索条件(name=”Erica”)的记录。
本次事务提交之前(事务提交时会释放事务过程中的锁),外界无法修改这些记录。
ﻫHibernate的悲观锁,也是基于数据库的锁机制实现。
ﻫ下面的代码实现了对查询记录的加锁:
1ﻫ2
3
4
String hqlStr="fromTUseras userwhereuser.name='
Erica'";
ﻫQuery query=session.createQuery(hqlStr);
query.setLockMode("user"
,LockMode.UPGRADE);
//加锁ﻫList userList=query.list();
//执行查询,获取数据
观察运行期Hibernate生成的 SQL语句:
1
selecttuser0_.idasid, tuser0_.name as name,tuser0_.group_id asgroup_id,tuser0_.user_typeas user_type,tuser0_.sexassexfromt_usertuser0_where (tuser0_.name='
Erica'
) forupdate
这里Hibernate通过使用数据库的for update子句实现了悲观锁机制。
Hibernate的加锁模式有:
2ﻫ3
5
6ﻫ7
8ﻫ9
10
11ﻫ12
LockMode.NONE:
无锁机制。
ﻫLockMode.WRITE:
Hibernate在 Insert 和Update记录的时候会自动获取ﻫLockMode.READ:
Hibernate在读取记录的时候会自动获取。
ﻫ以上这三种锁机制一般由Hibernate内部使用,如Hibernate为了保证Update过程中对象不会被外界修改,会在 save方法实现中自动为目标对象加上 WRITE锁。
LockMode.UPGRADE:
利用数据库的forupdate子句加锁。
LockMode.UPGRADE_NOWAIT:
Oracle的特定实现,利用Oracle的 forupdatenowait 子句实现加锁。
上面这两种锁机制是我们在应用层较为常用的,加锁一般通过以下方法实现:
ﻫCriteria.setLockModeﻫQuery.setLockMode
Session.lock
注意,只有在查询开始之前(也就是Hiberate生成SQL 之前)设定加锁,才会真正通过数据库的锁机制进行加锁处理,否则,数据已经通过不包含forupdate子句的SelectSQL加载进来,所谓数据库加锁也就无从谈起。
为了更好的理解select…forupdate的锁表的过程,本人将要以mysql为例,进行相应的讲解ﻫ开启两个测试窗口,其中一个窗口A执行命令:
2
3ﻫ4
5ﻫ6
7
8
9ﻫ10
11
mysql>
begin;
QueryOK,0 rowsaffected(0.00sec)
mysql>
select*fromempinfoforupdate;
+--------+----------+------+---------+
|Fempno|Fempname|Fage|Fsalary|ﻫ+--------+----------+------+---------+
|1233 |sdfs |NULL | NULL|ﻫ| 324234|sdf | 38|12121|ﻫ+--------+----------+------+---------+
2rowsinset(0.00 sec)
这个时候打开窗口B执行更新或插入操作:
1
mysql>updateempinfoset Fage=12where Fempno=1233;
这个时候窗口B的更新或插入操作不会执行,会一直在等待,直到A窗口的事务提交了:
mysql>
commit;
ﻫQueryOK,0rowsaffected(0.00sec)
B窗口的更新才开始执行。
ﻫ那么forupdate到底锁定表还是行呢?
由于InnoDB预设是Row-Level Lock,所以只有「明确」的指定主键,MySQL才会执行Rowlock(只锁住被选取的资料例) ,否则MySQL将会执行Table Lock(将整个资料表单给锁住)。
例1:
(明确指定主键,并且有此笔资料,rowlock)
1ﻫ2ﻫ3
SELECT*FROM products WHEREid='3'
FORUPDATE;
ﻫ
SELECT* FROMproductsWHEREid='
3'and type=1FORUPDATE;
例2:
(明确指定主键,若查无此笔资料,无lock)
SELECT *FROMproductsWHERE id='
-1'
FORUPDATE;
例3:
(无主键,tablelock)
SELECT *FROMproductsWHEREname='
Mouse'
FOR UPDATE;
例4:
(主键不明确,table lock)
SELECT *FROM productsWHEREid<
>'
3'
FORUPDATE;
例5:
(主键不明确,tablelock)
SELECT*FROMproductsWHEREidLIKE '
3' FORUPDATE;
注1:
FORUPDATE仅适用于InnoDB,且必须在交易区块(BEGIN/COMMIT)中才能生效。
ﻫ注2:
要测试锁定的状况,可以利用MySQL的CommandMode ,开二个视窗来做测试。
在MySql5.0中测试确实是这样的
另外:
MyAsim只支持表级锁,InnerDB支持行级锁添加了(行级锁/表级锁)锁的数据不能被其它事务再锁定,也不被其它事务修改(修改、删除)。
是表级锁时,不管是否查询到记录,都会锁定表。
到这里,悲观锁机制你应该了解一些了吧~
乐观锁
相对悲观锁而言,乐观锁机制采取了更加宽松的加锁机制。
悲观锁大多数情况下依靠数据库的锁机制实现,以保证操作最大程度的独占性。
但随之而来的就是数据库性能的大量开销,特别是对长事务而言,这样的开销往往无法承受。
如一个金融系统,当某个操作员读取用户的数据,并在读出的用户数据的基础上进行修改时(如更改用户帐户余额),如果采用悲观锁机制,也就意味着整个操作过 程中(从操作员读出数据、开始修改直至提交修改结果的全过程,甚至还包括操作员中途去煮咖啡的时间),数据库记录始终处于加锁状态,可以想见,如果面对几百上千个并发,这样的情况将导致怎样的后果。
乐观锁机制在一定程度上解决了这个问题。
乐观锁,大多是基于数据版本Version)记录机制实现。
何谓数据版本?
即为数据增加一个版本标识,在基于数据库表的版本解决方案中,一般是通过为数据库表增加一个“version”字段来 实现。
读取出数据时,将此版本号一同读出,之后更新时,对此版本号加一。
此时,将提交数据的版本数据与数据库表对应记录的当前版本信息进行比对,如果提交的数据版本号大于数据库表当前版本号,则予以更新,否则认为是过期数据。
ﻫ假如数据库中账户余额为100,version为1,操作员A读出余额,并修改为50,而在A操作的同时操作员B也读出了账户余额100,并修改为80,A完成了操作录入系统,version从1加上1变为2,余额修改为50,操作员B也提交了记录,version也变为2,余额则是80,但是此时数据库发现,B提交的version为2,当前版本也是2,不满足“提交版本必须大于记录当前版本才能执行更新“ 的乐观锁策略。
因此,操作员 B的提交被驳回。
这样,就避免了操作员B用基于version=1的旧数据修改的结果覆盖操作员A的操作结果的可能。
从上面的例子可以看出,乐观锁机制避免了长事务中的数据库加锁开销(操作员 A和操作员B操作过程中,都没有对数据库数据加锁),大大提升了大并发量下的系统整体性能表现。
需要注意的是,乐观锁机制往往基于系统中的数据存储逻辑,因此也具备一定的局 限性,如在上例中,由于乐观锁机制是在我们的系统中实现,来自外部系统的用户余额更新操作不受我们系统的控制,因此可能会造成脏数据被更新到数据库中。
在系统设计阶段,我们应该充分考虑到这些情况出现的可能性,并进行相应调整(如将乐观锁策略在数据库存储过程中实现,对外只开放基于此存储过程的数据更新途径,而不是将数据库表直接对外公开)。
Hibernate在其数据访问引擎中内置了乐观锁实现。
如果不用考虑外部系统对数据库的更新操作,利用Hibernate 提供的透明化乐观锁实现,将大大提升我们的生产力。
Hibernate使用乐观锁我只说一下注解的方式:
在Entity中加入以下代码
1ﻫ2
4ﻫ5ﻫ6
7ﻫ8ﻫ9ﻫ10
privateintversion;
@Version
@Column(name = "
version"
length=11)ﻫpublic intgetVersion(){
returnversion;
}ﻫpublicvoidsetVersion(intversion){ﻫ this.version=version;
}
这样就可以轻松实现hibernate乐观锁方式。
常见并发同步案例分析
ﻫ案例一:
订票系统案例ﻫ某航班只有一张机票,假定有1w个人打开你的网站来订票,问你如何解决并发问题(可扩展到任何高并发网站要考虑的并发读写问题)ﻫ问题,1w个人来访问,票没出去前要保证大家都能看到有票,不可能一个人在看到票的时候别人就不能看了。
到底谁能抢到,那得看这个人的“运气”(网络快慢等)
其次考虑的问题,并发,1w个人同时点击购买,到底谁能成交?
总共只有一张票。
ﻫ首先我们容易想到和并发相关的几个方案:
ﻫ锁同步同步更多指的是应用程序的层面,多个线程进来,只能一个一个的访问,java中指的是syncrinized关键字。
锁也有2个层面,一个是java中谈到的对象锁,用于线程同步;
另外一个层面是数据库的锁;
如果是分布式的系统,显然只能利用数据库端的锁来实现。
假定我们采用了同步机制或者数据库物理锁机制,如何保证1w个人还能同时看到有票,显然会牺牲性能,在高并发网站中是不可取的。
使用hibernate后我们提出了另外一个概念:
乐观锁、悲观锁(即传统的物理锁);
采用乐观锁即可解决此问题。
乐观锁意思是不锁定表的情况下,利用业务的控制来解决并发问题,这样即保证数据的并发可读性又保证保存数据的排他性,保证性能的同时解决了并发带来的脏数据问题。
ﻫhibernate中如何实现乐观锁:
前提:
在现有表当中增加一个冗余字段,version版本号,long类型
原理:
ﻫ1)只有当前版本号》=数据库表版本号,才能提交ﻫ2)提交成功后,版本号version++
案例一:
案例二、股票交易系统、银行系统,大数据量你是如何考虑的ﻫ首先,股票交易系统的行情表,每几秒钟就有一个行情记录产生,一天下来就有(假定行情3秒一个)股票数量×
20×
60*6条记录,一月下来这个表记录数量多大?
oracle中一张表的记录数超过100w后 查询性能就很差了,如何保证系统性能?
ﻫ再比如,中国移动有上亿的用户量,表如何设计?
把所有用于存在于一个表么?
ﻫ所以,大数量的系统,必须考虑表拆分-(表名字不一样,但是结构完全一样),通用的几种方式:
(视情况而定)
1)按业务分,比如手机号的表,我们可以考虑130开头的作为一个表,131开头的另外一张表以此类推
2)利用oracle的表拆分机制做分表
3)如果是交易系统,我们可以考虑按时间轴拆分,当日数据一个表,历史数据弄到其它表。
这里历史数据的报表和查询不会影响当日交易。
ﻫ此外,我们还得考虑缓存
这里的缓存,指的不仅仅是hibernate,hibernate本身提供了一级二级缓存。
这里的缓存独立于应用,依然是内存的读取,假如我们能减少数据库频繁的访问,那对系统肯定大大有利的。
比如一个电子商务系统的商品搜索,如果某个关键字的商品经常被搜,那就可以考虑这部分商品列表存放到缓存(内存中去),这样不用每次访问数据库,性能大大增加。
简单的缓存大家可以理解为自己做一个hashmap,把常访问的数据做一个key,value是第一次从数据库搜索出来的值,下次访问就可以从map里读取,而不读数据库;
专业些的目前有独立的缓存框架比如memcached等,可独立部署成一个缓存服务器。
常见的提高高并发下访问的效率的手段
ﻫ首先要了解高并发的的瓶颈在哪里?
ﻫ1、可能是服务器网络带宽不够
2.可能web线程连接数不够ﻫ3.可能数据库连接查询上不去。
根据不同的情况,解决思路也不同。
1、像第一种情况可以增加网络带宽,DNS域名解析分发多台服务器。
ﻫ2、负载均衡,前置代理服务器nginx、apache等等
3、数据库查询优化,读写分离,分表等等
最后复制一些在高并发下面需要常常需要处理的内容:
尽量使用缓存,包括用户缓存,信息缓存等,多花点内存来做缓存,可以大量减少与数据库的交互,提高性能。
ﻫ用jprofiler等工具找出性能瓶颈,减少额外的开销。
ﻫ优化数据库查询语句,减少直接使用hibernate等工具的直接生成语句(仅耗时较长的查询做优化)。
ﻫ优化数据库结构,多做索引,提高查询效率。
ﻫ统计的功能尽量做缓存,或按每天一统计或定时统计相关报表,避免需要时进行统计的功能。
能使用静态页面的地方尽量使用,减少容器的解析(尽量将动态内容生成静态html来显示)。
ﻫ解决以上问题后,使用服务器集群来解决单台的瓶颈问题。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 并发 处理 详解