Vector和ArrayList的本质区别到底是什么?昨天又看人讨论这个问题,发个帖,为新手整理思路,正本清源。很多人
Vector和ArrayList的本质区别到底是什么?
昨天又看人讨论这个问题,发个帖,为新手整理思路,正本清源。
很多人面试、被面试的时候都会被反复问到这个蛋疼的问题:Vector和ArrayList区别是什么?(同理StringBuffer & StringBuilder,Hashtable & HashMap,etc.)
我想很多人都会说出这个以讹传讹了好多年的标准答案:Vector是同步的,ArrayList不是。
其实最主要的核心差别是(抛开API层面的接口关系不讲),JDK1.4之前的这些类,API里面的public函数,都加了synchronized关键字,而JAVA5之后的ArrayList之类的结构,则取消了这个同步关键字限制。
?
取消是必然的,因为这个“同步”,现实在并发环境中起不到作用。
为了把问题简单一点,我们来看一个这样的结构。
synchronized (this) { //code...}
这个锁的粒度非常不好,即难以保证类内部的成员变量在并发下保持一致(如果有多个成员变量的话),也没法保证外面调用者的宏观逻辑是正确的,反倒降低了整体性能。
所以在JAVA5之后,JAVA把这个事情扔给了程序员,数据结构只是作为基础代码存在。
?
更具体的说,很多朋友都知道StringBuilder性能比StringBuffer好不少,其实作为项目整体层面来说,锁和拷贝是降低性能的罪魁祸首,尤其对于性能要求很极端的项目,应该尽量减少不必要的锁和拷贝;当然sun是提供api的,就更不能加入这样的不必要的同步代码了。
?
开发当中,如果一定需要锁,可以为具体的要保护的无关系的成员变量单独分配锁,这样可以保证获得最大的性能。
?
其实JAVA5还提供了很多用于并发的数据结构,比如ConcurrentMap的putIfAbsent就在一个比较好的粒度上给简化了程序员的代码,不会犯前面这个反例的错误。
?
将来,如果在scala、F#等FP语言能够普及,程序员也许不必再考虑这么多的并发问题。
26 楼 Crusader 2011-02-25 NanguoCoffee 写道LS几位大哥,线程安全的概念是什么呀? 弄清楚没?
我理解的线程概念:
如果某个个类的一个对象,对于能够修改这个对象状态(如add)或者调用其他方法会影响其结果(如get)的任何方法,多线程调用任一方法时,能够保证任意时刻仅有一个线程能执行,
那么这个类就是线程安全的类。
怎么看你这句话都是错的,单CPU有真正意义上的线程"并发"吗?
27 楼 haigui.chen 2011-02-25 ironsabre 写道haigui.chen 写道ironsabre 写道haigui.chen 写道谁说Vector线程安全,我和谁急
我觉得你没有真的理解线程安全。
可能是,在put if absent 下面,vector还会是线程安全的么?
vector本身是线程安全的,放在哪都是。
但vector本身的线程安全不能保证你使用了vector的应用程序是线程安全的。
懂了吗?
还没太懂,同步和线程安全是两个不同的概念... 28 楼 NanguoCoffee 2011-02-25 Crusader 写道NanguoCoffee 写道LS几位大哥,线程安全的概念是什么呀? 弄清楚没?
我理解的线程概念:
如果某个个类的一个对象,对于能够修改这个对象状态(如add)或者调用其他方法会影响其结果(如get)的任何方法,多线程调用任一方法时,能够保证任意时刻仅有一个线程能执行,
那么这个类就是线程安全的类。
怎么看你这句话都是错的,单CPU有真正意义上的线程"并发"吗?
不明白你说的意思。什么叫真正意义上的线程"并发"?
难道你认为N个CPU下同时运行N个线程才叫并发?这种情况我理解为并行。
29 楼 ironsabre 2011-02-25 haigui.chen 写道ironsabre 写道haigui.chen 写道ironsabre 写道haigui.chen 写道谁说Vector线程安全,我和谁急
我觉得你没有真的理解线程安全。
可能是,在put if absent 下面,vector还会是线程安全的么?
vector本身是线程安全的,放在哪都是。
但vector本身的线程安全不能保证你使用了vector的应用程序是线程安全的。
懂了吗?
还没太懂,同步和线程安全是两个不同的概念...
多线程同时直接操作一个Vector,做add操作。不会有报错。
1000个add后,vector里就有1000个数据。
多线程同时直接操作一个ArrayList,做add操作。有可能报错,也有可能出现数据被重写掉。
1000个add后,vector里可能只有999个数据。或者执行期间有index异常。
Vecotr的所有方法都是线程安全的。ArrayList不是。
我不知道你哪儿不懂。
30 楼 haigui.chen 2011-02-25 我觉得你应该说Vector所有的方法是“原子”的,我其实是没懂你脑子里面的“线程安全”怎么定义的...
引用
还没太懂,同步和线程安全是两个不同的概念...
多线程同时直接操作一个Vector,做add操作。不会有报错。
1000个add后,vector里就有1000个数据。
多线程同时直接操作一个ArrayList,做add操作。有可能报错,也有可能出现数据被重写掉。
1000个add后,vector里只有999个数据。或者执行期间有index异常。
Vecotr的所有方法都是线程安全的。ArrayList不是。
我不知道你哪儿不懂。
31 楼 ironsabre 2011-02-25 原子和线程安全的区别是什么,你说来听听。 32 楼 NanguoCoffee 2011-02-25 ironsabre 写道原子和线程安全的区别是什么,你说来听听。
嘿嘿,原子的肯定是线程安全的。
线程安全的不一定是原子的。
囧死了,我在说废话~~~~ 33 楼 抛出异常的爱 2011-02-25 NanguoCoffee 写道ironsabre 写道原子和线程安全的区别是什么,你说来听听。
嘿嘿,原子的肯定是线程安全的。
线程安全的不一定是原子的。
囧死了,我在说废话~~~~
你可以说不是非要数据库才会有事务.....
不是非要hibernate才会有乐观锁 34 楼 zhangyou1010 2011-02-25 抛出异常的爱 写道NanguoCoffee 写道ironsabre 写道原子和线程安全的区别是什么,你说来听听。
嘿嘿,原子的肯定是线程安全的。
线程安全的不一定是原子的。
囧死了,我在说废话~~~~
你可以说不是非要数据库才会有事务.....
不是非要hibernate才会有乐观锁
一个是制定的规范,一个是根据这个规范的一种实现? 35 楼 jackfromchina 2011-02-26 长见识了,以前确实只知道同步 36 楼 haigui.chen 2011-02-26 ironsabre 写道原子和线程安全的区别是什么,你说来听听。
http://en.wikipedia.org/wiki/Thread_safe
http://en.wikipedia.org/wiki/Atomicity_(programming)
if (!vector.contains(element))
vector.add(element);
这种存在race condition,同步,不安全 37 楼 ironsabre 2011-02-28 NanguoCoffee 写道ironsabre 写道原子和线程安全的区别是什么,你说来听听。
嘿嘿,原子的肯定是线程安全的。
线程安全的不一定是原子的。
囧死了,我在说废话~~~~
你能举例说明吗。
我觉得你说的不对,你举出例子来我应该可以反驳你。
38 楼 NanguoCoffee 2011-02-28 ironsabre 写道NanguoCoffee 写道ironsabre 写道原子和线程安全的区别是什么,你说来听听。
嘿嘿,原子的肯定是线程安全的。
线程安全的不一定是原子的。
囧死了,我在说废话~~~~
你能举例说明吗。
我觉得你说的不对,你举出例子来我应该可以反驳你。
”原子的肯定是线程安全的“ 这句话就不用举例。
“线程安全的不一定是原子的”的例子:
String对象,Date对象,Integer, Double....
这些类貌似有一种叫法:不可变类 39 楼 ironsabre 2011-02-28 我要先查一下。
但你的说法跟haigui.chen关于原子的说法是不一样的。
不明白为什么可以说到一起。
haigui.chen说道:我觉得你应该说Vector所有的方法是“原子”的,我其实是没懂你脑子里面的“线程安全”怎么定义的..
这句话明显应该是错的吧。 40 楼 ironsabre 2011-02-28 NanguoCoffee 写道ironsabre 写道NanguoCoffee 写道ironsabre 写道原子和线程安全的区别是什么,你说来听听。
嘿嘿,原子的肯定是线程安全的。
线程安全的不一定是原子的。
囧死了,我在说废话~~~~
你能举例说明吗。
我觉得你说的不对,你举出例子来我应该可以反驳你。
”原子的肯定是线程安全的“ 这句话就不用举例。
“线程安全的不一定是原子的”的例子:
String对象,Date对象,Integer, Double....
这些类貌似有一种叫法:不可变类
Vector按你的分类应该叫什么?原子or线程安全?
41 楼 ironsabre 2011-02-28 haigui.chen 写道我觉得你应该说Vector所有的方法是“原子”的,我其实是没懂你脑子里面的“线程安全”怎么定义的...
引用
还没太懂,同步和线程安全是两个不同的概念...
多线程同时直接操作一个Vector,做add操作。不会有报错。
1000个add后,vector里就有1000个数据。
多线程同时直接操作一个ArrayList,做add操作。有可能报错,也有可能出现数据被重写掉。
1000个add后,vector里只有999个数据。或者执行期间有index异常。
Vecotr的所有方法都是线程安全的。ArrayList不是。
我不知道你哪儿不懂。
你错了。
我脑子里的线程安全定义就是标准定义。
在多线程和单线程下工作,Vector的所有API(同步的)能表现出一致的行为,而ArrayList的API不能。 42 楼 ironsabre 2011-02-28 class RealTimeClock
{
private int clkID;
public void setClockID(int id)
{
clkID = id;
}
}
在这里,setClockId不需要同步,也能保证线程安全。这是由于int的赋值操作是原子的。这并不多可以理解为Java本身对他提供了同步的默认支持。
官方说法如下:32位或者更少位数的赋值是原子的。
如果把上面的int改成long(64位)。那么setClockId就不再是原子操作。也线程不再安全。如果要保证,那么加上synchronized。
当然后来jdk里Java又提供了一个AtomicLong之类的对象,这些对象能提供原子操作。
其实在讨论Vector和ArrayList的时候,是不需要出现到关于原子操作的讨论的。
它们俩跟原子操作就没关系。
43 楼 aoliwen521 2011-02-28 在多线程调用ArrayList的add方法的时候,就会出现问题,而Vector不会。确实Vector是线程安全的。只是这个安全,作用不够明显。 44 楼 windrain453 2011-02-28 我觉得这个问题根本没讨论的必要。
vector是线程安全的,就如同一个房间,房门上有把锁,锁只有一个钥匙,当很多人想进房间,拿到那把能开锁的钥匙(姑且叫做A)才可以进入房间,而等到A退出房间并将钥匙随便给到在房门口等待的其他一人(姑且叫做B)的手上,B才可以进入房间,这样能保证房间里的资源在同一时间只被一个人占用。
arrayList不是线程安全的,就如同一个房门上没有锁的房间,因而所有的人都可以同时进入房间,房间里的资源在同一时间被多个人占用。这样在多线程中会出现问题。比如说那个资源是马桶,多个人进去抢那一个马桶势必大大出手形成竞争(race condition)。这样说不准没有一个人能正常如厕,所以arrayList在多线程里面用的话会很危险。
反过来看楼主的说法,楼主用多个线程来查看vector,然后再往vector里面添加数据。
if(vector.size() == 0){
Thread.sleep(100);
vector.add(new Element());
}
我故意加了个Thread.sleep();
这样会存在什么问题呢,多个线程都会看到vector的空间等于0,然后往vector里面添加元素。就如同多个人看到房间里面的马桶一次都没有用过,于是都想用第一次,然后他们该怎么做呢?排队拿钥匙进入房间用马桶。于是马桶被用了3次。
而如果在这里是arrayList会是什么情况呢?所有的人都进去用,有可能马桶只被用了1次(arrayList里面只存用一个元素)。那为什么明明3个人用过马桶,最后却只被用了一次呢,这个与试试矛盾啊,这就是因为房门没有锁,3个人有可能同时共用了一次马桶,这个与事实想违背,所以说arrayList是不安全的。
那么楼主说vector也是不安全的 因为上面的一段代码,这段代码就好比是房间(1)外面有一个更大的房间(2),房间(2)的房门没有锁,所以所有的人都可以进入房间(2)来看,这样房间(2)是不安全的,不安全的原因是楼主没把房间上锁,但是房间(2)不安全并不代表房间(1)不是安全的。
45 楼 ironsabre 2011-02-28 楼上讲得很好。