书签分享收藏举报版权申诉 / 6

立即下载加入VIP,免费下载

当前位置：首页 > 工程科技 > 能源化工 > 津巴多普通心理学思考九Word文档格式.docx

津巴多普通心理学思考九Word文档格式.docx

文档编号：18599037
上传时间：2022-12-29
格式：DOCX
页数：6
大小：22.89KB

《津巴多普通心理学思考九Word文档格式.docx》由会员分享，可在线阅读，更多相关《津巴多普通心理学思考九Word文档格式.docx（6页珍藏版）》请在冰豆网上搜索。

津巴多普通心理学思考九Word文档格式.docx

我们反复挠痒也是这类。

二是行为学习（包括经典条件和操作性条件），经典条件学习是指先天反应刺激与中性刺激联系在一起，后者便具有引发相同反应的能力，例如当你饥饿的时候看到食物会分泌唾液，这是先天反应机制，而我们将食物与另一刺激（现象）联系在一起时，如每天中午12点必然开饭，这时时间如果快到12点或是下课铃声预示12点，就算你没有看到食物，你的唾液也会开始分泌，因为后者已经牢固的与食物联系到了一起，这就是习得性条件反射，在有这种经历前，你是不会将铃声和食物联系到一起的。

人类存在大量的这种经典条件学习（习得性反射），例如玫瑰代表爱情，实际上玫瑰就是花而已，棺材代表死亡等等。

注意与本能区别，食物分泌唾液这是本能，不需要学习，同时注意，中性刺激与先天反应之间的关联性要强，例如他们之间的间隔时间不能太长，每次都能准确对应等，而且这种经典条件完全依靠条件来维持，一旦发生变化，这种条件反射会迅速下降到消失，虽然间隔一段时间可能还会恢复（自发性恢复，例如当你听到卖牛奶的铃铛声到你家时他的牛奶总是已经卖完了，你再不会对他的铃铛产生条件反射，但他几天再没来，突然某一天你又听见了会再次恢复条件反射，但强度只有以前的一半或更低）。

泛化。

是指对相似事物的认知趋同，例如被一只黑寡妇蜘蛛咬过，你会对所有种类和大小的蜘蛛产生害怕反应。

同样，给狗换一种铃铛声，狗一样会产生唾液分泌，当给花粉过敏的人闻塑料假花时，他同样会打喷嚏等等。

泛化也指同一情绪传染给他人或是不同动物之间的传染。

例如，当着其他猪、牛的面杀猪，不只是猪会产生恐惧，牛也会产生强烈的恐惧感。

分化。

是指通过学习，对相似的事物产生不同的认知。

例如，当我们听到门铃声，不会认为有牛奶，同样，给狗听两种不同的铃铛声，但一种给食物另一种不给，狗也会学会分化，区别两种铃铛声音而产生不同的反应。

但这种通过学习来区分不同事物的前提是能明显区别，实验性神经官能症就是当你无法区别两种细微差别的事物（刺激）而产生心理压力，造成行为失常、狂躁、暴力等行为。

恶心。

研究发现，动物有些生理和心理反应并不是都具有经典条件学习的过程，例如恶心，这种生理心理反应则完全是由遗传（先天）因素决定的，一个闻到榴莲味就恶心的人，不会对反复出现的其他刺激（实验时每次施放气味时也播放同样的铃声和彩灯）产生条件反射（单独播放不会产生恶心反射），只会对确实闻到榴莲味产生反应，恶心这种完全由先天刺激决定的反应，为什么不会与同时存在的其他刺激建立关系呢？

为什么食物这种反应会与其他刺激建立关系呢（并不是所有愉悦的事物才能形成经典条件反射，例如对人电击实验，每次播放声音后三秒就会电击一次，多次电击后，当实验者听到声音后还没被电击时，会产生电击防护应激，也就是说，对电击产生了经典条件反射）？

就目前研究来看，只能说这是由动物进化机制决定的，哪些会形成其他刺激关联的反应（具有学习性），哪些不会（不具学习性），还要深入研究。

恶心好象只能与食物和气味建立反应，当你看到或闻到这个食物（事物）的时候恶心才会出现，而不会与其他刺激形成反应，例如癌症病人在化疗前都会进食保证身体营养，但化疗后会让病人产生恶心与痛苦，多次治疗后病人会产生厌食症，看到食物（注意这里的食物仅仅是化疗前经常吃的，而不是所有的食物，当然严重的会将进食形成恶心反射）后就会恶心，而化疗过程却不会对病人产生恶心反应（注意这里不是指化疗刺激消化系统产生的恶心），狼多次食用羊肉后中毒痛苦无比，将这只狼与羊关到一起时，狼会远离羊并避免看到羊，当羊的气味吹到狼这边时，狼开始剧烈恶心并呕吐。

操作性条件反射。

是行为学习的更高层次的反射，操作性条件最主要的特点就是主动行为，而不象经典条件反射中那些被动的生理上的行为（例如分泌唾液）。

操作性行为是指生物体为影响环境做出的行为，例如为了能更好的认知周围的环境而努力思考学习，那么思考学习就是操作性行为。

操作性行为与其后果有很大关系，后果（奖励或惩罚）决定这种操作性行为是否会继续下去。

注意这里的奖励和惩罚并不仅仅是指即时得到的小的利益和损害，有的奖励和惩罚即刻得到，例如训练动物时采用的食物和鞭子，有的奖励和惩罚可能要几年甚至十几年才能看到，例如学习考试创作健身（实际上这些行为只要进行就会得到利益，只不过量变到质变的过程漫长而已）等，例如吸烟酗酒懒惰等。

漫长的奖励和惩罚只有高等动物才能认知到。

需要注意的是，认知并不等于行为，吸烟的危害就是因为太过漫长而被淡化，严格的考试就是因为要有太长时间的学习积累而被放弃，这是因为个体在行为前会进行得失比较，当认为得到的远比失去的小，他们就会放弃改变行为，如何选择往往也决定了个体在环境中的位置和作用，这也是个体多样性决定的，也就是说必须是生物体认知范围内可以理解的奖励和惩罚才有效。

例如让一只狗连续翻一百个跟头，才给他食物，它是不会完成的，即使最后饿死也不会理解（经过训练的狗除外），但如果改变成每翻十个给一口食物的话，狗会十分积极的完成一百个跟头（渐进性十分重要，只要动物意识到它的行为尝试不断接近目标或是不断能得到收益，它就会行为下去，人类也是一样）。

学习本质和进化一样，例如在一只猫和食物之间放一个机关，猫只有打开机关才能得到食物，猫反复尝试不同的行为，实验发现猫会对无效的行为放弃，对能取得前进的行为记忆并不断改进，这种学习就是淘汰无用的行为，强化有用的行为过程，所有的学习都遵循这种进化模式。

学习实质是适应性行为，和进化一样为了生存和繁殖，所以学习也具有进化的特点：

一是时间上的渐进性。

学习必须要通过不断持续渐进才能完成，这种渐进十分重要，个体只有通过不断的反馈来纠正错误，在相同环境下，错误越来越少，学习就进步了。

二是环境适应性。

学习的目的是生存和繁殖，人类包括生物，学习往往是被生存繁殖所迫，当学习的内容与自身生存关系不大时，个体学习的动力基本丧失。

例如在同一班级的学生，那些学习不好的（智力正常）基本都认为学习没用，这种认知降低了学习与生存的关系，也就是说学校里学习花费的时间和资源远大于自己获得的生存收益，他们厌恶学习，根本原因是觉得不值得。

相反，如果个体认为（或是环境倒逼）学习的内容与自身生存繁殖关系很大时，个体总会表现出积极的学习行为。

所以好的教育，首先要让个体认知到这种学习与其自身生存繁殖的关系，这种认知越强烈，学习的动力和信念越强大。

强化物。

所有与个体生存繁殖有益的因素都是正强化（正面刺激），最强的强化物是那些直接关系生死的因素，例如食物、水、空气、安全（当我们缺少这些维持生命必须的事物时，我们才会意识到，而在我们能轻意获得时我们往往会忽略这些对我们生存最关键的东西）。

其次是间接关系生死的因素，如金钱、地位、健康、资源、时间，最后是那些有益于生存繁殖的因素，如表扬、微笑、尊敬、认同等。

负强化。

所有免除或减轻危险、痛苦、不适的因素都是负强化（消除刺激），与正强化相同的是，负强化通过消除不利事物给个体生存和繁殖带来收益，例如当你被吵闹的声音干扰无法入睡，这时关掉声音源会让你有种解脱的愉悦感，当你在大雨中奔跑，看到前面有一个能避雨的凉亭，你跑进去后会有一种松口气的放松感，负强化的特点是，会让你的损害减少，从而产生与获得利益相同的感受，实质上还是进化机制决定的，生存和繁殖是第一要务。

强化的权变关系。

这同自然界中波是一样的，也就是说强化的频率（间隔多长时间给予强化），强化的强度（就是振幅，波谷相当于给予负强化，波峰相当于正强化，振幅可以是个常数，也可以是变量，就好比波一样，频率和振幅都是可变的，但不会改变波的本质）。

波的横坐标可以看作是学习积累量，纵坐标看做学习加速度。

连续强化和间接强化，连续强化多用于学习新事物，每做正确一个行为，即使没有达到目的，都需要及时奖励，这是保证学习积极性和有效性的最佳策略，间接强化多用于维持已学得行为，这时行为已经不再是学习（不再是新鲜事物和未知事物）而是重复性的行为，但如果一直不能得到强化（奖励，有益于生存和繁殖的所有行为或资源），个体无法积极响应和维持这种无意义的行为，间隔多少次或多长时间进行强化，和行为的难度（花费的时间和代价）、个体的认知（阀值高低，多少次没有回报才算不值得）、环境压力（外因造成的不利己）等综合决定。

有意思的是，为什么间接强化对于已经习得的行为或认知要比连续强化更有效呢？

连续强化对于个体而言获得更多的收益是没错的，但我们现在研究的是教授和训练，主体不只是学习个体还有教授的个体，个体最佳的学习路径并不是以自身实践在环境中学习，这样做一是效率不高，他要走很多弯路才能学习到正确的行为甚至永远都学习不到，二是风险大，例如哪些食物是有毒的，哪些动物最好离远点，这些学习往往是以生命为代价的，三是不具有种族累积性，个体的一生所学习到的知识和技能，如果不能教授给下一代，那么这个种族必将灭亡，因为这和基因进化性质一样，没有遗传，哪有变异。

所以传授、教授是个体学习的最佳路径，所有哺乳动物都具备这样的传授行为，这时以上的问题就能很好的解释了：

一是从传授者角度看，资源是有限的和必须要付出相应的代价获得，这是传授最基础的认知，因为个体学习的根本目的就是能获得更多的资源（或更少的代价更有效率）来更好的生存和繁殖。

相比正在学习的行为，已经习得行为作用个体的时间很长，有的可能是一生，而学习过程却很短暂，只要个体掌握了学习就算结束。

对于短期的学习行为因为要花费学习者更多的精力和时间，传授者如果不给予高频率大数量的奖励，个体很可能因为这个过程对自己没有收益而放弃。

而当学习完成，个体已经没有理由再从传授者这里获得收益，他可以用学习到的行为获得收益，除非这种行为有利于传授者，而这种已经学会的行为与那些正在学习的行为相比不再重要，传授者必须以最小的付出维持个体的习得行为。

从学习者来看，通过从教授者那里获得收益的频率和数量，让他们更关注那些新事物新学习，让个体明白什么才是相对重要的，这也是为什么差别化实质上是一种行为暗示，再从资源边际效应上看，如果同一种奖励过多，其每一次产生的激励作用递减，总有这样的一个临界数量，这时奖励对于个体而言已经不再有什么区别。

例如食物训练时，每次只给一点就是因为当动物吃饱后，食物对他们而言已经不再有效益。

最关键的是，间隔强化最大的特点就是不确定性，对于个体而言，他不确定哪次行为或什么时间会有奖励，这种不确定性之所以能给个体以更大的强化是因为他符合我们（包括动物）进化机制，动物外出捕食并不是每次都能成功，他们不能确定收益的时间和数量，为了生存和繁殖，每次外出行为实质上都有一种获得食物和资源的预期，这种激励机制通过上百万年进化已经能十分有效的作用于几乎所有动物，相对于每次都能获得食物，这与我们自身进化和环境适应相冲突。

变动比率安排。

上面提到间隔强化中间隔有多种形式，有的以次数为依据，有的以时间为依据，和前面提到的强化权变关系一样，强化具有波的性质，这里以固定时间或固定次数为间隔的是频率不变的波（如果每次强化数量也一样则波幅也不变），例如工厂按件计费和按时计费就是这种情况，但环境中还存在一种不可预知、不可确定的间隔强化（个体掌控很少的情况），这种强化因为符合进化机制（动物捕食，存在超额收益的可能），所以随机强化对个体的作用和效果远大于固定强化，例如赌博、彩票、推销、保险、抽奖等。

例如，实验对饥饿的鸽子啄击铁板，但不确定次数出食，鸽子在一小时内不停的啄击12000多次，有的2次就出食了，有的198次才出食，平均一小时内需110次才出一次，实验再对同样饥饿的鸽子，这次设定固定次数出食，110次出一次，由于不再有少于110次出食的情况（例如2次就出食），鸽子啄击的频率由开始很快到后面明显变慢，到后面变成基本固定的频率，鸽子知道必须啄击同样的次数必定出食（在两次间隔中间，鸽子基本已经丧失了啄击的动力，但在次数快够出食时，啄击明显加快），这种确定性消除了超额收益的可能（短时间少次数获得收益），让个体获得收益的积极性完全丧失。

所以，在可以产生超额收益的机制中，我们最好不要采用固定间隔强化。

例如考试前突击学习，假期末突击写作业，行政事业单位每月定时领取固定工资，屎憋屁门了才去找纸等都是因为固定间隔是我们已经确定的，我们在确定发生之前才会行动。

不只是人类，所有动物者是这样，确定性最大的坏处就是将所有可能结果都确定了，个体无论怎样发挥怎么积极，最终的结果都是一样，这限制了能力更高的个体或是积极性更高的个体的行为预期。

工厂实施的固定回报收益是因为生产环境完全可控，其部件流水速度是按照绝大多数个体的平均能力确定，这种一刀切的模式基本就扼杀了更高效率、更简流程、更好创意的可能。

例如事业单位每月按时发工资，无论你在这个单位贡献多少，无论这个月和下个月你创造了多少价值，每个月的收益都是不变的，这实质上就是效率最低下的强化模式。

那么问题来了，为什么效率不高却还要采用呢？

因为这种模式保证最大同一性及所有个体的收益性，牺牲强者维持弱者的机制。

例如如果采用不确定模式，那么收益必将产生极大分化，能力水平高的个体将获得以前几人甚至十几人的收益，但资源是有限的，必将造成能力最差的个体被淘汰出局，失业无法生活，这在自然环境下是最正常不过的现象，放在整个宇宙都是普遍适用的生存法则，但我们人类却因为某些原因改变了这种普适法则。

首先，这不利于社会稳定，不利于统治阶级统治，所以让所有人都能很好的生存，在中间大多数群体利益基本稳定的情况下（自然竞争情况下个体呈现正态分布），牺牲高能端利益补贴低能端（这两者都只占群体的少数，他们相加不会超过整体的一半），这种违背自然选择的机制虽然保证了所有个体最大化生存，但从长远来看，却牺牲了整个群体进化的普适性。

因为剥夺了高能端个体的资源（进化本质上都是为了生存和繁殖，资源越多的个体其生存繁殖的成功性越大，会有更多的子代），高能端不再有更高效的更积极的行为作用于环境和整个群体，他们不再创新、不再研究、不再思考、不再竞争，不再为子代生存长远计划，他们已经对这种机制麻木，并将自己同化（这种机制就是要让所有个体同化）。

其次进化机制告诉我们，存在就是合理的，因为存在是因为适应环境才能存在，战争之所以伴随人类进化到现在，因为战争对人类进化起到相当重要的作用，每次世界大战，人类科学技术和生产水平都产生了跳跃性发展，战争打破了人为机制，甚至无视于种族、宗教、道德、法律，完全打破违背自然选择的所有机制，恢复了自然生存法则，弱肉强食，凡是在战争中生存下来的必定是强者。

初级强化物，指满足基本生理需要（生存繁殖）的强化物，如食物、水、性行为等，次级强化物，指可间接影响个体生存繁殖的物质，例如金钱、关爱、赞扬、地位、尊重等。

需要注意的是，还有一种强化物，是与个体喜好、兴趣、认知相关的，每个个体都不相同，但其本质是能让个体满足、愉悦、有获得感的事物，例如好动的孩子如果老师告诉他能安静坐十分钟会让他到教室外玩半小时，这个孩子会很乐意安静坐着听讲，玩半个小时对于这个孩子而言就是个相当有获得感的奖励，家长告诉孩子如果能在上午写完作业允许他玩会电子游戏，劳累工作一天的人回家听古典音乐等都是这样，那么这些大相径庭的喜好，为什么都会产生强化作用？

他们与生存繁殖有什么关系？

心情愉悦获得感有利于个体生存繁殖吗？

普雷马克原理。

个体会为获得自己喜好的行为而忍受进行自己不喜欢的行为，喜好行为的强度和收益一但大于厌恶行为的强度和损害，个体就会采取替代行为。

对于低等动物，这种强化大多与生存繁殖有关（也就是食物、水、性行为等），对于人类而言，这种替代强化相当复杂，有的人喜欢吃油炸蚂蚱，有的人见到就恶心，有的人喜欢听秦腔，有的人则很反感，有的人喜欢观看相扑比赛，有的人则视为惩罚，有的人喜欢骨感的女人，有的则喜欢丰满的等等。

人类个体的兴趣、喜好、认知差异如此巨大，与基因变异一样，人类文化同样具有遗传和变异的特点，我们文化的变异程度和进化速度远大于其他物种，加之个体自身的遗传差异和后天环境因素，造成人类个体替代强化相当复杂。

这些喜好为什么会适用于个体？

存在即合理，这些喜好会强化他们自身的生存和繁殖吗？

完全素食主义者为什么会存在？

出家人完全禁欲与繁殖相背，为什么还会存在？

节食主义者为什么会存在？