白话《社会科学中的研究设计方案》日常思考的语言与研究设计方案的逻辑.docx
- 文档编号:20128494
- 上传时间:2023-04-25
- 格式:DOCX
- 页数:16
- 大小:116.08KB
白话《社会科学中的研究设计方案》日常思考的语言与研究设计方案的逻辑.docx
《白话《社会科学中的研究设计方案》日常思考的语言与研究设计方案的逻辑.docx》由会员分享,可在线阅读,更多相关《白话《社会科学中的研究设计方案》日常思考的语言与研究设计方案的逻辑.docx(16页珍藏版)》请在冰豆网上搜索。
白话《社会科学中的研究设计方案》日常思考的语言与研究设计方案的逻辑
白话《社会科学中的研究设计》:
日常思考的语言与研究设计的逻辑-行政管理
白话《社会科学中的研究设计》:
日常思考的语言与研究设计的逻辑
陈 玮 耿 曙 钟灵娜
陈玮,上海财经大学公共经济与管理学院,博士候选人;通讯作者:
耿曙(skeng0731@163com),上海财经大学公共经济与管理学院,常任轨副教授;钟灵娜,上海财经大学公共经济与管理学院,博士候选人;德州大学奥斯汀分校政府系,访问学者。
感谢上海财经大学林瑞华老师、上海大学庞保庆老师在讨论过程中提出的宝贵意见和匿名评审人的建议。
基金项目:
上海财经大学研究生科研创新基金(CXJJ-2012-329)
【摘要】论及社会科学研究方法,《社会科学中的研究设计》是不容略过的经典。
它从定量社科研究中,提炼研究设计的通则,无论定量、定性学者均能从中获益。
但在表述与解说原则时,作者虽力求深入浅出,但仍偏数理语言,往往产生“定量研究不必读,定性研究不能读”的窘境。
有鉴于此,文章运用日常语言,条理并阐述《设计》所提炼的原则,一方面让不习惯数理语言的研究者,也能掌握运用该书建议,另方面也盼藉此说明,研究设计的原理,也能运用日常语言加以理解与传述。
【关键字】研究设计 因果关系 案例选取 日常语言 数理语言
【中图分类号】C03【文献标识码】A
【文章编号】1674-2486(2015)04-0017-14
一、《设计》的初衷与本文的目的
在社会科学中谈研究设计,肯定得从KKV三位开始。
①他们的《社会科学中的研究设计(DesigningSocialInquiry)》(下文简称《设计》),一经面世就引起广泛关注,①时至今日俨然成为领域“圣经”。
此书从定量研究范式中,提炼出研究设计的通则,但无论定量、定性研究者均能从中获益。
尤其针对“若受素材限制,如何严谨研究”?
提出多项独到建议。
学者参考效仿,一时蔚为潮流,迄今整二十年,彻底改变“怎么做社科研究”的方式,影响既深且广。
但就提升社科研究而言,《设计》仍有其不足。
作者初衷是为不宜定量的领域提供研究设计的指导,但本书无论思路或语言,均反映作者所惯用的数理逻辑,常让不少同行望而却步,落入“定量研究不必读,定性研究不能读”的窘境。
也因此,该书虽说广受推崇,终卷读者却相对有限,还以定量学者居多。
从这个角度讲,该书还没有善尽引导定性的职责。
有鉴于此,本文将运用日常语言,条理并阐述《设计》所述原则,一则有助不熟悉数理语言的读者,也能掌握、运用该书建议,再则也盼藉此说明,研究设计也能通过日常语言进行理解与传述。
论及语言与思考的关系,受“萨丕尔-沃尔夫假说”(Sapir-WhorfHypothesis)等的启发,我们可以推知:
无论研究设计的构想,或者具体研究的展开,都受研究表述方式所制约(麦克洛斯基,2000)。
这也是为何用以想象、构思研究的“语言”,之所以如此关键的原因。
对于现代社会科学来说,诚如本专题中陈硕的论文所述,主要就两种逻辑:
①语言逻辑采用文字或口语表达因果论证;②数理逻辑则……[表现为数理的]公式表达或……对语言逻辑进行严谨表述。
数理逻辑之进入社会科学,关键之一是保罗·萨缪尔森(PaulA.Samuelson)。
他(Samuelson,1947)仿效物理学的分析范式,撰写《经济分析基础(FoundationsofEconomicAnalysis)》,影响经济学科至深(Boulding,1948),他在书扉的题词就简单一句“数学就是种语言(MathematicsIsaLanguage.)”。
自此之后,数理逻辑席卷经济学科,论著/交流无不依赖数理语言,在此同时,此类影响还向其他学科扩散。
但当然,在数理语言介入之前,包括亚当·斯密在内,都是运用日常语言进行思考、推理,而这样的风格与做法,迄今仍然有众多的追随者。
从上述这个渊源来看,所谓定量、定性研究之争,虽然主要涉及搜集数据的手段(耿曙、陈玮,2013),但更深一层的分歧,则涉及研究构思、推理的逻辑。
也因此,《设计》作者便这么认为:
我们认同大卫·科利尔(DavidCollier)的看法,就是我们[在书中提出]的各种[有关研究设计的]建议,其实大可改以定性方法与定性学者所熟稔的语言加以表述。
这样一来[定量与定性研究]本就相通的[有关研究设计的]逻辑,就能如大卫·雷登(DavidLaitin)所言,成为所有社科学者的“共通用语”,因此帮助双方就紧要议题展开全面的沟通与交流。
……①(Kingetal.,1995:
475)从这个角度看,我们当然可以用“日常思考的语言”来表述《设计》中稍偏“数理模型的语言”,将研究设计的逻辑,分享给不熟悉后者的同行,让研究设计的逻辑原理,成为所有学者的共享资产,相信这才符合《设计》撰写的初衷。
以下即本文作者就《设计》的菁华,通过日常语言所进行的条理与阐述。
二、《设计》:
连接“理想”与“现实”的桥梁
首先,根据一般定量研究的准则,好的社科研究必须满足“无偏性(Unbiasedness)”与“有效性(Efficiency)”两大标准。
但是受研究素材限制,定性研究往往不能满足上述标准。
而《设计》撰写的目的,便在帮助突破这些限制。
进一步问,定量研究为何强调上述标准?
这与社科研究的目的———从有限资料中推估实际情况———有关。
首先,“无偏性”意味推断无误,即所推估的因果效应逼近实际的因果效应。
若以射箭为例(如图1所示),淡色小圈代表目标区域,下图(a)射法就能满足无偏性的要求,也就是所射出的箭(估计值)都落于目标区域中(实际值)。
换言之,“无偏的估计”不会出现方向性的错误,或称“系统偏误(SystemicError)”,若出现,则如下图(b)射法所示,这就不算“无偏”。
另方面,“有效性”意味着推估的结果更准确,或者说在不存在方向性错误的前提下,推估得更集中,更快、更容易摸清实际情况。
这里再以射箭为例(如图2所示),其中(a)射法只能藉多次尝试(落点比较散漫),才能捕捉到所找的目标,相较而言,(b)射法就能快速、高效的捕捉到目标,(b)射法因此更有效。
①
为满足两项标准,定量研究的传统做法是结合:
①随机抽样与②大数样本,对自变量与因变量随机赋值,从而成功避免“有偏”,并得以有效“收敛”。
反观定性研究,因为研究素材限制,无从“随机抽样”与“大数样本”,因此无法保证无偏,更难做到有效。
有鉴于此,《设计》提炼定量研究的经验,转化为定性设计的建议,藉此超越传统定性的局限。
因此,本书的论述形式通常为:
①理想上该怎么去做研究(像定量那样)?
②现实中为何没法那么做(像定性这样)?
③倘若如此要怎样办才最好?
(研究设计上的实用建议)。
从这个角度看,本书可以视为连接“理想”与“现实”的桥梁。
多数的社科领域,特别如政治学、社会学、公共管理等,既难随机抽样,也少大数样本,普遍存在三类问题:
①模型设定(ModelSpecification):
缺乏大数样本,很难周全控制,有效厘清因果;②案例选取:
无法随机抽样,很难保证代表,无法确认无偏(SelectionBias);和③概念测量:
少用标准用语,度量难以维持一致,度量偏误普遍(MeasurementErrors)。
面对这些不足,《设计》提出了透彻的分析与实用的建议,本文也将根据上述次序,条理并阐释书中各项建议,作为读者研究设计时的参考。
三、研究模型如何设定?
或因果关系怎么厘清?
研究者若想在“模型设定”问题上兼顾“无偏性”与“有效性”,那得经过好一番利弊权衡(Trade-off)。
因为“无偏性”指向滴水不漏的控制,最好纳入所有可能的干扰变量,否则存在估计偏误的风险;“有效性”则指向极度精简的控制,只纳入必须控制的干扰变量,否则需要数量过大的案例,造成时间、精力上的浪费。
那么,如何才能“既求准确,又要效率”的设定检测模型?
本文根据《设计》的建议,将是否必须控制(即纳入模型检测)的变量条理为五类(如下表1),分别加以说明。
(一)必须纳入控制的干扰变量
这类变量是表1中的类型4的变量,可称为“干扰变量(ConfoundingVariable)”。
其特点是:
①与因变量一定程度的相关(可能影响因变量)①;②与自变量一定程度的相关(可能混淆自变量);③它先于或同时于自变量存在,即其对因变量的影响乃独立于自变量所发生。
那么,“干扰变量”为何必须控制?
因为它与自变量都会影响因变量,若不将其纳入控制(独立估计其所产生影响),其影响会与自变量的影响混淆,让人对后者做出有偏的估计。
因此,《设计》建议:
研究者应尽可能地找出“干扰变量”,并将其纳入控制,若不易纳入控制(如难以度量、缺乏数据),也必须指出推论因此所可能偏误的方向。
(二)不可纳入控制的中介变量
并非所有“既与因变量又与自变量相关”的变量都得纳入控制。
根据《设计》的提示,如果某变量(表1中类型5的变量)后于自变量出现,又与自变量相关,显示它极可能受自变量所影响,那么这个变量极可能是“自变量影响因变量”过程中的“中介变量(IntermediateVariable)”,因此不宜纳入模型控制。
因为一旦将其纳入控制,自变量通过中介变量对因变量产生的影响将被独立出去,而非归到自变量的名下。
如此一来,模型对于“自变量影响因变量大小”的估计将被削弱,造成了估计上的偏误。
(三)不必也尽量别控制的无关变量
表1中其余的类型2、类型3和类型1三种变量,只与自变量或因变量其一相关或都未相关。
就模型控制而言,他们都属于“无关变量”,剔除在模型之外,并不会造成因果效应的偏误估计,因此既不必也尽量别纳入控制,否则将削弱估计的“有效性”。
因为模型若纳入无关变量,将需要更多的案例运作模型检测。
此类模型之“无关”,可以类型3变量为例:
虽然它可能影响因变量,但却与自变量无关。
因此,是否纳入控制,并不影响“自变量影响因变量大小”的估计。
其“无效”可以类型2变量说明:
一旦将其纳入控制,自变量与其共变部分就被设为固定,因在检测模型过程中,只有涉及“变量如何变化”的信息才能提供估计的线索,所以此时自变量上能被观察到的变化就会减弱,检测模型的有效性自然将随之降低。
综合上述,有关因果厘清问题,虽然讨论时运用了模型、估计之类概念,看似指涉定量研究,但在定性研究中,早就存在“将某变量特别挑出,其他设为相同,孤立考察影响”的做法。
换言之,若从“施加控制、厘清因果”角度看,定量与定性的逻辑其实并无二致。
四、研究案例如何选取?
或不能随机抽样怎么办?
论及案例选择,定量研究的理想是“随机抽样(RandomSampling)”,它必须从一个不漏的总体中、绝无拘束的条件下,随机抽取相当数量的案例。
因此随机抽样并不容易。
首先,作为可推论范围的“总体”往往是理论概括,未必都能纳为研究对象。
其次,抽样过程可能存在限制,某些案例也许不易抽中。
最后,抽取样本经常数量有限,未能有效控制推论精度。
总而言之,现实的选样过程,不论有意无意,多少都涉及“案例选取”,但如何避免因此导致“选择偏误”?
对此,《设计》提出几项重要的建议,通过研究设计来提升选样的质量。
(一)根据结果/因变量选取案例:
警惕“成功范例选样”
《设计》特别强调,切不可根据结果/因变量(大小/类别等特性)选择研究的案例。
该书对此为何特别重视?
一方面,那些“研究最成功的企业,来获致企业成功的规律”可说比比皆是。
但根据结果/因变量来选择对象,往往得到的是组“删截过的案例集(TruncatedSample)”(就结果筛选过的案例),被删截掉的案例,既无法充分支持研究假说,尤其无法作为反例来推翻研究假说,这样一来,偏误估计的风险就产生了。
例如芭芭拉·格迪斯(2012)所举的例子。
据其所言,凡研究发展中国家“劳工政策”与“经济增长”的学者,都特别关注那几个最成功的国家和地区,如墨西哥、巴西、韩国、新加坡、中国台湾、中国香港等,并根据研究上述案例,主张:
压制劳工有利经济增长。
如图3(a)所示,在那些特别成功范例中,“劳工镇压”与“产值增长”间存在显著的正相关。
但此时我们必须了解,上述关系只存在于少数“成功范例”之中。
如果我们的视野里不只那几个案例,将同一时期所有发展中国家都纳入考察,肯定会惊讶地发现,如图3(b)中近似水平的回归线所示,“劳工镇压”与“产值增长”间绝无显著的相关关系。
这其中的问题便出在:
右上角的区块b所显现的趋势,不见得也都出现在a、c、d等“全部经验范畴”的其他区块中,“成功范例选样”让我们只考察区域b,因此遗漏了a、c、d中存在的反例,结果导致推论的偏误。
(二)根据原因/自变量选取案例:
推荐“最大差异选样”
根据《设计》的提示,研究者虽不应根据结果/因变量来选择研究的案例,却大可根据原因/自变量来选择研究案例。
根据本文作者的看法,这其实就是经常运用于定性研究的“最大差异选样(MaximumVariationSampling)”(耿曙、陈玮,2013)。
此话怎讲?
首先,《设计》从方法论上证明,根据自变量选择案例并不会造成推论偏误。
既然如此,我们怎么选择案例,才是最聪明、最有效的呢?
答案是挑选那些“在自变量上差异最大”的案例。
例如我们希望考察“婚前家庭背景的差异”(是否门当户对)对于“婚后家庭冲突多寡”的影响,最好能选择一些“家庭背景差异”特别大的,加上一些“家庭背景差异”特别小的,分头检验假说是否成立。
通过此类“最大差异选样”,我们可以减少案例数量的要求,提升案例选择的效率。
“最大差异选样”的原理在于扩大案例的变异、尽量穷尽各种自变量可能出现的情况与,再用以验证假说成立与否。
在具体实践上,操作选样的前提往往是就自变量所做的案例“分类”———分类时应该做到类别间差异最大,类别之内差异最小———之后在每类中只需任意选择少量案例,便可达到最有效检验研究假说的目的。
藉此展开的“最大差异选样”,是否感觉有几分似曾相识?
是的,它的逻辑其实十分近似抽样方法中的“分层抽样(StratifiedSampling)”设计(耿曙、陈玮,2013)。
(三)增加案例数目的两种策略:
旁扩与下沉
即便掌握案例选取的技巧,也总得要有案例在手,才能从中挑拣与研究。
那么,怎么才能掌握足够案例呢?
《设计》建议的策略之一,始于提升概念层次,藉此纳入更多案例。
例如研究者本想考察“[税收部门]如何利用薪酬激励提升稽征努力”,却苦于符合要求的案例不多,不能满足选样与设计(如“可比案例”设计)的要求。
此时便可通过“概念层次的提升”,将研究对象调整为“[公共部门]如何利用物质激励提升工作努力”,如此一来,中外古今,可供研究的案例比比皆是。
此乃案例增生的策略之一。
但因此增纳的案例,如公共部门中的学校、军队乃至国企,其背景、情况、特性各不相同,必须分别进行了解与掌握,因此不免耗时耗力。
为了避免研究负担太重,第二种策略———下降研究层次———似乎更为理想。
例如,对本想考察“财政分权能否促进经济增长”的研究者而言,开始会设想以“国家”为研究单位,但这既涉及联邦制与单一制的不同,又牵扯已开发与开发中之别,加上欧洲、东亚各有历史文化渊源,论证起来耗时耗力。
以中国为例,但若将研究下降至次国家的省级层次,考察各省“财政分权能否促进经济增长”,如此一来,案例立增30余倍。
这些案例又处于同样的政经体制、文化背景之下,毋需额外加以了解与掌握,节省大量时间精力。
此即案例增生的策略之二。
综合上述,定性研究成败与精彩与否的关键,往往就在案例选择。
《设计》告诉我们什么是常犯的错误、什么又是推荐的做法,以及又怎么增加备选案例,从而相对轻松的检证理论论证。
五、测量偏误如何对付?
或倘有疑虑如何是好?
研究设计若想达到“无偏”与“有效”两项标准,当然不能出现明显的测量偏误。
这是理想,实际却经常事与愿违:
有时因为概念本身,有时肇因测量手段,测量偏误在所难免,尤其是不讲究“标准化”的定性研究,问题更常见。
倘若如此,研究的结论还会可靠吗?
《设计》告诉我们,测量偏误也分好几种,有的偏误不会造成问题,有问题的偏误也轻重有别。
因此,针对不同类型的测量偏误,《设计》提出了不同的建议。
(一)测量偏误的来源:
“有偏”与“不准”
要想分辨测量偏误类型,必须问其从何而来。
从来源看,测量偏误大概可以分成两类,一类是“测量有偏”,或称“系统性偏误(SystematicErrors)”,一类是“测量失准”,又叫“非系统性偏误(UnsystematicErrors)”。
前者与“效度(Validity)”有关,是方向上出问题,测量偏误的结果、概念会以被扭曲方式呈现出来(或说:
以特定的方式偏离真实的值)。
后者则与“信度(Reliability)”有关,是准确性不足的问题。
如图4(a)所示,如果箭的落点集中箭靶的特定区域,这其中极可能存在“系统性偏误”。
反之,如果存在“非系统性偏误”时,箭的落点经常或高或低,以随机的方式偏离真实的值,如图4(b)中所示。
这两种不同类型的偏误,若出现在不同的变量上,造成的后果往往非常不同,研究者应对的方式当然也不同。
(二)测量偏误的类型与对策
1.可以修补的测量偏误:
因变量出现非系统偏误
此时,因变量不易准确测量,从而弱化因果估计的有效性,但不会造成因果推论的偏误。
这是因为“非系统偏误”与自变量无关,所以对因变量变化,自变量能够提供信息的部分(即两者共变的部分)就变少了,通过自变量进行估计的精确度也就弱化了。
但这是可以修补的,只要增加案例的数目,就能补进有用的信息,自可提高估计的准确度。
2.无法修补的测量偏误:
自变量出现非系统偏误
此时,自变量无法准确测量,除了因果估计不够有效外,还将造成因果推论的偏误,这是让研究者非常无奈的状况。
这种偏误是怎么产生的?
原来,当自变量存在“非系统偏误”时,自变量的变异将会增大,但因变量的变异却维持不变。
由于我们对因果关系的考察,主要建立在自变量与因变量的共变上,如此一来,我们就误将自变量中因为测量造成的变化与因变量的一部分变化联系起来,而实际上,它们之间毫不相关,这就造成了估计的偏误。
对此,《设计》作者认为,虽然研究结果无法修补,却可报告可能的偏误方向。
一般而言,当“自变量存在非系统偏误”时,估计得到的因果效应会较实际为弱,①因此我们有时还可利用“较不可能成立却依然成立”的逻辑(Eckstein,1975)帮助强化我们的论证。
3.无需修补的测量偏误:
因变量或自变量所有观察案例均出现系统偏误
不论是自变量还是因变量,当“所有的”观察案例都出现“系统偏误”时,②研究者可以偷偷庆祝一下,因为这类偏误既不会造成推论的偏误,也不会降低推论的有效性,所以完全无需修补。
③其原理是当所有案例的取值都固定高(或低)于真实值时,两个观察值间的差距其实不曾改变,由此推断的因果效应自然不变。
同时,由于变量分布的集中(与离散)程度也未变,因此估计的有效性也不会改变。
我们可以将上述几种“测量偏误”整理如下表2,方便读者参考。
综合上述,有关概念考察问题,虽然讨论时运用了测量、误差之类概念,定性研究也许说:
“我们不做测量的,测量就是定量研究。
”话虽如此,但定性研究也涉及案例的经验考察,也存在案例—概念间的距离,也会让人疑虑考察得准不准、偏不偏之类问题,自然可以适用上述“测量误差”的讨论框架。
问题产生既然类似,分析、应对又怎会有什么根本区别?
六、小结
根据《设计》一书的看法,研究设计的目的在于准确、可靠地找出现象发生的原因,由此需要满足两大标准———“无偏性”与“有效性”。
但在定性研究中,由于样本有限、难以随机抽样,上述标准往往难以企及。
有鉴于此,《设计》乃从模型设定、案例选取和概念测量等几个方面,指出无法满足标准的原因,同时提出了直接、有效的改进办法。
本文撰写的目的,在运用日常语言,条理并阐述《设计》提示的建议,一则有助不熟悉数理表述的读者,也能掌握、运用本书建议,再则也盼藉此说明,研究设计的道理,也能通过日常语言加以理解与传述。
再进一步申论,我们又不难发现,《设计》所处理的各种问题,并不只困扰定性研究,定量研究也同样必须面对。
因为根据本文作者所见:
首先,无论实验、统计或比较方法,因果验证的关键在“控制”,控制(或模型设定)的过程中,自然不免在“无偏”和“有效”间进行权衡。
其次,案例多寡虽有不同,但即便大样本的定量研究,也未必能每每做到“随机抽样”。
因此,案例选取与案例增生的策略,定量同样不可或缺。
最后,定量调查的测量偏误,也许比定性研究更加严重,前者的度量既单层面又标准化,加上须事先设定,不能在研究中调整,测量误差问题也必须得有所准备。
也因此,虽然《设计》意在为定性研究提出设计的准则与建议,这些准则与建议也同样适用于定量研究。
从这一角度讲,《设计》是所有社科研究者的指南,是我们的共同资产。
参考文献
高奇琦编(2015).比较政治学的质性与量化之争.北京:
中央编译出版社.
耿曙、陈玮(2013).比较政治的案例研究:
反思几项方法论上的迷思.社会科学,5:
20-29.
芭芭拉·格迪斯(2012).范式与沙堡:
比较政治中的理论构建和研究设计.陈子恪、刘骥等译.重庆:
重庆大学出版社.(Geddes,B.(2003).ParadigmsandSandCastles:
TheoryBuildingandResearchDesigninComparativePolitics.AnnArbor:
UniversityofMichiganPress.)
加里·金、罗伯特·基欧汉、悉尼·维巴(2014).社会科学中的研究设计.陈硕译.上海:
格致出版社/上海人民出版社.(King,G.,Keohane,R.O.&VerbaS.(1994).DesigningSocialInquiry:
ScientificInferenceinQualitativeResearch.Princeton:
PrincetonUniversityPress.)
杰弗里·M伍德里奇(2010).计量经济学导论.费剑平译.北京:
中国人民大学出版社.
(Wooldridge,JM(2003).IntroductoryEconometrics:
AModernApproach.Cincinnati.OH:
South-WesternCollege.)
麦克洛斯基等著(2000).社会科学的措辞.许宝强等译.北京:
三联书店.(Nelson,J.,MegillA.&McCloskeyD.Eds.(1990).RhetoricoftheHumanSciences.Madison:
UniversityofWisconsinPress.)
Boulding,K.E.(1948).SamuelsonsFoundations:
TheRoleofMathematicsinEconomics.JournalofPoliticalEconomy,56(3):
187-199.
Brandy,H.E.&Collier,D.Eds.(2010).RethinkingSocialInquiry:
DiverseTools,SharedStandards.Lanham,MD:
RowmanandLittlefield.
Caporaso,J.A.(1995).ResearchDesign,Falsification,andtheQualitative-QuantitativeDivideDesigningSocialInquiry:
ScientificInferencein
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会科学中的研究设计方案 白话 社会科学 中的 研究 设计方案 日常 思考 语言 逻辑